最新消息:深度思考

标签:spark

spark与hadoop的分布式文件缓存
hadoop

spark与hadoop的分布式文件缓存

liuxuecheng 3年前 (2017-06-14) 2983浏览 0评论

版权申明:转载请注明出处。 文章来源:大数据随笔 1.简介 分布式计算框架中,各种配置文件、jar包、数据文件等都是通过分布式文件缓存进行下发的。这种方式将作业所需的资源文件下发到执行作业的各个节点上,作业执行过程中文件不再改动。 关于h...

spark数据监控实战
spark

spark数据监控实战

liuxuecheng 3年前 (2017-03-13) 2232浏览 0评论

版权申明:转载请注明出处。 文章来源:大数据随笔 1.概述 数据准确性,稳定性,时效性是数据开发中需要重点关注的,一般称之为数据质量。保证数据质量往往会占用数据开发工程师的很多精力,所以一个好的数据监控系统或者一个合理的数据监控方案对于数...