Spark分析Log文件的方式

extend 2017-09-27 11:10:34
Spark分析Log日志文件时,加载到HDFS中和加载本地文件两种方式,有什么区别?
是加载到HDFS里进行分析速度快吗?但是加载HDFS的速度很慢。
...全文
546 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
LinkSe7en 2018-12-28
  • 打赏
  • 举报
回复
从hdfs加载,是为了利用block,从而分区并行计算。或者通过更优的文件格式加速数据加载
lihuan1124 2018-12-27
  • 打赏
  • 举报
回复
加载到hdfs会比加载本地文件速度要慢,因为要走网络。hdfs针对大数据文件进行存储
extend 2017-12-04
  • 打赏
  • 举报
回复
顶一下,来就给分。。。

1,258

社区成员

发帖
与我相关
我的任务
社区描述
Spark由Scala写成,是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于MapReduce算法实现的分布式计算。
社区管理员
  • Spark
  • shiter
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧