大数据数据存入hdfs后如何进行数据分析？

光滑的秃头 2018-06-15 02:57:31

新人才接触大数据，求解

现在把数据存入到了hadoop 的hdfs上面并关联到hive 当中的表。请问接下来进行数据分析该怎么做呢？
例如：要分析每年每月每天的每个产品的销售情况
是采用hql 语句读取需要分析的数据出来进行分析嘛？还是怎么做呢？

...全文

1333 3 打赏收藏转发到动态举报

写回复

用AI写文章

3 条回复

切换为时间正序

请发表友善的回复…

发表回复

zengjc 2018-08-10

打赏
举报

一般情况下，如果是类似“分析每年每月每天的每个产品的销售情况”等简单统计分析，直接使用hive的HQL就可以了，类似于sql，比较容易上手。
或者也可以使用impala来编写SQL进行分析，速度比hive快，也能直接读取你已经建好的hive外部表。
大数据平台下的分析，使用自己熟悉的开发方式就行，这样易上手，速度也不慢；等有了更多的性能、功能要求，再选择更合适的开发方式，比如spark、写MR等；