Hive 的Map-Reduce Job执行太慢,有什么办法可以优化吗?

blackkettle 2014-06-02 11:06:51
各位论坛达人,

我在虚拟机上安装了伪分布的hadoop 2.4.0, 然后安装好了hive 0.13.0.

然后新建了一个表,只有3行数据,如下所示

[admin@localhost Desktop]$ hive
14/06/01 20:03:18 WARN conf.HiveConf: DEPRECATED: hive.metastore.ds.retry.* no longer has any effect. Use hive.hmshandler.retry.* instead

Logging initialized using configuration in file:/home/admin/apache-hive-0.13.0-bin/conf/hive-log4j.properties
hive> select * from wyp;
OK
1 wyp 25 13188888888888
2 test 30 13888888888888
3 zs 34 899314121
Time taken: 1.614 seconds, Fetched: 3 row(s)


可是一执行涉及到mapreduce的查询就慢得不行了。

hive> select count(1) from wyp;           
Total jobs = 1
Launching Job 1 out of 1
Number of reduce tasks determined at compile time: 1
In order to change the average load for a reducer (in bytes):
set hive.exec.reducers.bytes.per.reducer=<number>
In order to limit the maximum number of reducers:
set hive.exec.reducers.max=<number>
In order to set a constant number of reducers:
set mapreduce.job.reduces=<number>
Starting Job = job_1401667640093_0009, Tracking URL = http://localhost:8088/proxy/application_1401667640093_0009/
Kill Command = /home/admin/hadoop-2.4.0/bin/hadoop job -kill job_1401667640093_0009


已经等了10来分钟就没有出结果。

请问各位有什么好的建议吗?

万分感谢!
...全文
1869 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
qq_25535783 2016-05-19
  • 打赏
  • 举报
回复
楼主,我现在也碰到了这个问题,困扰我一个多星期了,请问您是怎么解决的呢?万分感谢~在线等~
blackkettle 2014-06-07
  • 打赏
  • 举报
回复
嗯,确实是有问题。 直接重新安装hadoop。
coolbamboo2008 2014-06-03
  • 打赏
  • 举报
回复
关注,感觉不可能这么慢吧,是哪里有问题吧
herofour444 2014-06-03
  • 打赏
  • 举报
回复
看看日志。正常的不会这么慢1分钟左右就能出来。 并且现在hive效率确实很低 shark/spark效率能比hive提升几倍。

20,811

社区成员

发帖
与我相关
我的任务
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
  • 分布式计算/Hadoop社区
  • 涤生大数据
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧