利用Yarn做大数据导入Hbase速度慢的问题。

随遇_羽翔 2016-02-18 08:20:13

最近在做大表数据从Oracle导入到HBase的工作，但是遇到一些问题想和各位咨询交流一下。
具体的场景是这样的，目前有一张8千万数据的表，已经把这张表的数据导出为69G多的csv文件。利用hadoop中mapreduce的mapper功能导入到Hbase中。Hadoop的版本是2.5.2，Hbase的版本是1.1.2，把目标表预先拆分为100个分区。
当时现场的环境大概是3台8G4核的台式机搭建的小环境做试验。在yarn中观察发现数据进度从10%开始就变得异常缓慢，通过分析日志发现Yarn中变慢的进程都在报类似如下的错误。初步分析可能是哪里堵塞造成的。

2016-02-18 12:59:57,937 INFO [htable-pool1-t5] org.apache.hadoop.hbase.client.AsyncProcess: #2, table=sb_spxx_rk, attempt=16/35 failed=148ops, last exception: null on hadoop1,16020,1455766013395, tracking started null, retrying after=20157ms, replay=148ops
2016-02-18 13:00:17,180 INFO [htable-pool1-t8] org.apache.hadoop.hbase.client.AsyncProcess: #2, table=sb_spxx_rk, attempt=17/35 failed=141ops, last exception: null on hadoop1,16020,1455766013395, tracking started null, retrying after=20133ms, replay=141ops
2016-02-18 13:00:18,397 INFO [htable-pool1-t5] org.apache.hadoop.hbase.client.AsyncProcess: #2, table=sb_spxx_rk, attempt=17/35 failed=148ops, last exception: null on hadoop1,16020,1455766013395, tracking started null, retrying after=20169ms, replay=148ops
2016-02-18 13:00:37,420 INFO [htable-pool1-t8] org.apache.hadoop.hbase.client.AsyncProcess: #2, table=sb_spxx_rk, attempt=18/35 succeeded on hadoop1,16020,1455766013395, tracking started Thu Feb 18 12:57:42 CST 2016
2016-02-18 13:00:38,773 INFO [htable-pool1-t5] org.apache.hadoop.hbase.client.AsyncProcess: #2, table=sb_spxx_rk, attempt=18/35 succeeded on hadoop1,16020,1455766013395, tracking started Thu Feb 18 12:57:42 CST 2016
2016-02-18 13:01:07,053 INFO [htable-pool1-t5] org.apache.hadoop.hbase.client.AsyncProcess: #2, table=sb_spxx_rk, attempt=10/35 failed=19ops, last exception: null on hadoop4,16020,1455766014721, tracking started null, retrying after=10045ms, replay=19ops

在网上搜查了半天结果还是没有找到比较好的结果。不知道各位看到类似的情况，能不能帮助我分析一下或者提供给我一些参考意见看是什么原因造成的？

...全文

1144 3 打赏收藏转发到动态举报

写回复

3 条回复

切换为时间正序

请发表友善的回复…

发表回复

FeelTouch Labs 2016-07-30

打赏
举报

回复

楼主贴出关键代码或者你认为可能出问题的代码；另外，不分区、截取一小部分数据分别单独测试，很快就可以定位问题了；之后回过头来再分析原因；另外，你看到的10%，不一定就是进行了10%，实际上可能没有

blueicy1986 2016-07-22

打赏
举报

回复

我也遇到了同样的问题，请问楼主是如何解决的？

pww71 2016-02-19

打赏
举报

回复

以下代码应该没问题，可以帮你。 http://blog.csdn.net/pww71/article/details/25113303

完整全套资源下载地址：https://download.csdn.net/download/qq_27595745/65977804 【完整课程列表】 大数据与云计算教程课件优质大数据课程 01.Hadoop简介与安装入门（共29页）.pptx 大数据与云计算教程课件优质大数据课程 02.MapReduce（共23页）.pptx 大数据与云计算教程课件优质大数据课程 03.Hadoop YARN（共25页）.pptx 大数据与云计算教程课件优质大数据课程 04.MapReduce Eclipse开发插件（共20页）.pptx 大数据与云计算教程课件优质大数据课程 05.Hadoop入门数据分析实战（共57页）.pptx 大数据与云计算教程课件优质大数据课程 06.HDFS（共38页）.pptx 大数据与云计算教程课件优质大数据课程 07.HDFS Shell命令（共21页）.pptx 大数据与云计算教程课件优质大数据课程 08.HDFS文件接口（共41页）.pptx 大数据与云计算教程课件优质大数据课程 09.MapReduce序列化（共29页）.pptx 大数据与云计算教程课件优质大数据课程 10.MapReduce MP过程进阶（共42页）.pptx 大数据与云计算教程课件优质大数据课程 11.MapReduce IO操作（共61页）.pptx 大数据与云计算教程课件优质大数据课程 12.序列化框架（共28页）.pptx 大数据与云计算教程课件优质大数据课程 13.深入MapReduce应用开发（共21页）.pptx 大数据与云计算教程课件优质大数据课程 14.Hadoop集群配置（共6页）.pptx 大数据与云计算教程课件优质大数据课程 15.Hive（共46页）.pptx 大数据与云计算教程课件优质大数据课程 16.Hive操作（共43页）.pptx 大数据与云计算教程课件优质大数据课程 17.Hive查询（共32页）.pptx 大数据与云计算教程课件优质大数据课程 18.HBase（共43页）.pptx 大数据与云计算教程课件优质大数据课程 19.Pig（共33页）.pptx 大数据与云计算教程课件优质大数据课程 20.Pig Latin（共36页）.pptx 大数据与云计算教程课件优质大数据课程 21.Pig模式与函数（共64页）.pptx 大数据与云计算教程课件优质大数据课程 22.Zookeeper（共28页）.pptx 大数据与云计算教程课件优质大数据课程 23.Zookeeper服务（共47页）.pptx 大数据与云计算教程课件优质大数据课程 24.使用Zookeeper构建应用（共34页）.pptx 大数据与云计算教程课件优质大数据课程 25.Sqoop（共19页）.pptx 大数据与云计算教程课件优质大数据课程 26.深入Sqoop的导入（共29页）.pptx 大数据与云计算教程课件优质大数据课程 27.深入Sqoop导出（共19页）.pptx 大数据与云计算教程课件优质大数据课程 28.Flume（共33页）.pptx 大数据与云计算教程课件优质大数据课程 29.Kafka（共30页）.pptx 大数据与云计算教程课件优质大数据课程 30.Kafka开发（共34页）.pptx 大数据与云计算教程课件优质大数据课程 31.Strom（共14页）.pptx 大数据与云计算教程课件优质大数据课程 32.Spark入门之Scala（共173页）.pptx 大数据与云计算教程课件优质大数据课程 33.Spark入门（共40页）.pptx 大数据与云计算教程课件优质大数据课程 34.SparkSQL（共15页）.pptx 大数据与云计算教程课件优质大数据课程 35.Oozie（共41页）.pptx 大数据与云计算教程课件优质大数据课程 36.Impala（共20页）.pptx 大数据与云计算教程课件优质大数据课程 37.Solr（共38页）.pptx 大数据与云计算教程课件优质大数据课程 38.Lily（共23页）.pptx 大数据与云计算教程课件优质大数据课程 39.Titan（共20页）.pptx 大数据与云计算教程课件优质大数据课程 40.Neo4j（共50页）.pptx 大数据与云计算教程课件优质大数据课程 41.Elasticsearch（共17页）.pptx

完整全套资源下载地址：https://download.csdn.net/download/qq_27595745/65977804 【完整课程列表】 大数据与云计算教程课件优质大数据课程 01.Hadoop简介与安装入门（共29页）.pptx 大数据与云计算教程课件优质大数据课程 02.MapReduce（共23页）.pptx 大数据与云计算教程课件优质大数据课程 03.Hadoop YARN（共25页）.pptx 大数据与云计算教程课件优质大数据课程 04.MapReduce Eclipse开发插件（共20页）.pptx 大数据与云计算教程课件优质大数据课程 05.Hadoop入门数据分析实战（共57页）.pptx 大数据与云计算教程课件优质大数据课程 06.HDFS（共38页）.pptx 大数据与云计算教程课件优质大数据课程 07.HDFS Shell命令（共21页）.pptx 大数据与云计算教程课件优质大数据课程 08.HDFS文件接口（共41页）.pptx 大数据与云计算教程课件优质大数据课程 09.MapReduce序列化（共29页）.pptx 大数据与云计算教程课件优质大数据课程 10.MapReduce MP过程进阶（共42页）.pptx 大数据与云计算教程课件优质大数据课程 11.MapReduce IO操作（共61页）.pptx 大数据与云计算教程课件优质大数据课程 12.序列化框架（共28页）.pptx 大数据与云计算教程课件优质大数据课程 13.深入MapReduce应用开发（共21页）.pptx 大数据与云计算教程课件优质大数据课程 14.Hadoop集群配置（共6页）.pptx 大数据与云计算教程课件优质大数据课程 15.Hive（共46页）.pptx 大数据与云计算教程课件优质大数据课程 16.Hive操作（共43页）.pptx 大数据与云计算教程课件优质大数据课程 17.Hive查询（共32页）.pptx 大数据与云计算教程课件优质大数据课程 18.HBase（共43页）.pptx 大数据与云计算教程课件优质大数据课程 19.Pig（共33页）.pptx 大数据与云计算教程课件优质大数据课程 20.Pig Latin（共36页）.pptx 大数据与云计算教程课件优质大数据课程 21.Pig模式与函数（共64页）.pptx 大数据与云计算教程课件优质大数据课程 22.Zookeeper（共28页）.pptx 大数据与云计算教程课件优质大数据课程 23.Zookeeper服务（共47页）.pptx 大数据与云计算教程课件优质大数据课程 24.使用Zookeeper构建应用（共34页）.pptx 大数据与云计算教程课件优质大数据课程 25.Sqoop（共19页）.pptx 大数据与云计算教程课件优质大数据课程 26.深入Sqoop的导入（共29页）.pptx 大数据与云计算教程课件优质大数据课程 27.深入Sqoop导出（共19页）.pptx 大数据与云计算教程课件优质大数据课程 28.Flume（共33页）.pptx 大数据与云计算教程课件优质大数据课程 29.Kafka（共30页）.pptx 大数据与云计算教程课件优质大数据课程 30.Kafka开发（共34页）.pptx 大数据与云计算教程课件优质大数据课程 31.Strom（共14页）.pptx 大数据与云计算教程课件优质大数据课程 32.Spark入门之Scala（共173页）.pptx 大数据与云计算教程课件优质大数据课程 33.Spark入门（共40页）.pptx 大数据与云计算教程课件优质大数据课程 34.SparkSQL（共15页）.pptx 大数据与云计算教程课件优质大数据课程 35.Oozie（共41页）.pptx 大数据与云计算教程课件优质大数据课程 36.Impala（共20页）.pptx 大数据与云计算教程课件优质大数据课程 37.Solr（共38页）.pptx 大数据与云计算教程课件优质大数据课程 38.Lily（共23页）.pptx 大数据与云计算教程课件优质大数据课程 39.Titan（共20页）.pptx 大数据与云计算教程课件优质大数据课程 40.Neo4j（共50页）.pptx 大数据与云计算教程课件优质大数据课程 41.Elasticsearch（共17页）.pptx

完整全套资源下载地址：https://download.csdn.net/download/qq_27595745/65977804 【完整课程列表】 大数据与云计算教程课件优质大数据课程 01.Hadoop简介与安装入门（共29页）.pptx 大数据与云计算教程课件优质大数据课程 02.MapReduce（共23页）.pptx 大数据与云计算教程课件优质大数据课程 03.Hadoop YARN（共25页）.pptx 大数据与云计算教程课件优质大数据课程 04.MapReduce Eclipse开发插件（共20页）.pptx 大数据与云计算教程课件优质大数据课程 05.Hadoop入门数据分析实战（共57页）.pptx 大数据与云计算教程课件优质大数据课程 06.HDFS（共38页）.pptx 大数据与云计算教程课件优质大数据课程 07.HDFS Shell命令（共21页）.pptx 大数据与云计算教程课件优质大数据课程 08.HDFS文件接口（共41页）.pptx 大数据与云计算教程课件优质大数据课程 09.MapReduce序列化（共29页）.pptx 大数据与云计算教程课件优质大数据课程 10.MapReduce MP过程进阶（共42页）.pptx 大数据与云计算教程课件优质大数据课程 11.MapReduce IO操作（共61页）.pptx 大数据与云计算教程课件优质大数据课程 12.序列化框架（共28页）.pptx 大数据与云计算教程课件优质大数据课程 13.深入MapReduce应用开发（共21页）.pptx 大数据与云计算教程课件优质大数据课程 14.Hadoop集群配置（共6页）.pptx 大数据与云计算教程课件优质大数据课程 15.Hive（共46页）.pptx 大数据与云计算教程课件优质大数据课程 16.Hive操作（共43页）.pptx 大数据与云计算教程课件优质大数据课程 17.Hive查询（共32页）.pptx 大数据与云计算教程课件优质大数据课程 18.HBase（共43页）.pptx 大数据与云计算教程课件优质大数据课程 19.Pig（共33页）.pptx 大数据与云计算教程课件优质大数据课程 20.Pig Latin（共36页）.pptx 大数据与云计算教程课件优质大数据课程 21.Pig模式与函数（共64页）.pptx 大数据与云计算教程课件优质大数据课程 22.Zookeeper（共28页）.pptx 大数据与云计算教程课件优质大数据课程 23.Zookeeper服务（共47页）.pptx 大数据与云计算教程课件优质大数据课程 24.使用Zookeeper构建应用（共34页）.pptx 大数据与云计算教程课件优质大数据课程 25.Sqoop（共19页）.pptx 大数据与云计算教程课件优质大数据课程 26.深入Sqoop的导入（共29页）.pptx 大数据与云计算教程课件优质大数据课程 27.深入Sqoop导出（共19页）.pptx 大数据与云计算教程课件优质大数据课程 28.Flume（共33页）.pptx 大数据与云计算教程课件优质大数据课程 29.Kafka（共30页）.pptx 大数据与云计算教程课件优质大数据课程 30.Kafka开发（共34页）.pptx 大数据与云计算教程课件优质大数据课程 31.Strom（共14页）.pptx 大数据与云计算教程课件优质大数据课程 32.Spark入门之Scala（共173页）.pptx 大数据与云计算教程课件优质大数据课程 33.Spark入门（共40页）.pptx 大数据与云计算教程课件优质大数据课程 34.SparkSQL（共15页）.pptx 大数据与云计算教程课件优质大数据课程 35.Oozie（共41页）.pptx 大数据与云计算教程课件优质大数据课程 36.Impala（共20页）.pptx 大数据与云计算教程课件优质大数据课程 37.Solr（共38页）.pptx 大数据与云计算教程课件优质大数据课程 38.Lily（共23页）.pptx 大数据与云计算教程课件优质大数据课程 39.Titan（共20页）.pptx 大数据与云计算教程课件优质大数据课程 40.Neo4j（共50页）.pptx 大数据与云计算教程课件优质大数据课程 41.Elasticsearch（共17页）.pptx

完整全套资源下载地址：https://download.csdn.net/download/qq_27595745/65977804 【完整课程列表】 大数据与云计算教程课件优质大数据课程 01.Hadoop简介与安装入门（共29页）.pptx 大数据与云计算教程课件优质大数据课程 02.MapReduce（共23页）.pptx 大数据与云计算教程课件优质大数据课程 03.Hadoop YARN（共25页）.pptx 大数据与云计算教程课件优质大数据课程 04.MapReduce Eclipse开发插件（共20页）.pptx 大数据与云计算教程课件优质大数据课程 05.Hadoop入门数据分析实战（共57页）.pptx 大数据与云计算教程课件优质大数据课程 06.HDFS（共38页）.pptx 大数据与云计算教程课件优质大数据课程 07.HDFS Shell命令（共21页）.pptx 大数据与云计算教程课件优质大数据课程 08.HDFS文件接口（共41页）.pptx 大数据与云计算教程课件优质大数据课程 09.MapReduce序列化（共29页）.pptx 大数据与云计算教程课件优质大数据课程 10.MapReduce MP过程进阶（共42页）.pptx 大数据与云计算教程课件优质大数据课程 11.MapReduce IO操作（共61页）.pptx 大数据与云计算教程课件优质大数据课程 12.序列化框架（共28页）.pptx 大数据与云计算教程课件优质大数据课程 13.深入MapReduce应用开发（共21页）.pptx 大数据与云计算教程课件优质大数据课程 14.Hadoop集群配置（共6页）.pptx 大数据与云计算教程课件优质大数据课程 15.Hive（共46页）.pptx 大数据与云计算教程课件优质大数据课程 16.Hive操作（共43页）.pptx 大数据与云计算教程课件优质大数据课程 17.Hive查询（共32页）.pptx 大数据与云计算教程课件优质大数据课程 18.HBase（共43页）.pptx 大数据与云计算教程课件优质大数据课程 19.Pig（共33页）.pptx 大数据与云计算教程课件优质大数据课程 20.Pig Latin（共36页）.pptx 大数据与云计算教程课件优质大数据课程 21.Pig模式与函数（共64页）.pptx 大数据与云计算教程课件优质大数据课程 22.Zookeeper（共28页）.pptx 大数据与云计算教程课件优质大数据课程 23.Zookeeper服务（共47页）.pptx 大数据与云计算教程课件优质大数据课程 24.使用Zookeeper构建应用（共34页）.pptx 大数据与云计算教程课件优质大数据课程 25.Sqoop（共19页）.pptx 大数据与云计算教程课件优质大数据课程 26.深入Sqoop的导入（共29页）.pptx 大数据与云计算教程课件优质大数据课程 27.深入Sqoop导出（共19页）.pptx 大数据与云计算教程课件优质大数据课程 28.Flume（共33页）.pptx 大数据与云计算教程课件优质大数据课程 29.Kafka（共30页）.pptx 大数据与云计算教程课件优质大数据课程 30.Kafka开发（共34页）.pptx 大数据与云计算教程课件优质大数据课程 31.Strom（共14页）.pptx 大数据与云计算教程课件优质大数据课程 32.Spark入门之Scala（共173页）.pptx 大数据与云计算教程课件优质大数据课程 33.Spark入门（共40页）.pptx 大数据与云计算教程课件优质大数据课程 34.SparkSQL（共15页）.pptx 大数据与云计算教程课件优质大数据课程 35.Oozie（共41页）.pptx 大数据与云计算教程课件优质大数据课程 36.Impala（共20页）.pptx 大数据与云计算教程课件优质大数据课程 37.Solr（共38页）.pptx 大数据与云计算教程课件优质大数据课程 38.Lily（共23页）.pptx 大数据与云计算教程课件优质大数据课程 39.Titan（共20页）.pptx 大数据与云计算教程课件优质大数据课程 40.Neo4j（共50页）.pptx 大数据与云计算教程课件优质大数据课程 41.Elasticsearch（共17页）.pptx

完整全套资源下载地址：https://download.csdn.net/download/qq_27595745/65977804 【完整课程列表】 大数据与云计算教程课件优质大数据课程 01.Hadoop简介与安装入门（共29页）.pptx 大数据与云计算教程课件优质大数据课程 02.MapReduce（共23页）.pptx 大数据与云计算教程课件优质大数据课程 03.Hadoop YARN（共25页）.pptx 大数据与云计算教程课件优质大数据课程 04.MapReduce Eclipse开发插件（共20页）.pptx 大数据与云计算教程课件优质大数据课程 05.Hadoop入门数据分析实战（共57页）.pptx 大数据与云计算教程课件优质大数据课程 06.HDFS（共38页）.pptx 大数据与云计算教程课件优质大数据课程 07.HDFS Shell命令（共21页）.pptx 大数据与云计算教程课件优质大数据课程 08.HDFS文件接口（共41页）.pptx 大数据与云计算教程课件优质大数据课程 09.MapReduce序列化（共29页）.pptx 大数据与云计算教程课件优质大数据课程 10.MapReduce MP过程进阶（共42页）.pptx 大数据与云计算教程课件优质大数据课程 11.MapReduce IO操作（共61页）.pptx 大数据与云计算教程课件优质大数据课程 12.序列化框架（共28页）.pptx 大数据与云计算教程课件优质大数据课程 13.深入MapReduce应用开发（共21页）.pptx 大数据与云计算教程课件优质大数据课程 14.Hadoop集群配置（共6页）.pptx 大数据与云计算教程课件优质大数据课程 15.Hive（共46页）.pptx 大数据与云计算教程课件优质大数据课程 16.Hive操作（共43页）.pptx 大数据与云计算教程课件优质大数据课程 17.Hive查询（共32页）.pptx 大数据与云计算教程课件优质大数据课程 18.HBase（共43页）.pptx 大数据与云计算教程课件优质大数据课程 19.Pig（共33页）.pptx 大数据与云计算教程课件优质大数据课程 20.Pig Latin（共36页）.pptx 大数据与云计算教程课件优质大数据课程 21.Pig模式与函数（共64页）.pptx 大数据与云计算教程课件优质大数据课程 22.Zookeeper（共28页）.pptx 大数据与云计算教程课件优质大数据课程 23.Zookeeper服务（共47页）.pptx 大数据与云计算教程课件优质大数据课程 24.使用Zookeeper构建应用（共34页）.pptx 大数据与云计算教程课件优质大数据课程 25.Sqoop（共19页）.pptx 大数据与云计算教程课件优质大数据课程 26.深入Sqoop的导入（共29页）.pptx 大数据与云计算教程课件优质大数据课程 27.深入Sqoop导出（共19页）.pptx 大数据与云计算教程课件优质大数据课程 28.Flume（共33页）.pptx 大数据与云计算教程课件优质大数据课程 29.Kafka（共30页）.pptx 大数据与云计算教程课件优质大数据课程 30.Kafka开发（共34页）.pptx 大数据与云计算教程课件优质大数据课程 31.Strom（共14页）.pptx 大数据与云计算教程课件优质大数据课程 32.Spark入门之Scala（共173页）.pptx 大数据与云计算教程课件优质大数据课程 33.Spark入门（共40页）.pptx 大数据与云计算教程课件优质大数据课程 34.SparkSQL（共15页）.pptx 大数据与云计算教程课件优质大数据课程 35.Oozie（共41页）.pptx 大数据与云计算教程课件优质大数据课程 36.Impala（共20页）.pptx 大数据与云计算教程课件优质大数据课程 37.Solr（共38页）.pptx 大数据与云计算教程课件优质大数据课程 38.Lily（共23页）.pptx 大数据与云计算教程课件优质大数据课程 39.Titan（共20页）.pptx 大数据与云计算教程课件优质大数据课程 40.Neo4j（共50页）.pptx 大数据与云计算教程课件优质大数据课程 41.Elasticsearch（共17页）.pptx

Hadoop生态社区

20,810

社区成员

4,691

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章