hadoop自带wordcount卡在map 0% reduce 0%不动

weixin_41220355 2017-11-30 08:33:28

问题如图

下面是yarn-site的配置，ubuntu虚拟机分配了4G内存，为啥就是跑不出结果

...全文

1518 17 打赏收藏转发到动态举报

写回复

用AI写文章

17 条回复

切换为时间正序

请发表友善的回复…

发表回复

SMALLl_White 2019-10-09

打赏
举报

权限不够在虚拟机上运行hadoop fs -chmod -R 777 / 加权限

五哥 2018-07-25

打赏
举报

估计是没有资源了，我这边用CDH，直接在CM上面的资源池中，可以看到具体信息

gamedev˚ 2017-12-19

打赏
举报

对方很困，并通过你给的日志信息，google之后向你抛来一个url http://blog.sina.com.cn/s/blog_40d46ec20101fkzw.html 通过这篇博客中所给的信息，升级集群机器配额。要是不行，再参考另外一篇，完整的yarn.nodemanager.vmem-pmem-ratio参数配置https://stackoverflow.com/questions/30533501/hadoop-mapper-is-failing-because-of-container-killed-by-the-applicationmaster 自学不易，多多google (逃...

weixin_41220355 2017-12-18

打赏
举报

引用 13 楼 Coder__CS 的回复:

基础程序跑不起来，说明是集群环境配置的不成功。可以从四个配置文件逐一检查，看是否有遗漏配置项 core-site.xml

<configuration>
<!-- 指定HADOOP所使用的文件系统schema（URI），HDFS的老大（NameNode）的地址 -->
	<property>
		<name>fs.defaultFS</name>
		<value>hdfs://yourHostname(主机名):9000/</value>
	</property>
	<!-- 指定hadoop运行时产生文件的存储目录 -->
	<property>
		<name>hadoop.tmp.dir</name>
		<value>$Hadoop_HOME(Hadoop安装路径)/tmp</value>
	</property>
</configuration>

mapred-site.xml

<configuration>
<!-- 指定mr运行在yarn上 -->
	<property>
		<name>mapreduce.framework.name</name>
		<value>yarn</value>
	</property>
</configuration>

hdfs-site.xml

<configuration>
<!-- 指定HDFS副本的数量 -->
	<property>
		<name>dfs.replication</name>
		<value>1</value>
	</property>
	<property>
		<name>dfs.permissions</name>
		<value>false</value>
	</property>
</configuration>

yarn-site.xml

<configuration>
<!-- Site specific YARN configuration properties -->
	<!-- 指定YARN的老大（ResourceManager）的地址 -->
	<property>
		<name>yarn.resourcemanager.hostname</name>
		<value>hadoop</value>
	</property>
	<!-- reducer获取数据的方式 -->
	<property>
		<name>yarn.nodemanager.aux-services</name>
		<value>mapreduce_shuffle</value>
	</property>
</configuration>

启动集群时，记得多查找日志信息，所有的问题都会记录在启动日志中

我这些都是设的没问题的我现在看了下日志应该是nodemanager的日志有问题日志里面不停的刷下面的这段内容 2017-12-18 05:43:39,154 INFO org.apache.hadoop.yarn.server.nodemanager.containermanager.monitor.ContainersMonitorImpl: Memory usage of ProcessTree 2940 for container-id container_1513603995759_0001_01_000001: 160.4 MB of 2 GB physical memory used; 3.1 GB of 4.2 GB virtual memory used 2017-12-18 05:43:39,380 INFO org.apache.hadoop.yarn.server.nodemanager.NodeStatusUpdaterImpl: Sending out status for container: container_id {, app_attempt_id {, application_id {, id: 1, cluster_timestamp: 1513603995759, }, attemptId: 1, }, id: 1, }, state: C_RUNNING, diagnostics: "", exit_status: -1000, 2017-12-18 05:43:40,388 INFO org.apache.hadoop.yarn.server.nodemanager.NodeStatusUpdaterImpl: Sending out status for container: container_id {, app_attempt_id {, application_id {, id: 1, cluster_timestamp: 1513603995759, }, attemptId: 1, }, id: 1, }, state: C_RUNNING, diagnostics: "", exit_status: -1000, 2017-12-18 05:43:41,399 INFO org.apache.hadoop.yarn.server.nodemanager.NodeStatusUpdaterImpl: Sending out status for container: container_id {, app_attempt_id {, application_id {, id: 1, cluster_timestamp: 1513603995759, }, attemptId: 1, }, id: 1, }, state: C_RUNNING, diagnostics: "", exit_status: -1000, 不停刷，终端那里就是一直停在map 0% reduce 0%不动

gamedev˚ 2017-12-17

打赏
举报

基础程序跑不起来，说明是集群环境配置的不成功。可以从四个配置文件逐一检查，看是否有遗漏配置项 core-site.xml

<configuration>
<!-- 指定HADOOP所使用的文件系统schema（URI），HDFS的老大（NameNode）的地址 -->
	<property>
		<name>fs.defaultFS</name>
		<value>hdfs://yourHostname(主机名):9000/</value>
	</property>
	<!-- 指定hadoop运行时产生文件的存储目录 -->
	<property>
		<name>hadoop.tmp.dir</name>
		<value>$Hadoop_HOME(Hadoop安装路径)/tmp</value>
	</property>
</configuration>

mapred-site.xml

<configuration>
<!-- 指定mr运行在yarn上 -->
	<property>
		<name>mapreduce.framework.name</name>
		<value>yarn</value>
	</property>
</configuration>

hdfs-site.xml

<configuration>
<!-- 指定HDFS副本的数量 -->
	<property>
		<name>dfs.replication</name>
		<value>1</value>
	</property>
	<property>
		<name>dfs.permissions</name>
		<value>false</value>
	</property>
</configuration>

yarn-site.xml

<configuration>
<!-- Site specific YARN configuration properties -->
	<!-- 指定YARN的老大（ResourceManager）的地址 -->
	<property>
		<name>yarn.resourcemanager.hostname</name>
		<value>hadoop</value>
	</property>
	<!-- reducer获取数据的方式 -->
	<property>
		<name>yarn.nodemanager.aux-services</name>
		<value>mapreduce_shuffle</value>
	</property>
</configuration>

启动集群时，记得多查找日志信息，所有的问题都会记录在启动日志中

weixin_41220355 2017-12-16