获取一些mapreduce job中的task的一些信息

s5440363 2017-07-06 10:00:56

基于mapreduce计算框架：提交一个job 我想要获取当前job中包含的所有task 的一些信息 (task 处理数据块的大小，task请求的资源(container中CPU,RAM),task执行时间)=(size,CPU,RAM,time)。求一个好点的解决方案

...全文

321 回复打赏收藏转发到动态举报

写回复

回复

切换为时间正序

请发表友善的回复…

发表回复

java大数据培训学校全套教材系列课程由1000集视频构成，基本就是1）时下流行的java培训学校主流内部教材，2）和市面上培训学校的通行的课程体系几乎一样。所以这套课程都能自己学下来，等于上了培训学校一次，完全可以找个java工程师的工作了。通过学习MapReduce程序，如何输入文件是两个文件，Partitioner的用法，Combiner的用法，自定义对象，排序sort，topN问题，全局变量，剖析源码单步调试详解MapReduce分组group遍历，reduce当中的cleanup的用法，自定义输出：多文件输出MultipleOutputs，DBOutputFormat把MapReduce结果输出到mysql中，MapReduce实现join算法，map端做join，寻找用户间的共同好友等，围绕着Mapreduce知识点的相关14个问题，学过后可以基本胜任MapReduce编程工作。课程特色：专业细致，偏案例，理论强。课程软件使用：必须下载 2018 eclipse 4.7 oxygen版本重要声明：如果感觉噪音大，可以选择不用耳机，加音箱或用电脑原声

本节内容完全来自深入理解大数据：大数据处理与编程实践机械工业出版社没啥好说的，直接上内容一、作业首先，用户程序客户端通过作业客户端接口程序JobClient提交一个用户程序。然后JobClient向JobTracker提交作业执行请求并获得一个Job ID。 JobClient同时也会将用户程序作业和待处理的数据文件信息准备好并存储在HDFS中。 JobClient正式向JobTracker提交和执行该作业。 JobTracker接受并调度该作业，并进行作业的初始化准备工作，根据待处理数

题目 1.求每个订单中最贵的商品（GroupingComparator）我将该数据源上次至hadoop集群中，随后调用编写好的MapReduce程序，结果报错如下：20/12/19 12:18:08 INFO mapreduce.Job: Task Id : attempt_1607842602362_0032_m_000000_2, Status : FAIL 解决流程：我检查了一下数据源文件，我将数据源存放在一个Grouping.txt文件中，该数据源如下：随后我把该文件上传至集群，作为调用Ma

运行hadoop报错 INFO mapreduce.Job: Task Id : attempt_1610003035850_0014_r_000002_2, Status : FAILED Error: java.io.EOFException at java.io.DataInputStream.readUnsignedShort(DataInputStream.java:340) at java.io.DataInputStream.readUTF(DataInputStream.java:589)

Mapreduce数据处理过程作业（job）是Mapreduce数据处理单元，分为两大过程：map和reduce；首先作业提交集群中被分成若干小的任务（task）执行具体操作步骤，二job和task是被jobtracker和tasktracker分别控制执行的，前者是管理job后者管理task。在数据操作过程中，jobtracker通过调用tasktracker中任务（task）集协调整个流程。Tasktracker收到jobtracker调度命令后执行其任务集同事向jobtracker发送任务的状态

Hadoop生态社区

20,809

社区成员

4,691

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章