mapreduce不切分文件

学习的鱼儿 2017-03-28 10:24:11
如果 mapreduce TextInputFormat源码把
这个方法
protected boolean isSplitable(JobContext context, Path filename) {
// TODO Auto-generated method stub
return false;
}

这个方法改为false,不进行切分,比如hdfs有30个块,那么MapReduce会怎么对hdfs这30个块进行处理?
求指教!
...全文
290 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
tchqiq 2017-04-06
  • 打赏
  • 举报
回复
mr默认是按block块大小切分的,一个block块对应一个map(可以查查map数的几个参数),如果修改这个参数,应该是就只有一个map去处理30个block了

20,808

社区成员

发帖
与我相关
我的任务
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
  • 分布式计算/Hadoop社区
  • 涤生大数据
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧