一行多个分隔符的keyvalue界定

sidney 2013-07-23 11:36:21
mapreduce程序是java的
输入文件是上游的结果,每一列都是TAB分割
现在要前两列作为key,后面的作为value
怎么设置key value的参数?
...全文
501 8 打赏 收藏 转发到动态 举报
写回复
用AI写文章
8 条回复
切换为时间正序
请发表友善的回复…
发表回复
幸运小侯子 2013-10-08
  • 打赏
  • 举报
回复
这个啊,必须得自己实现功能了,用maper去以A,b列分割,
踩踩一哥 2013-09-17
  • 打赏
  • 举报
回复
引用 6 楼 mlzhu007 的回复:
[quote=引用 5 楼 qq864680621 的回复:] 看楼主的意思,就是说不想写代码,以为自己在哪个地方配置一下就可以了? 你确定只是在hadoop中用吗?用别的数据工具不需要编码就可以实现
你这不是废话吗,不是hadoop,这还需要问吗?[/quote] 你以为那么简单?设置一下就可以了? 你说怎么实现也比怎么设置问的好,怀疑你不会问问题
sidney 2013-09-16
  • 打赏
  • 举报
回复
引用 5 楼 qq864680621 的回复:
看楼主的意思,就是说不想写代码,以为自己在哪个地方配置一下就可以了? 你确定只是在hadoop中用吗?用别的数据工具不需要编码就可以实现
你这不是废话吗,不是hadoop,这还需要问吗?
踩踩一哥 2013-09-16
  • 打赏
  • 举报
回复
看楼主的意思,就是说不想写代码,以为自己在哪个地方配置一下就可以了? 你确定只是在hadoop中用吗?用别的数据工具不需要编码就可以实现
zuochanxiaoheshang 2013-09-12
  • 打赏
  • 举报
回复
有两种情况: 1.将AB作为Reduce的Key 2.Map的输入Key是AB 如果是情况1,非常简单,采用TextInputFormat,这样每一行作为Map函数的Value传入。在Map函数中采用tab进行分割。 如果是情况2,自定义一个InputFormat,我觉得可以继承TextInputFormat,在里面进行split,合成一个新的Key
sidney 2013-09-11
  • 打赏
  • 举报
回复
每一行的数据都是A B C D 现在只要前两列A B作为key 怎么设置?
我想飞走 2013-08-26
  • 打赏
  • 举报
回复
这个可以通过修改inputFormat,即自定义搞定。 难度稍微有点大。 但是我不明白你的问题, 你是要将每行的前两列作为值吗? 还是要将整个两列作为值? 请讲清楚。
Leeezk 2013-08-24
  • 打赏
  • 举报
回复
同问???? 楼主的问题解决了吗

20,808

社区成员

发帖
与我相关
我的任务
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
  • 分布式计算/Hadoop社区
  • 涤生大数据
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧