hadoop面试题

tchqiq 2014-09-02 05:58:29
有几个问题想问,是网上看到的面试题,自己也不知道怎么解
1.利用MapReduce对比两个文件的差异(mapreduce可以记录数据时来自哪个文件的吗?)
2.利用MapReduce提高分析数据的精确度(地图软件)
3.MapReduce常见算法
8 三个datanode 当有一个datanode出现错误 会怎样
9 sqoop在导入数据到mysql中,如何让数据不重复导入?如果存在数据问题sqoop如何处理?
16. mapreduce的join方法有哪些?
...全文
817 9 打赏 收藏 转发到动态 举报
写回复
用AI写文章
9 条回复
切换为时间正序
请发表友善的回复…
发表回复
tchqiq 2014-10-17
  • 打赏
  • 举报
回复
引用 2 楼 wulinshishen 的回复:
没有细想,希望能对你有帮助 1.利用MapReduce对比两个文件的差异(mapreduce可以记录数据时来自哪个文件的吗?) 可以,在setup方法中 FileSplit split = (FileSplit) context.getInputSplit(); fileName = split.getPath().getName(); 2.利用MapReduce提高分析数据的精确度(地图软件) 具体什么数据? 3.MapReduce常见算法 不太明白什么意思?mahout里面的算法? 4.三个datanode 当有一个datanode出现错误会怎样 是存储数据错误?还是运行任务错误?dfs.replication配置相关 5.sqoop在导入数据到mysql中,如何让数据不重复导入?如果存在数据问题sqoop如何处理? Sqoop提供增量导入特性,配置如下参数 Incremental import arguments: --check-column <column> Source column to check for incremental change --incremental <import-type> Define an incremental import of type 'append' or 'lastmodified' --last-value <value> Last imported value in the incremental check column 6.mapreduce的join方法有哪些? map join 和 reduce join
谢谢你的详细回答~让我又学了不少~
SG90_ICT 2014-09-18
  • 打赏
  • 举报
回复
引用 7 楼 shanghai2420 的回复:
好好看书,应该会有答案的吧
来论坛问问题,无可厚非吧,大家讨论讨论也是学习的过程么
huof 2014-09-18
  • 打赏
  • 举报
回复
好好看书,应该会有答案的吧
SG90_ICT 2014-09-13
  • 打赏
  • 举报
回复
8 三个datanode 当有一个datanode出现错误 会怎样 >> master会将此datanode的任务分配到其他datanode上去完成
SG90 2014-09-02
  • 打赏
  • 举报
回复
第三题,最经典的是PageRank了吧
SG90 2014-09-02
  • 打赏
  • 举报
回复
第二题,还可以有这个用途?
SG90 2014-09-02
  • 打赏
  • 举报
回复
第一题,主要是问diff算法的吧,要把类似版本控制的diff算法用分布式实现
  • 打赏
  • 举报
回复
没有细想,希望能对你有帮助 1.利用MapReduce对比两个文件的差异(mapreduce可以记录数据时来自哪个文件的吗?) 可以,在setup方法中 FileSplit split = (FileSplit) context.getInputSplit(); fileName = split.getPath().getName(); 2.利用MapReduce提高分析数据的精确度(地图软件) 具体什么数据? 3.MapReduce常见算法 不太明白什么意思?mahout里面的算法? 4.三个datanode 当有一个datanode出现错误会怎样 是存储数据错误?还是运行任务错误?dfs.replication配置相关 5.sqoop在导入数据到mysql中,如何让数据不重复导入?如果存在数据问题sqoop如何处理? Sqoop提供增量导入特性,配置如下参数 Incremental import arguments: --check-column <column> Source column to check for incremental change --incremental <import-type> Define an incremental import of type 'append' or 'lastmodified' --last-value <value> Last imported value in the incremental check column 6.mapreduce的join方法有哪些? map join 和 reduce join
tchqiq 2014-09-02
  • 打赏
  • 举报
回复
我顶~~~~~~~~

20,808

社区成员

发帖
与我相关
我的任务
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
  • 分布式计算/Hadoop社区
  • 涤生大数据
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧