没有细想,希望能对你有帮助 1.利用MapReduce对比两个文件的差异(mapreduce可以记录数据时来自哪个文件的吗?) 可以,在setup方法中 FileSplit split = (FileSplit) context.getInputSplit(); fileName = split.getPath().getName(); 2.利用MapReduce提高分析数据的精确度(地图软件) 具体什么数据? 3.MapReduce常见算法 不太明白什么意思?mahout里面的算法? 4.三个datanode 当有一个datanode出现错误会怎样 是存储数据错误?还是运行任务错误?dfs.replication配置相关 5.sqoop在导入数据到mysql中,如何让数据不重复导入?如果存在数据问题sqoop如何处理? Sqoop提供增量导入特性,配置如下参数 Incremental import arguments: --check-column <column> Source column to check for incremental change --incremental <import-type> Define an incremental import of type 'append' or 'lastmodified' --last-value <value> Last imported value in the incremental check column 6.mapreduce的join方法有哪些? map join 和 reduce join
好好看书,应该会有答案的吧
20,808
社区成员
4,690
社区内容
加载中
试试用AI创作助手写篇文章吧