MapReduce并行实现决策树求解

寻找奇迹 2014-05-21 06:27:14
谁能讲讲MapReduce并行实现决策树的具体流程?现在我所实现的决策树只是通过MapReduce来计算特征属性的增益率或是基尼指数而已,感觉离并行还差得很远,网上也找了不少资料参考,但是感觉说的都比较泛,都是比较大的实现过程,我想请教下做过相关方面的大牛,说说具体的实现流程,不甚感激啊。
...全文
747 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
  • 打赏
  • 举报
回复
一个大数据集的文件,拆分成N个小数据集文件,然后计算当前小数据集文件的最佳分割属性与分割点,之后汇总N个小数据集文件的最佳划分,投票选出最佳划分。N个小数据集的节点根据最终的最佳划分,分割自己节点上的数据,继续计算当前小数据集文件的最佳分割属性与分割点。如此递归下去,直到满足停止条件为止。我是这样理解的,不知道对你有帮助没有?我也是一枚刚接触这个的菜鸟。期待大牛回答。
寻找奇迹 2014-05-23
  • 打赏
  • 举报
回复
没有人关注吗?

20,808

社区成员

发帖
与我相关
我的任务
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
  • 分布式计算/Hadoop社区
  • 涤生大数据
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧