社区
下载资源悬赏专区
帖子详情
基于哈希技术与MapReduce的大数据集K-近邻算法实现代码下载
weixin_39820535
2019-09-21 02:01:34
基于哈希技术和MapReduce的大数据集K-近邻算法实现代码
相关下载链接:
//download.csdn.net/download/a2011480169/9511655?utm_source=bbsseo
...全文
10
回复
打赏
收藏
基于哈希技术与MapReduce的大数据集K-近邻算法实现代码下载
基于哈希技术和MapReduce的大数据集K-近邻算法实现代码 相关下载链接://download.csdn.net/download/a2011480169/9511655?utm_source=bbsseo
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
基于
哈希
技术
与
MapReduce
的大
数据集
K-
近邻
算法
实现
代码
基于
哈希
技术
和
MapReduce
的大
数据集
K-
近邻
算法
实现
代码
基于
哈希
技术
和
MapReduce
的大
数据集
K-
近邻
算法
实现
代码
基于
哈希
技术
和
MapReduce
的大
数据集
K-
近邻
算法
实现
的完整
代码
基于HBase和SimHash的大数据K-
近邻
算法
简
针对大数据K-
近邻
(K-nearest neighbors,K-NN)计算复杂度高的问题,提出一种基于HBase和Sim Hash的大数据K-
近邻
分类
算法
。利用Sim Hash
算法
将大
数据集
从原空间映射到Hamming空间,得到
哈希
签名值集合;将样例的行键与值的二元对存储到HBase数据库中,行健(rowkey)为样例的
哈希
签名值,值(value)为样例的类别;对于测试样例,以其
哈希
签名值作为健rowkey,从HBase数据库中获取所有样例的value,通过对这些values进行多数投票,即可以得到测试样例的类别。与基于
MapReduce
的K-NN和基于Spark的K-NN在运行时间和测试精度两方面进行试验比较。试验结果显示,在保持分类能力的前提下,提出的
算法
的运行时间远远低于其他两种方法。
【机器学习实战】第15章 大数据与
MapReduce
第15章 大数据与
MapReduce
大数据 概述 大数据: 收集到的数据已经远远超出了我们的处理能力。 大数据 场景 假如你为一家网络购物商店工作,很多用户访问该网站,其中有些人会购买商品,有些人则随意浏览后就离开。 对于你来说,可能很想识别那些有购物意愿的用户。 那么问题就来了,
数据集
可能会非常大,在单机上训练要运行好几天。 接下来:我们讲讲 MapRede
【机器学习实战-python3】大数据与
MapReduce
本篇的数据和
代码
参见:https://github.com/stonycat/ML-in-Action 一、
MapReduce
:分布式计算的框架
MapReduce
优点:可在短时间内完成大量工作。 缺点:
算法
必须经过重写,需要对系统工程有一定的理解。 适用数据类型:数值型和标称型数据。 Google公司的Jeffrey Dean和Sanjay Ghemawat在2004年的一篇论
下载资源悬赏专区
12,774
社区成员
12,303,767
社区内容
发帖
与我相关
我的任务
下载资源悬赏专区
CSDN 下载资源悬赏专区
复制链接
扫一扫
分享
社区描述
CSDN 下载资源悬赏专区
其他
技术论坛(原bbs)
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章