社区
Hadoop生态社区
帖子详情
请问如何对大数据求svd
店小一
2014-08-17 11:43:17
原始数据是这样的:
三列,分别是item,user 和评分。总共1500万多行,其中不同的item有70万左右,item有2万。
这份数据好像不能再转换成矩阵了吧, 不然我试了下会有30多g,而且很多未评分的user-item关系为0。
我希望对其用svd做推荐,但是这么大的数据不能表示成矩阵,该如何求svd呢?
刚开始学机器学习,希望能得到帮助,谢谢。
...全文
489
4
打赏
收藏
请问如何对大数据求svd
原始数据是这样的: 三列,分别是item,user 和评分。总共1500万多行,其中不同的item有70万左右,item有2万。 这份数据好像不能再转换成矩阵了吧, 不然我试了下会有30多g,而且很多未评分的user-item关系为0。 我希望对其用svd做推荐,但是这么大的数据不能表示成矩阵,该如何求svd呢? 刚开始学机器学习,希望能得到帮助,谢谢。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
SG90
2014-08-21
打赏
举报
回复
参考一篇文章:http://www.cnblogs.com/LeftNotEasy/archive/2011/01/19/svd-and-applications.html
SG90
2014-08-21
打赏
举报
回复
SVD在大数据集上一般用迭代法来求解,通过Hadoop的MapReduce框架来加速。
ma130889
2014-08-19
打赏
举报
回复
在Hadoop中可以使用Mahout机器学习框架。具体参考mahout中的taste模块
人生偌只如初见
2014-08-18
打赏
举报
回复
spark mllib 包中支持 svd python numpy 包也有svd 函数支持
SVD
推荐算法
SVD
推荐算法
SVD
算法 以下内容来源于参考文献,仅供学习...#
求
平均值 def Average(fileName): fi = open(fileName, ‘r’) result = 0.0 cnt = 0 for line in fi: cnt += 1 arr = line.split() result += int(arr[2].strip()) ret
中科院
大数据
系统与大规模数据集分析
大数据
挖掘教程 3-DR 挖掘海量数据集降维
SVD
&CUR 共76页.pptx
中科院
大数据
系统与大规模数据集分析
大数据
挖掘教程 3-DR 挖掘海量数据集降维
SVD
&CUR 共76页.pptx
论文研究-支持增量式更新的
大数据
特征学习模型.pdf
在对网络参数与结构更新之后,通过权重矩阵
SVD
分解对更新后的网络结构进行优化,删除冗余的网络连接,增强网络模型的泛化能力。实验结果表明提出的模型能够在尽可能保持网络模型原始知识的基础上,通过不断更新神经...
Modern Big Data Algorithms 2018.11-现代
大数据
算法
Modern Big Data Algorithms 2018.11 现代
大数据
算法,英文高清电子书,分
SVD
、Linear Least Squares、NNMF,Positive Matrix Decomposition等三个章节讲述了
大数据
算法。
大数据
LDA算法相关讲解
LDA是一个在文本建模中很著名的模型,类似于
SVD
、PLSA等模型,可以用于浅层语义分析,在文本语义分析中是一个很有用的模型。这个模型涉及到的数学知识包括:Gamma函数、Dirichlet分布、Dirichlet-Multinomial共轭、...
Hadoop生态社区
20,808
社区成员
4,690
社区内容
发帖
与我相关
我的任务
Hadoop生态社区
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
复制链接
扫一扫
分享
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章