请问如何对大数据求svd

店小一 2014-08-17 11:43:17

原始数据是这样的：
三列，分别是item,user 和评分。总共1500万多行，其中不同的item有70万左右，item有2万。
这份数据好像不能再转换成矩阵了吧，不然我试了下会有30多g，而且很多未评分的user-item关系为0。
我希望对其用svd做推荐，但是这么大的数据不能表示成矩阵，该如何求svd呢？
刚开始学机器学习，希望能得到帮助，谢谢。

...全文

489 4 打赏收藏转发到动态举报

写回复

4 条回复

切换为时间正序

请发表友善的回复…

发表回复

SG90 2014-08-21

打赏
举报

回复

参考一篇文章：http://www.cnblogs.com/LeftNotEasy/archive/2011/01/19/svd-and-applications.html

SG90 2014-08-21

打赏
举报

回复

SVD在大数据集上一般用迭代法来求解，通过Hadoop的MapReduce框架来加速。

ma130889 2014-08-19

打赏
举报

回复

在Hadoop中可以使用Mahout机器学习框架。具体参考mahout中的taste模块

人生偌只如初见 2014-08-18

打赏
举报

回复

spark mllib 包中支持 svd python numpy 包也有svd 函数支持

SVD算法以下内容来源于参考文献，仅供学习...#求平均值 def Average(fileName): fi = open(fileName, ‘r’) result = 0.0 cnt = 0 for line in fi: cnt += 1 arr = line.split() result += int(arr[2].strip()) ret

中科院大数据系统与大规模数据集分析 大数据挖掘教程 3-DR 挖掘海量数据集降维 SVD&CUR 共76页.pptx

在对网络参数与结构更新之后，通过权重矩阵SVD分解对更新后的网络结构进行优化，删除冗余的网络连接，增强网络模型的泛化能力。实验结果表明提出的模型能够在尽可能保持网络模型原始知识的基础上，通过不断更新神经...

Modern Big Data Algorithms 2018.11 现代大数据算法，英文高清电子书，分SVD、Linear Least Squares、NNMF,Positive Matrix Decomposition等三个章节讲述了大数据算法。

LDA是一个在文本建模中很著名的模型，类似于SVD、PLSA等模型，可以用于浅层语义分析，在文本语义分析中是一个很有用的模型。这个模型涉及到的数学知识包括：Gamma函数、Dirichlet分布、Dirichlet-Multinomial共轭、...

Hadoop生态社区

20,808

社区成员

4,690

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章