写聚类内存不够用。。。

RouShan007 2012-05-22 02:23:26
小白刚刚入门数据挖掘
老板给个工作要对4G,1000w左右条目的数据进行聚类并且生成倒排索引
计划用k-means,但是小本内存不够啊读不进来。。。
以前没有用文件流辅助过计算所以不是很清楚流程。
似乎听人说过可以只保留数组下标每次要用数据的时候去读文件
但是4G的数据啊。。这样每次取数据的时候都要读不是也很慢么~?
求问大家有没有什么好方法。。。><
...全文
401 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
RouShan007 2012-05-24
  • 打赏
  • 举报
回复
[Quote=引用 1 楼 的回复:]

内存映射文件,或者 直接搞个大内存的。

要做算法之类的, 24GB 内存,起步
[/Quote]

啊~谢谢><去研究下。。。
内存映射文件还是好久前写过超简单的快排= =~
学生党表示内存加不起啊。。。QAQ
这个其实是俺们的课程项目。。。
CandPointer 2012-05-22
  • 打赏
  • 举报
回复
内存映射文件,或者 直接搞个大内存的。

要做算法之类的, 24GB 内存,起步

3,881

社区成员

发帖
与我相关
我的任务
社区描述
C/C++ 其它技术问题
社区管理员
  • 其它技术问题社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧