有熟悉LibSVM训练的吗,900个分类,2W个维度?

menuvb 2012-03-04 07:50:08
之前使用libsvm训练,几个小时都没出结果,后来改为liblinear,还是一样。

训练文件大概是9M左右.
...全文
279 8 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
8 条回复
切换为时间正序
请发表友善的回复…
发表回复
menuvb 2012-03-08
  • 打赏
  • 举报
回复
是的,KNN的分类时间是线性的,如果还是上面的数据量去训练,将一个文档分类大概要4-5秒左右(维度太多,就算用了倒排结构在速度上也没有太大在的效果,),目前正打算减少维度,并用KD-tree,希望对自己有用。

目前SVM看来已经不在适合我。
speedmancs 2012-03-08
  • 打赏
  • 举报
回复
SVM是二分类的,用svm做多分类的话你还得做进一步的处理。

svm的分类性能是非常强悍的,knn大多数情况下,是不如svm的。另外,knn虽然训练时间相对较少,但是分类时间是和训练样本规模成正相关的。。。。svm的离线训练时间是很长,但是在线分类效率和效果都是很赞的。


svm训练跑个几天一般都不是什么稀罕事
menuvb 2012-03-08
  • 打赏
  • 举报
回复
数据量不大,训练样本大概在40M左右,基本上文本一行就算一个分类的样本,总共有80W个样本。

现在已经改为KNN来分类了,SVM确实不适合这种多分类的。训练时间都是一个未知数。小分类和小数据量SVM是个更好的选择。
mathe 2012-03-06
  • 打赏
  • 举报
回复
2W个维度有点可怕,2W*2W的矩阵求特征值计算量可不小
speedmancs 2012-03-06
  • 打赏
  • 举报
回复
900个类别,2w个维度?

那你有多少个训练样本
V68V6 2012-03-05
  • 打赏
  • 举报
回复
[Quote=引用 1 楼 acesidonu 的回复:]
友情帮顶
[/Quote]

同上。

33,027

社区成员

发帖
与我相关
我的任务
社区描述
数据结构与算法相关内容讨论专区
社区管理员
  • 数据结构与算法社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧