libsvm 数据集的不平衡问题

xdp719 2011-05-31 08:54:33
在用svm训练数据集时,出现样本不平衡问题,用smote算法使样本平衡(根据正样本集增加了一些以前不存在的样本作为正样本),即正样本数目等于负样本数目,那么在计算正确率的时候,要不要将增加的以前并不存在的正样本(即smote算法增加的正样本)计算在内呢,求高手解答,谢谢!
...全文
429 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
zhaoliangtsc8 2012-05-30
  • 打赏
  • 举报
回复
果断不算。而且评价性能也不能只用正确率来评价了。问一下楼主,你的smote算法程序是不是C++的。是的话能否给传一份。我的邮箱zhaoliangtsc@yahoo.cn。不胜感激啊!有什么问题可以交流啊。
relaxisland 2011-06-01
  • 打赏
  • 举报
回复
[Quote=引用楼主 xdp719 的回复:]
在用svm训练数据集时,出现样本不平衡问题,用smote算法使样本平衡(根据正样本集增加了一些以前不存在的样本作为正样本),即正样本数目等于负样本数目,那么在计算正确率的时候,要不要将增加的以前并不存在的正样本(即smote算法增加的正样本)计算在内呢,求高手解答,谢谢!
[/Quote]
计算准确率不是应该用另外一组测试数据吗。
新的测试数据的正负样本比例应该是跟你要解决的实际问题的比例是一致。
但是在某类样本的个数占有绝对性优势的情况下,可能计算出的结果不是很明显。
我觉得可以另加2个统计数据,正样本的准确率,跟负样本的准确率
跟不平衡数据训练的svm进行比较,看看 正样本的准确率是不是提高了。

这个东西,看文章怎么写吧,要解决的问题的特性吧。
zxfqingtian807 2011-06-01
  • 打赏
  • 举报
回复
不大明白vv
king__xy 2011-06-01
  • 打赏
  • 举报
回复
做了个关于这个的课程设计,各种错误。。。训练的数据各种错
ryfdizuo 2011-05-31
  • 打赏
  • 举报
回复
支持向量机,不懂 up~

69,369

社区成员

发帖
与我相关
我的任务
社区描述
C语言相关问题讨论
社区管理员
  • C语言
  • 花神庙码农
  • 架构师李肯
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧