[求助]两道分类算法的面试题,数据挖掘/机器学习相关,诚心求教!

final2411 2013-04-19 02:45:53
题目是:训练数据集中的每个样本用n维向量表示,第n维数据的值是0或者1,现在要建立分类算法,对于新的给定样本,已知向量前n-1维数据,预测向量最后一维的值。
问题是:1) 数据中关系到选择或者建立分类算法的2个最重要的属性是什么?为什么?
2) 现在已知两个分类算法,第一个算法训练花费时间5h,预测每个样本时间为1.5ms, 正确率86%; 第二个算法,训练花费时间30min,预测每个样本时间为2.5ms, 正确率95%, 应该选择哪个,为什么?
真心求教各位大神,万分感谢!!!!!
...全文
1867 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
小小程序师 2014-12-13
  • 打赏
  • 举报
回复
楼主现在有答案了吗?好想知道第二个问题的真相。
magicwei 2013-04-26
  • 打赏
  • 举报
回复
问题1: 两个属性应该是特征提取方法和分类器的选择。特征提取方法决定了送入分类器前样本的分布,分类器确定了最终的分类结果。 问题2:选择第二个,识别率高,虽然时间多花了一点而已。

7,388

社区成员

发帖
与我相关
我的任务
社区描述
其他数据库开发 数据仓库
社区管理员
  • 数据仓库
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧