数据挖掘中分类预测算法(采用C4.5算法)
我们数据挖掘课后作业,之前没有接触过数据挖掘相关知识,这几天搜了一些资料,大致明白怎么做。是一个分类预测问题,采用C4.5算法,不过我在看C4.5算法的源代码及相关文章时,好像要有一个扩展名为name的文件,用来存放类名,属性名,相关值等。这一块我就不大清楚了,训练集,测试集都没问题,关键现在要有这个name文件,关于类名,属性,值等这些情况是在一个txt文件中介绍的,不过需要我来整理出相关信息。属性个数很多,我需要一个正确的方法来做,否则太浪费时间了。各位大虾,能详细的告诉我,该怎么做么,或者我的上述思路是否有问题?小弟时间紧啊,多谢各位了