mahout 机器学习
大家好,请问,若运行自己的数据,怎么才能与mahout中的算法相关联呢?也就是说,自己的数据应该以什么样的顺序放在文档中呢?
详细描述:
(1)我现在要用到mahout中的(贝叶斯)算法,可它在网上资料都提的(20Newsgroups)这样的数据集,那我怎么样将我的业务数据转换成mahout能够读取的文件?
(2)mahout仅支持SequenceFile格式的文件,那我们可以用mahout本身的mahout seqdirectory将文本文件来转换。可我进行转换时就会报错,请问,文本文件中数据的格式是什么?