数据挖掘的预处理步骤,怎么把xml文件转换成csv文件?
gwgyk 2013-10-14 10:47:59 我们在学数据挖掘,有个实验是从DBLP上的一个数据集来查找最常合著的作者。这个数据集是xml格式的,但是weka不能识别这个格式,而且这个xml文件很大,有1.2G,超过100万条记录。该怎么把这个xml文件格式转换成weka能识别的csv格式呢?
可否通过java程序来读取这个xml文件,然后用java把它写成csv格式?或者是否可以直接写成arff格式呢?
但是这个xml文件很大,如果直接读入的话,可能会让机子卡死,该怎么办呢?