请教nutch Crawl的问题
请问一下各位,我用了NUTCH 0.8按照http://wiki.apache.org/nutch/RunNutchInEclipse中介绍的,
输入了org.apache.nutch.crawl.Crawl
*
on tab Arguments, Program Arguments
urls -dir crawl -depth 3 -topN 50
*
in VM arguments
-Dhadoop.log.dir=logs -Dhadoop.log.file=hadoop.log
运行,
urls目录下也有好几个URL,但是爬到的结果整个crawl目录的大小才2K左右,里面的数据肯定是不完整的,请问一下有没有人知道怎么回事? 谢谢。