社区
Apache
帖子详情
在配置网络爬虫heritrix的时候遇到的问题。
lonelyriver
2008-11-07 12:07:10
附件中 上传了我 在加载第三方jar包 并且运行org.archive.crawler.herittix主类的时候的出错信息。麻烦给分析下。
...全文
180
3
打赏
收藏
在配置网络爬虫heritrix的时候遇到的问题。
附件中 上传了我 在加载第三方jar包 并且运行org.archive.crawler.herittix主类的时候的出错信息。麻烦给分析下。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
3 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
lonelyriver
2008-11-12
打赏
举报
回复
我按照网上说的方法做了个批处理 命名为list.bat
java -Xmx512m -Dheritrix.home=d:\\heritrix -cp "d:\\heritrix\\lib\\commons-codec-1.3.jar;d:\\heritrix\\lib\\commons-collections-3.1.jar;d:\\heritrix\\lib\\dnsjava-1.6.2.jar;d:\\heritrix\\lib\\poi-scratchpad-2.0-RC1-20031102.jar;d:\\heritrix\\lib\\commons-logging-1.0.4.jar;d:\\heritrix\\lib\\commons-httpclient-3.0.1.jar;d:\\heritrix\\lib\\commons-cli-1.0.jar;d:\\heritrix\\lib\\mg4j-1.0.1.jar;d:\\heritrix\\lib\\javaswf-CVS-SNAPSHOT-1.jar;d:\\heritrix\\lib\\bsh-2.0b4.jar;d:\\heritrix\\lib\\servlet-tomcat-4.1.30.jar;d:\\heritrix\\lib\\junit-3.8.1.jar;d:\\heritrix\\lib\\jasper-compiler-tomcat-4.1.30.jar;d:\\heritrix\\lib\\commons-lang-2.1.jar;d:\\heritrix\\lib\\itext-1.2.0.jar;d:\\heritrix\\lib\\poi-2.0-RC1-20031102.jar;d:\\heritrix\\lib\\jetty-4.2.23.jar;d:\\heritrix\\lib\\commons-net-1.4.1.jar;d:\\heritrix\\lib\\libidn-0.5.9.jar;d:\\heritrix\\lib\\ant-1.6.2.jar;d:\\heritrix\\lib\\fastutil-5.0.3-heritrix-subset-1.0.jar;d:\\heritrix\\lib\\je-3.0.12.jar;d:\\heritrix\\lib\\commons-pool-1.3.jar;d:\\heritrix\\lib\\jasper-runtime-tomcat-4.1.30.jar;d:\\heritrix\\heritrix-1.10.1.jar" org.archive.crawler.Heritrix
在命令行d:\heritrix\lib>list.bat 没有出错提示和任何其他错误
结果 :d:\heritrix\lib>java -Xmx512m -Dheritrix.home=d:\\heritrix -cp "d:\\heritrix\\lib\\commons-codec-1.3.jar;d:\\heritrix\\lib\\commons-collections-3.1.jar;d:\\heritrix\\lib\\dnsjava-1.6.2.jar;d:\\heritrix\\lib\\poi-scratchpad-2.0-RC1-20031102.jar;d:\\heritrix\\lib\\commons-logging-1.0.4.jar;d:\\heritrix\\lib\\commons-httpclient-3.0.1.jar;d:\\heritrix\\lib\\commons-cli-1.0.jar;d:\\heritrix\\lib\\mg4j-1.0.1.jar;d:\\heritrix\\lib\\javaswf-CVS-SNAPSHOT-1.jar;d:\\heritrix\\lib\\bsh-2.0b4.jar;d:\\heritrix\\lib\\servlet-tomcat-4.1.30.jar;d:\\heritrix\\lib\\junit-3.8.1.jar;d:\\heritrix\\lib\\jasper-compiler-tomcat-4.1.30.jar;d:\\heritrix\\lib\\commons-lang-2.1.jar;d:\\heritrix\\lib\\itext-1.2.0.jar;d:\\heritrix\\lib\\poi-2.0-RC1-20031102.jar;d:\\heritrix\\lib\\jetty-4.2.23.jar;d:\\heritrix\\lib\\commons-net-1.4.1.jar;d:\\heritrix\\lib\\libidn-0.5.9.jar;d:\\heritrix\\lib\\ant-1.6.2.jar;d:\\heritrix\\lib\\fastutil-5.0.3-heritrix-subset-1.0.jar;d:\\heritrix\\lib\\je-3.0.12.jar;d:\\heritrix\\lib\\commons-pool-1.3.jar;d:\\heritrix\\lib\\jasper-runtime-tomcat-4.1.30.jar;d:\\heritrix\\heritrix-1.10.1.jar" org.archive.crawler.Heritrix
d:\heritrix\lib> (光标停留在了此处)
但是我在浏览器中打:http://localhost:8080 出错。
lonelyriver
2008-11-07
打赏
举报
回复
是不是跟环境变量的设置有关?
lonelyriver
2008-11-07
打赏
举报
回复
麻烦给拆解一下:noclassDefoundError;Unknown Source;Native Method; 这几个 Exception是在加载jar包和主方法的时候遇到的。
分别是什么意思呢?该如何解决。
网络
爬虫
(
heritrix
)代码
在做搜索引擎上经常使用的
网络
蜘蛛。 关于
heritrix
安装和代码都有
配置
Heritrix
及常见
问题
解决
NULL 博文链接:https://fhqiwcw.iteye.com/blog/1388658
开源的
爬虫
软件
Heritrix
3.1.0
开源的
爬虫
软件
Heritrix
3.1.0,文件为可用的源代码,供下载,经测试,可用。
heritrix
爬虫
工具的使用
NULL 博文链接:https://betty.iteye.com/blog/452830
heritrix
的详细
配置
与 使用资料
heritrix
的详细
配置
与 使用资料.里面对
heritrix
配置
有详细的说明!
Apache
24,918
社区成员
16,542
社区内容
发帖
与我相关
我的任务
Apache
Web 开发 Apache
复制链接
扫一扫
分享
社区描述
Web 开发 Apache
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章