请问Heritrix怎么抓取需要用户名密码验证的网页?

tiger440 2009-06-01 09:51:22
想用爬虫抓取万方数据库的论文,用户名密码已经有了,怎么编这样的爬虫?最好能用heritrix扩展,请教高手有什么建议?有人建议用httpclient模拟登陆,但是跳转之后就不知道怎么办了……
...全文
134 点赞 收藏 7
写回复
7 条回复
切换为时间正序
当前发帖距今超过3年,不再开放新的回复
发表回复
tianyu1002 2010-03-26
QQ283413468,可以交流交流
回复
yyandlh 2009-06-10
没有搞过,学习一下,顺便帮你顶上去
回复
tiger440 2009-06-10
用户名密码已经有了,只是不知道怎么模拟登陆
回复
xue08161981 2009-06-03
不知道,也支持一下楼主
回复
qiheia 2009-06-03
看看吧,很详细的。。。。
http://hi.baidu.com/chinesetea/blog/item/01a8a0ec8f04752f62d09ff2.html
回复
blliy117 2009-06-03
呵呵!!我想很多人都想知道,
这个本来人家就是要密码,为了安全,要不然就没有意义了

肯定要用户名和密码啊
回复
tiger440 2009-06-03
帮帮忙啊~
回复
相关推荐
发帖
Web 开发
创建于2007-09-28

8.0w+

社区成员

Java Web 开发
申请成为版主
帖子事件
创建了帖子
2009-06-01 09:51
社区公告
暂无公告