请问Heritrix怎么抓取需要用户名密码验证的网页?

tiger440 2009-06-01 09:51:22
想用爬虫抓取万方数据库的论文,用户名密码已经有了,怎么编这样的爬虫?最好能用heritrix扩展,请教高手有什么建议?有人建议用httpclient模拟登陆,但是跳转之后就不知道怎么办了……
...全文
161 7 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
7 条回复
切换为时间正序
请发表友善的回复…
发表回复
tianyu1002 2010-03-26
  • 打赏
  • 举报
回复
QQ283413468,可以交流交流
yyandlh 2009-06-10
  • 打赏
  • 举报
回复
没有搞过,学习一下,顺便帮你顶上去
tiger440 2009-06-10
  • 打赏
  • 举报
回复
用户名密码已经有了,只是不知道怎么模拟登陆
xue08161981 2009-06-03
  • 打赏
  • 举报
回复
不知道,也支持一下楼主
qiheia 2009-06-03
  • 打赏
  • 举报
回复
看看吧,很详细的。。。。
http://hi.baidu.com/chinesetea/blog/item/01a8a0ec8f04752f62d09ff2.html
blliy117 2009-06-03
  • 打赏
  • 举报
回复
呵呵!!我想很多人都想知道,
这个本来人家就是要密码,为了安全,要不然就没有意义了

肯定要用户名和密码啊
tiger440 2009-06-03
  • 打赏
  • 举报
回复
帮帮忙啊~

81,122

社区成员

发帖
与我相关
我的任务
社区描述
Java Web 开发
社区管理员
  • Web 开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧