webclent.getpage问题

fenglvche 2015-11-14 05:52:14
最近在写一些爬虫的东西,有使用一些网站的OA的东西,但是JAVA代码使用htmlunit的时候出现了一些问题,它的webclient老是会出现不能链接的情况:
都是卡在HtmlPage checkPage = webClient.getPage(authorizationUrl);这里
1)做Facebook的提示
org.apache.http.conn.HttpHostConnectException: Connection to https://www.facebook.com refused
2)做豆瓣的提示
javax.net.ssl.SSLPeerUnverifiedException: peer not authenticated
然而,使用authorizationUrl里的地址,在chrome上打开都是可以进入使用的,返回的结果也跟预期一样,就是在java的tomcat上面一直会有这类错误
...全文
90 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
fenglvche 2015-11-15
  • 打赏
  • 举报
回复
可是我用的是他们的API啊,主要是在进入OA认证的时候,抓取不到认证的网页,但是,理论是应该要留给我们一个方法进去拿返回的code才是,如果拒绝了我的webclient.getpage的请求,那么应该怎么去获得那个code。
海会圣贤 2015-11-15
  • 打赏
  • 举报
回复
他们网站把你的爬虫禁了,就像你爬不到csdn一样。

81,092

社区成员

发帖
与我相关
我的任务
社区描述
Java Web 开发
社区管理员
  • Web 开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧