需要登陆的页面能抓取到页面的内容吗？

mygia 2006-04-20 11:10:01

而且这个登陆不是普通的登陆的页面。而是弹出像访问网上邻居一样的那种登陆页面。

...全文

287 8 打赏收藏转发到动态举报

写回复

用AI写文章

8 条回复

切换为时间正序

请发表友善的回复…

发表回复

mygia 2006-06-28

打赏
举报

解决不了只好揭帖啦！

fashi1000 2006-04-21

打赏
举报

远程桌面是怎么实现把你保存的用户名密码提交到验证的主机上的
原理应该是相同的

xb8254 2006-04-21

打赏
举报

经典
学习

mygia 2006-04-21

打赏
举报

我说的登陆是没登陆之前获取到的是401没权限的，并不是获取到的登陆界面的html

xjp17610 2006-04-21

打赏
举报

在google上偶尔开过一两个页面看快照存在，但自己打开需要登陆的。不晓得是否使用某种机制绕过了认证。

帮你顶。

iwlk 2006-04-21

打赏
举报

关注

mygia 2006-04-21

打赏
举报

就是不懂啊。如果我浏览器打开的话我就会设置保存用户名密码。
但是下次进去的时候依然会出来这个窗口，只是用户名密码已经填进去了。

mygia 2006-04-21

打赏
举报

java.io.IOException: Server returned HTTP response code: 401 for URL: http://localhost/music

抓取需要登录的页面的内容，原理主要是：先模拟登录，获取到COOKIE，然后接下来的访问，都使用这个COOKIE，就可以访问到需要登录的页面。理论上，浏览器可以做到的事情，程序应该也可以。不过，模拟登录，说起来容易，但不同站点有不同的处理方式，复杂程度不同。1、最简单的，是POST适当的数据，不用验证码2、象Discuz!系列的，要先访问某一个页面，获得随机码，然后置于POST数据中，才可以登录3、

找了一个新闻网站练习爬虫抓取，目标：逐一点击目录标题，进入详细新闻页面，抓取子页面的标题和正文内容并打印出来，返回目录标题页，点击下一篇文章。注：没有新开窗口，是在原窗口实现跳转。新开窗口进行抓取看下一篇文章。试了很多种方法都抓取不到class=rightContent下面每个a标签里的href链接，开始思考是不是因为href链接都放在li列表里面导致。后面终于试到怎么获取这些在列表l...

java抓取页面内容，代码和详解步骤；拷贝就能RUN起来

最近网站的收录情况不是很理想，网站添加了百度站长平台验证，就使用了抓取诊断功能，结果发现百度抓取失败。提示“抓取异常信息：读取http头或者页面内容时失败”。看看百度官方给出的修改建议：【读取http头或者页面内容时失败】您的服务器收到了我们的完整请求，但是返回信息时不完整，http头或者响应正文发生了截断，导致网页内容不能正常读取。我还以为是http头的问题，结果调整了一

前面讲解的爬虫案例都是单级页面数据抓取，但有些时候，只抓取一个单级页面是无法完成数据提取的。本节讲解如何使用爬虫抓取多级页面的数据。在爬虫的过程中，多级页面抓取是经常遇见的。下面以抓取二级页面为例，对每级页面的作用进行说明：一级页面提供了获取二级页面的访问链接。二级页面作为详情页用来提取所需数据。一级页面以标签的形式链接到二级页面，只有在二级页面才可以提取到所需数据。

Web 开发

81,092

社区成员

341,716

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章