社区
Web 开发
帖子详情
需要登陆的页面能抓取到页面的内容吗?
mygia
2006-04-20 11:10:01
而且这个登陆不是普通的登陆的页面。而是弹出像访问网上邻居一样的那种登陆页面。
...全文
287
8
打赏
收藏
需要登陆的页面能抓取到页面的内容吗?
而且这个登陆不是普通的登陆的页面。而是弹出像访问网上邻居一样的那种登陆页面。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
8 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
mygia
2006-06-28
打赏
举报
回复
解决不了只好揭帖啦!
fashi1000
2006-04-21
打赏
举报
回复
远程桌面是怎么实现把你保存的用户名密码提交到验证的主机上的
原理应该是相同的
xb8254
2006-04-21
打赏
举报
回复
经典
学习
mygia
2006-04-21
打赏
举报
回复
我说的登陆是没登陆之前获取到的是401没权限的,并不是获取到的登陆界面的html
xjp17610
2006-04-21
打赏
举报
回复
在google上偶尔开过一两个页面看快照存在,但自己打开需要登陆的。不晓得是否使用某种机制绕过了认证。
帮你顶。
iwlk
2006-04-21
打赏
举报
回复
关注
mygia
2006-04-21
打赏
举报
回复
就是不懂啊。如果我浏览器打开的话我就会设置保存用户名密码。
但是下次进去的时候依然会出来这个窗口,只是用户名密码已经填进去了。
mygia
2006-04-21
打赏
举报
回复
java.io.IOException: Server returned HTTP response code: 401 for URL: http://localhost/music
C#
抓取
需要
登录的
页面
抓取
需要
登录的
页面
的
内容
,原理主要是:先模拟登录,获取到COOKIE,然后接下来的访问,都使用这个COOKIE,就可以访问到
需要
登录的
页面
。理论上,浏览器可以做到的事情,程序应该也可以。不过,模拟登录,说起来容易,但不同站点有不同的处理方式,复杂程度不同。1、最简单的,是POST适当的数据,不用验证码2、象Discuz!系列的,要先访问某一个
页面
,获得随机码,然后置于POST数据中,才可以登录3、
selenium点击链接进入子
页面
抓取
内容
(新闻
抓取
案例一)
找了一个新闻网站练习爬虫
抓取
,目标:逐一点击目录标题,进入详细新闻
页面
,
抓取
子
页面
的标题和正文
内容
并打印出来,返回目录标题页,点击下一篇文章。注:没有新开窗口,是在原窗口实现跳转。新开窗口进行
抓取
看下一篇文章。 试了很多种方法都
抓取
不到class=rightContent下面每个a标签里的href链接,开始思考是不是因为href链接都放在li列表里面导致。 后面终于试到怎么获取这些在列表l...
java
抓取
页面
内容
,代码和详解步骤
java
抓取
页面
内容
,代码和详解步骤;拷贝就能RUN起来
百度站长工具
抓取
诊断提示
抓取
异常信息:读取http头或者
页面
内容
时失败
最近网站的收录情况不是很理想,网站添加了百度站长平台验证,就使用了
抓取
诊断功能,结果发现百度
抓取
失败。 提示“
抓取
异常信息:读取http头或者
页面
内容
时失败”。 看看百度官方给出的修改建议: 【读取http头或者
页面
内容
时失败】 您的服务器收到了我们的完整请求,但是返回信息时不完整,http头或者响应正文发生了截断,导致网页
内容
不能正常读取。 我还以为是http头的问题,结果调整了一
Python爬虫:
抓取
多级
页面
数据
前面讲解的爬虫案例都是单级
页面
数据
抓取
,但有些时候,只
抓取
一个单级
页面
是无法完成数据提取的。本节讲解如何使用爬虫
抓取
多级
页面
的数据。在爬虫的过程中,多级
页面
抓取
是经常遇见的。下面以
抓取
二级
页面
为例,对每级
页面
的作用进行说明:一级
页面
提供了获取二级
页面
的访问链接。二级
页面
作为详情页用来提取所需数据。一级
页面
以标签的形式链接到二级
页面
,只有在二级
页面
才可以提取到所需数据。
Web 开发
81,092
社区成员
341,716
社区内容
发帖
与我相关
我的任务
Web 开发
Java Web 开发
复制链接
扫一扫
分享
社区描述
Java Web 开发
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章