求助,网页内容采集的问题。

liuguangyingxue 2005-12-02 01:43:37
采集目标地址:http://china.machine365.com/company/detail-id-199848.html

现在页面上的内容已经成功采集到本地,但此页面上的联系信息,必需要登陆后才可以看到,而且是用<iframe>嵌套的一个页面http://china.machine365.com/include/userinfo.php?ownerid=103049。

我已经在此网站上注册了一个用户,使本地中已经存在了用户登陆的信息,但我远程读取http://china.machine365.com/include/userinfo.php?ownerid=103049这个页面信息的时候,还需要登陆,如果欺骗过此验证呢????
...全文
181 8 打赏 收藏 转发到动态 举报
写回复
用AI写文章
8 条回复
切换为时间正序
请发表友善的回复…
发表回复
xingxueying 2006-01-10
  • 打赏
  • 举报
回复
取不了图片验证码值的,否则可以用 xmlhttp 先进行登陆,再获取网页内容 (可行)
wanghr100 2006-01-10
  • 打赏
  • 举报
回复
你可以试一下用XMLHTTP的方式.

var xmlhttp = new ActiveXObject("Msxml2.XMLHTTP.3.0");
xmlhttp.open("GET","http://china.machine365.com/include/userinfo.php?ownerid=103049", false, '用户名', '密码');
xmlhttp.send();
alert(xmlhttp.responseText);

没有经过测试...
Shewontloveme 2006-01-09
  • 打赏
  • 举报
回复
关注啊~~~~楼主搞懂了没?搞懂传授一下~~~
ivee 2005-12-02
  • 打赏
  • 举报
回复
这得看你是如何连接到远程网页的.用IE访问时会自动把该网页的认证信息提交过去(一般是COOKIE),而你的WEB客户端就并不一定这么智能。如果你是使用的Socket,你需要按http1.1协议将该远程网站的认证信息发送过去才行。
chinastorm 2005-12-02
  • 打赏
  • 举报
回复
没有搞懂呀,你不是采集到信息了么?为什么还要连接这个网页呢?
ybfqlyq 2005-12-02
  • 打赏
  • 举报
回复
但我用页面远程连接就不行。。。
你怎麼連接的呀??
liuguangyingxue 2005-12-02
  • 打赏
  • 举报
回复
这个我清楚的,但是只要登陆之后,

直接在浏览器上输入http://china.machine365.com/include/userinfo.php?ownerid=103049这个地址就可以了。

但我用页面远程连接就不行。。。
moodboy1982 2005-12-02
  • 打赏
  • 举报
回复
看这个网站的安全性而定,如果是我做的网页,你很难用这种方法通过。

28,406

社区成员

发帖
与我相关
我的任务
社区描述
ASP即Active Server Pages,是Microsoft公司开发的服务器端脚本环境。
社区管理员
  • ASP
  • 无·法
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧