后台执行（抓取）网页问题？

duyongfeng1985 2011-06-09 11:06:17

我在后台DLL里需要执行一个页面，同时获取页面返回的值，我试着用过HttpWebRequest和HttpWebResponse，但页面上还要执行一些脚本的，用它们获取的信息是一大堆代码，不是js执行后的。
总结下，我想获取页面执行（呈现后）的页面信息。不知道表达清楚没有，请指点迷津！多谢！

...全文

108 7 打赏收藏转发到动态举报

写回复

7 条回复

切换为时间正序

请发表友善的回复…

发表回复

duyongfeng1985 2011-06-09

打赏
举报

回复

[Quote=引用 3 楼 porschev 的回复:]
你的意思是你用HttpWebRequest。。。抓不到AJAX提交显示的数据？
[/Quote]

嗯，可以这么理解

porschev 2011-06-09

打赏
举报

回复

你的意思是你用HttpWebRequest。。。抓不到AJAX提交显示的数据？

duyongfeng1985 2011-06-09

打赏
举报

回复

[Quote=引用 1 楼 porschev 的回复:]
LZ表达的我没看懂。。。。

后台DLL里？？？？

不是JS执行后。。。？？？
[/Quote]

我在后台DLL（类库）里需要执行一个页面，页面上有一些JS方法会在加载后执行，在JS里还有AJAX调用，我想得到页面执行后打印到页面上的数据，在页面的onload里我已经用window.document.writeln()函数将页面内容清楚了，只在页面上打印出了结果，现在是在用IE打开后能显示没问题，结果也是正确的，但我在类库里抓取页面时它不执行页面里的函数，只在执行服务器代码后，将页面传给我，是没有执行过的页面。

porschev 2011-06-09

打赏
举报

回复

LZ表达的我没看懂。。。。

后台DLL里？？？？

不是JS执行后。。。？？？

se365363 2011-06-09

打赏
举报

回复

路过不会

zhgroup 2011-06-09

打赏
举报

回复

把AJAX那部分拿出来，用httpwebrequest/httpwebresponse来模拟客户端提交再分析结果

duyongfeng1985 2011-06-09

打赏
举报

回复

谁给点意见，帮自己顶下……

学习利用抓取股票信息

上一篇博客讲了Linux抓取网页的方式，有curl和wget两种方式，这篇将重点讲Linux抓取网页的实例——抓取google play全球12国的游戏TOP排名要抓取google play游戏排名网页，首先需要分析网页的特点和规律：1、google play游戏排名网页，是一个就“总-分”形式，即一页网址显示若干排名（如24个），有若干个这样的网页组成全部游戏的总排名2、每页网址中，点击每个单独

1 动态抓取技术简介异步更新技术——AJAX AJAX（Asynchronous Javascript And XML，异步JavaScript和XML）的价值在于通过在后台与服务器进行少量的数据交换就可以使网页实现异步更新。这意味着可以在不重新加载整个网页的情况下对网页的某部分进行更新。一方面减少了网页重复内容的下载，另一方面节省了流量，因此AJAX得到了广泛的使用。爬取使用AJAX加载的动态网页里的动态加载的内容有两种动态网页抓取的方法：通过浏览器审查元素解析真实网页地址使用Seleni

本工具可以抓取互联网上的任何网页，包括需要登录后才能访问的页面。对抓取到页面内容进行解析，得到结构化的信息，比如：新闻标题、作者、来源、正文等。支持列表页的自动翻页抓取，支持正文页多页合并，支持图片、文件的抓取，可以抓取静态网页，也可以抓取带参数的动态网页，功能极其强大。用户指定要抓取的网站、抓取的网页类型（固定页面、分页显示的页面等等），并配置如何解析数据项（如新闻标题、作者、来源、正文等），系统可以根据配置信息自动实时抓取数据，启动抓取的时间也可以通过配置设定，真正做到“按需抓取，一次配置，永久抓取”。

你期待已久的Python网络数据爬虫教程来了。本文为你演示如何从网页里找到感兴趣的链接和说明文字，抓取并存储到Excel。（由于微信公众号外部链接的限制，文中的部分链接可能无法正确打开。如有需要，请点击文末的“阅读原文”按钮，访问可以正常显示外链的版本。）需求我在公众号后台，经常可以收到读者的留言。很多留言，是读者的疑问。只要有时间，我都会抽空尝试解答。但是有的留言，乍看起来就不明所以了。例如下面

110,538

社区成员

642,577

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧

+ 用AI写文章