如何获取Javascript渲染后的HTML源码

lang_csdn 2010-09-05 09:10:56
现在很多网页都是这样的。

如网易博客的
http://blog.163.com/dbylawyer@126/blog/static/1133650472010843320768/?touping

怎么获取评论的内容啊。

网上找到这样的内容,不知道.net有没有类似的东西啊。
-------------------------------------------------------------------------------------------------------
COM,用Internet Explorer 提供的com组件。

解决方案:

突破了这层关系,下面的就水到渠成了。

在python下,对IE封装的比较完善而且文档齐全的就是PAMIE(http://sourceforge.net/projects/pamie),它的本意是作为自动化测试工具使用的。

需要注意的是,在页面加载完之后需要留出一定时间来让页面的js代码执行渲染完成后再提取html代码。这个时间需要通过试验确定。

需要注意的是:
前面所述的利用PAMIE来获取渲染后的html内容的方法是可行的,但是缺点是效率非常低。对于最常见的ajax动态内容页面来说,最直接的方法还是构造ajax请求,来获取相应内容。这样效率很高,而且返回数据都是结构化的xml或者json数据,比html更容易处理。
...全文
1055 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
lang_csdn 2010-09-06
  • 打赏
  • 举报
回复
看看,有没有人,帮忙。
lang_csdn 2010-09-05
  • 打赏
  • 举报
回复
IE开发者工具,可以获取评论的输出。不知道如何实现这样的功能。
lang_csdn 2010-09-05
  • 打赏
  • 举报
回复
查了一下,资料,之前就有人在问题,好像比较困难。

http://topic.csdn.net/u/20090305/21/23479857-9e37-4ae1-89c7-e2c2ae3279dd.html
捷哥1999 2010-09-05
  • 打赏
  • 举报
回复
可以用.net 的webbrowser控件访问页面,然后获取页面的内容,然后解析?

110,552

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧