有没有什么简便的方法可以真正完全在内存中解析HTML？

w5meng 2003-08-26 10:22:54

我下载了一个利用MSHTML解析的程序，说是在内存中解析的，但还是要装载HTML到一个DOC里边，其实就是执行了网页的装载，如果网而中有JavaScript:alert()的话，这样的提示对话框在程序执行时也会弹出来。

请问有没有更好的办法直接在内存中处理HTML并得到其内部各种元素，并可对各种元素进行修改，然后得到修改后的结果？就象处理XML那样。

有没有处理过类似的高手呀？帮忙啦！！！

...全文

98 20 打赏收藏转发到动态举报

写回复

20 条回复

切换为时间正序

请发表友善的回复…

发表回复

flashsj 2004-02-07

打赏
举报

回复

http://www.csdn.net/develop/read_article.asp?id=19627
控制下载和执行

microant 2004-01-31

打赏
举报

回复

就你的要求来说最好的方法还是codeguru的lightweight html parser using mshtml里介绍的那个。
自己翻翻看。很短的程序。

Crazy_Abyss 2003-12-15

打赏
举报

回复

4soft@sohu.com
我也要哦
谢谢

yajunmao 2003-11-06

打赏
举报

回复

yajunmao@sohu.com
谢谢

drgnmvpn 2003-10-29

打赏
举报

回复

我正在找这么个东西?
能发给我一份吗?humin29@sina.com

phs520 2003-10-23

打赏
举报

回复

wo ye shi
phs520@21cn.com

蒋晟 2003-10-22

打赏
举报

回复

http://www.csdn.net/Develop/read_article.asp?id=21702
view->source
edit outhtml

seeyard 2003-10-21

打赏
举报

回复

请给我一份参考,正在为这事晕头转向,谢谢.
see1001yard@hotmail.com

songhui 2003-10-20

打赏
举报

回复

您好：我也在相关的问题，没有好的办法，请您给我一份。jason_song2002@163.com

songhui 2003-10-20

打赏
举报

回复

请给我一份。。。谢谢！！！

Garfield 2003-09-07

打赏
举报

回复

关注！我正在做相关事情。。。

bigcat26#163.com ，谢谢。

ruifan 2003-09-06

打赏
举报

回复

to hongbinfan@263.net
Thanks

yvonneye 2003-09-06

打赏
举报

回复

to 不知道
能否也给我一份，谢谢了。

cjwn 2003-09-04

打赏
举报

回复

tanyx(不知道) :
我也要.邮箱是 edta@263.sina.com
谢谢了.

w5meng 2003-09-04

打赏
举报

回复

UP.

ytfr 2003-09-01

打赏
举报

回复

ytgunman1@etang.com
thanks

w5meng 2003-08-27

打赏
举报

回复

wingfancy@5meng.com

谢谢！

蒋晟 2003-08-26

打赏
举报

回复

先禁用脚本么
KB Q266343 PRB: Hosting MSHTML With Scripting Activated Causes Instability

tanyx 2003-08-26

打赏
举报

回复

这个部件我用了7天才完善，怎么给你啊。

蒋晟 2003-08-26

打赏
举报

回复

http://www.csdn.net/develop/read_article.asp?id=19627
控制下载和执行

学过requests库的看到requests-html的api应该会很熟悉，使用方法基本一致，不同的是使用requests编写爬虫时，要先把网页爬取下来，然后再交给BeautifulSoup等一些html解析库，现在可以直接解析了。（4）requests-html 是比较新的一个库，高度封装且源码清晰，它直接整合了大量解析时繁琐复杂的操作，同时支持DOM解析和XPath解析两种方式，灵活方便，可以尝试。”**在csdn看到过一篇比较好的文章，讲的很实用，大家伙可以移步去看看，链接分享在下方。

可能我们在项目中常用Dom解析html，但是以下介绍的解析器可能会让你更简单、容易去解析html。另外javaweb中常用的dom解析是dom4j，它在web领域中地王道；android中我们常用的是sax、pull。因为它们更省内存。因为不需要将整个XML树读入内存后再进行处理，而是通过输入流的方式进行，在这过程中会触发相关事件........在这些事件回调中我们去做解析工作。 1、

本文主要记录通过网页解析得到自己想要的数据，也就是一个简单的爬虫。将使用第三方库jsoup实现，通过第三方库，能够快速方便的解析html。在开始之前，需要具备以下能力：首先，需要对网页编程有一点了解，知道一个页面的结构，标签的含义，知道html网页其实是一种xml格式的文件。如果对这些都了解的话，就可以很方便的进行网页解析了，如果不太熟悉，建议先了解一下网页编程。然后，在使用第三方库之前，最好是

转自：http://www.cnblogs.com/franknihao/p/6542460.html 【Python】 html解析BeautifulSoup BeautifulSoup 　　bs是个html解析模块,常用来做爬虫？　　■　　安装　　BeautifulSoup可以通过pip来安装，用pip install beautifulsoup4　即

今天小编和大家分享深度技术win7系统浏览器打不开本地html文件的原因及解决方法，相信大家都有遇到过html文件打不开，一直显示主页而不是html页面，其实很大部分是浏览器设置问题。有什么办法可以解决？针对此疑问，小编告诉大家win7浏览器打不开本地html文件解决方法。　　出现上诉问题的原因有以下几种：1、你的html文件内的源码本身存在问题，并不能正确解析为html页面，尤其是文件头的声明部...

3,055

社区成员

8,066

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章