社区
HTML/XML
帖子详情
有没有什么简便的方法可以真正完全在内存中解析HTML?
w5meng
2003-08-26 10:22:54
我下载了一个利用MSHTML解析的程序,说是在内存中解析的,但还是要装载HTML到一个DOC里边,其实就是执行了网页的装载,如果网而中有JavaScript:alert()的话,这样的提示对话框在程序执行时也会弹出来。
请问有没有更好的办法直接在内存中处理HTML并得到其内部各种元素,并可对各种元素进行修改,然后得到修改后的结果?就象处理XML那样。
有没有处理过类似的高手呀?帮忙啦!!!
...全文
98
20
打赏
收藏
有没有什么简便的方法可以真正完全在内存中解析HTML?
我下载了一个利用MSHTML解析的程序,说是在内存中解析的,但还是要装载HTML到一个DOC里边,其实就是执行了网页的装载,如果网而中有JavaScript:alert()的话,这样的提示对话框在程序执行时也会弹出来。 请问有没有更好的办法直接在内存中处理HTML并得到其内部各种元素,并可对各种元素进行修改,然后得到修改后的结果?就象处理XML那样。 有没有处理过类似的高手呀?帮忙啦!!!
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
20 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
flashsj
2004-02-07
打赏
举报
回复
http://www.csdn.net/develop/read_article.asp?id=19627
控制下载和执行
microant
2004-01-31
打赏
举报
回复
就你的要求来说最好的方法还是codeguru的lightweight html parser using mshtml里介绍的那个。
自己翻翻看。很短的程序。
Crazy_Abyss
2003-12-15
打赏
举报
回复
4soft@sohu.com
我也要哦
谢谢
yajunmao
2003-11-06
打赏
举报
回复
yajunmao@sohu.com
谢谢
drgnmvpn
2003-10-29
打赏
举报
回复
我正在找这么个东西?
能发给我一份吗?humin29@sina.com
phs520
2003-10-23
打赏
举报
回复
wo ye shi
phs520@21cn.com
蒋晟
2003-10-22
打赏
举报
回复
http://www.csdn.net/Develop/read_article.asp?id=21702
view->source
edit outhtml
seeyard
2003-10-21
打赏
举报
回复
请给我一份参考,正在为这事晕头转向,谢谢.
see1001yard@hotmail.com
songhui
2003-10-20
打赏
举报
回复
您好:我也在相关的问题,没有好的办法,请您给我一份。jason_song2002@163.com
songhui
2003-10-20
打赏
举报
回复
请给我一份。。。谢谢!!!
Garfield
2003-09-07
打赏
举报
回复
关注!我正在做相关事情。。。
bigcat26#163.com ,谢谢。
ruifan
2003-09-06
打赏
举报
回复
to hongbinfan@263.net
Thanks
yvonneye
2003-09-06
打赏
举报
回复
to 不知道
能否也给我一份,谢谢了。
cjwn
2003-09-04
打赏
举报
回复
tanyx(不知道) :
我也要.邮箱是 edta@263.sina.com
谢谢了.
w5meng
2003-09-04
打赏
举报
回复
UP.
ytfr
2003-09-01
打赏
举报
回复
ytgunman1@etang.com
thanks
w5meng
2003-08-27
打赏
举报
回复
wingfancy@5meng.com
谢谢!
蒋晟
2003-08-26
打赏
举报
回复
先禁用脚本么
KB Q266343 PRB: Hosting MSHTML With Scripting Activated Causes Instability
tanyx
2003-08-26
打赏
举报
回复
这个部件我用了7天才完善,怎么给你啊。
蒋晟
2003-08-26
打赏
举报
回复
http://www.csdn.net/develop/read_article.asp?id=19627
控制下载和执行
Python爬虫:
HTML
网页
解析
方法
小结
学过requests库的看到requests-
html
的api应该会很熟悉,使用
方法
基本一致,不同的是使用requests编写爬虫时,要先把网页爬取下来,然后再交给BeautifulSoup等一些
html
解析
库,现在可以直接
解析
了。(4)requests-
html
是比较新的一个库,高度封装且源码清晰,它直接整合了大量
解析
时繁琐复杂的操作,同时支持DOM
解析
和XPath
解析
两种方式,灵活方便,可以尝试。”**在csdn看到过一篇比较好的文章,讲的很实用,大家伙可以移步去看看,链接分享在下方。
Java
中
常用
html
解析
器
可能我们在项目
中
常用Dom
解析
html
,但是以下介绍的
解析
器可能会让你更简单、容易去
解析
html
。另外javaweb
中
常用的dom
解析
是dom4j, 它在web领域
中
地王道;android
中
我们常用的是sax、pull。因为它们更省
内存
。因为不需要将整个XML树读入
内存
后再进行处理,而是通过输入流的方式进行,在这过程
中
会触发相关事件........在这些事件回调
中
我们去做
解析
工作。 1、
Android
中
解析
html
网页
本文主要记录通过网页
解析
得到自己想要的数据,也就是一个简单的爬虫。将使用第三方库jsoup实现,通过第三方库,能够快速方便的
解析
html
。在开始之前,需要具备以下能力: 首先,需要对网页编程有一点了解,知道一个页面的结构,标签的含义,知道
html
网页其实是一种xml格式的文件。如果对这些都了解的话,就可以很方便的进行网页
解析
了,如果不太熟悉,建议先了解一下网页编程。 然后,在使用第三方库之前,最好是
【Python】
html
解析
BeautifulSoup
转自:http://www.cnblogs.com/franknihao/p/6542460.
html
【Python】
html
解析
BeautifulSoup BeautifulSoup bs是个
html
解析
模块,常用来做爬虫? ■ 安装 BeautifulSoup可以通过pip来安装,用pip install beautifulsoup4 即
为什么手机浏览器打不开
html
文件,win7浏览器打不开本地
html
文件的原因及解决
方法
...
今天小编和大家分享深度技术win7系统浏览器打不开本地
html
文件的原因及解决
方法
,相信大家都有遇到过
html
文件打不开,一直显示主页而不是
html
页面,其实很大部分是浏览器设置问题。有什么办法可以解决?针对此疑问,小编告诉大家win7浏览器打不开本地
html
文件解决
方法
。 出现上诉问题的原因有以下几种:1、你的
html
文件内的源码本身存在问题,并不能正确
解析
为
html
页面,尤其是文件头的声明部...
HTML/XML
3,055
社区成员
8,066
社区内容
发帖
与我相关
我的任务
HTML/XML
VC/MFC HTML/XML
复制链接
扫一扫
分享
社区描述
VC/MFC HTML/XML
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章