关于取webbrowser中网页源文件的N种错误方法(高手请进)
玄之丞 2006-10-20 10:01:35 以下仅为个人意见,请各位高手指正:
方法一: 使用 get_innerHTML 或者 get_outerHTML
得到的webbrowser 解析后的文件,与真实的原文件不符.
大家可以试一个在 建一个htm文件所含以下内容
<table><tr><td></td></tr></table>
取出来比较一下.
==================================================
方法二:使用 NMHTTP 获取
低效.慢且不说,很多页面需要SESSION值或COOKIE,
使用GET方法无法取的.
==================================================
方法三:使用 查看源文件 命令
并没有获取到源文件的内容.
==================================================
方法四:使用DCOM接口中.IPersistStreamInit接口指针,然后把网页写到IStream流中去。
HTML文件是没有问题.
请试一下XML文件,不知是不是我方法有误,XML文件我只能取到一个 '?'
请教如何在webbrowser中取得网页的真实源文件.