webbrowser获取淘宝最终源码

老秋先生 2016-09-03 09:46:34
现在在做一个程序,是获取淘宝的搜索结果的网页抓取问题。

现在使用webbrowser,获取回来的商品链接中是不包含spm值的,但是在360浏览器 或者 谷歌浏览器中,使用右键->审查元素时,是能够得到整个网页最终的源码(包含spm值的)

所以现在非常苦恼的问题是希望webbrowser能够像360浏览器或者谷歌浏览器的审查元素一样,可以得到最终的源码。

或者是IE有没有可以调用到“复制快捷方式”的方法,因为右键复制快捷方式也是能够得到最终链接,在线等·~~~~~~~
...全文
263 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
老秋先生 2016-09-11
  • 打赏
  • 举报
回复
引用 5 楼 sp1234 的回复:
要注意,我所写的 window.document.body.outerHTML 是 javascript 代码,并不是 webbrowser 的属性以及衍生代码。 这是最本质的区别!
用你的方法找到了,因为我之前确实也一直用的是控件的body.OutHtml 所以得到的并不是最终的,完成了,在js里获得html代码后随便赋值到一个input里 然后取其值
  • 打赏
  • 举报
回复
要注意,我所写的 window.document.body.outerHTML 是 javascript 代码,并不是 webbrowser 的属性以及衍生代码。 这是最本质的区别!
threenewbee 2016-09-04
  • 打赏
  • 举报
回复
通过ajax方式,网站可以随时修改网页的内容,比如说一个实时更新的股票信息,或者一个网页的时钟,只要你不关闭浏览器,内容就永远更新,没有“最终”一说。
我叫小菜菜 2016-09-04
  • 打赏
  • 举报
回复
页面说到底就是文本,格式化的文本,XML文本。 只要你技术足够好,那肉眼能够看到的,通过代码都能获取到。获取不到,只能说明技术不到家。 “审查元素”其实就是浏览xml文本源码而已。直接操作document.Text就行了啊。
  • 打赏
  • 举报
回复
当然,作为一个 Web 程序员,你肯定需要学会使用至少一种 http 调试器。而通过这个工具,你可以获得几十个、上百个 http Response 文本内容。你想找的淘宝网页加载时的一部分静态内容,都可以在里边找到。
  • 打赏
  • 举报
回复
你可以使用 webbrowser 运行脚本来返回最新页面内容。例如 window.document.body.outerHTML

110,568

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧