求教:Chrome浏览器如何保存网页元素到本地?有没有C++的办法?

bazzi2011 2018-11-29 09:47:03
Chrome内核浏览器可以通过【右键--->网页另存为】把网页保存下来,通常会保存为一个文件夹和若干个html文件;文件夹中有网页的图片和样式表之类的文件。

我现在的项目需要解析网页中的部分数据,也就是需要网页的保存下来的html文件。

请问Chrome怎样能把网页的html文件保存在本地?

我知道IE可以通过微软提供的API实现网页的提取,IE浏览器可以利用句柄获取其IHTMLDocument2 DOM对象。但IE基本没人用了。

那么Chrome浏览器有没有类似的API或者接口可用啊????
...全文
588 5 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
蒋晟 2018-11-30
  • 打赏
  • 举报
回复
用Selenium的话想要某个网页自己Navigate然后等下载完就行了。不过你只能等它下载完之后再去解析网页,没法自己下载控制下载过程。 Chrome Embedded Framework倒是让你控制下载过程,不过方法是让你自己写下载代码,没有像IE那样提供API让你去翻默认的下载器下载的文件。而且网页解析功能基本没有。如果你不想去访问http层的数据(http only cookie之类)只要解析DOM的话,还不如用Selenium。
bazzi2011 2018-11-29
  • 打赏
  • 举报
回复
引用 1 楼 蒋晟 的回复:
没有
解析网页可以用Selenium
没有获得文件的接口,你自己在程序里放Chrome Embedded Framework的话,可以自己写RequestHandler,这样网页里的图像、css资源的下载都是你自己来做,也就没有获得文件的问题了。


用Selenium解析得首先有这个网页才行的吧?

实际上我就是想用代码把 【右键-->网页另存为】 这步给实现而已。难道Chrome真的没有这之类的方法?
蒋晟 2018-11-29
  • 打赏
  • 举报
回复
没有 解析网页可以用Selenium 没有获得文件的接口,你自己在程序里放Chrome Embedded Framework的话,可以自己写RequestHandler,这样网页里的图像、css资源的下载都是你自己来做,也就没有获得文件的问题了。
bazzi2011 2018-11-29
  • 打赏
  • 举报
回复
引用 3 楼 smwhotjay 的回复:
右键-->网页另存为 就是个爬虫。get url 区别在于浏览器会运行脚本得到最终显示结果。


是啊,其实我就是想得到这个爬虫。这个爬虫不知道怎么写,也不知道c++有无方法?
或者必须用JS?或者Python能写?
smwhotjay 2018-11-29
  • 打赏
  • 举报
回复
右键-->网页另存为 就是个爬虫。get url 区别在于浏览器会运行脚本得到最终显示结果。

16,548

社区成员

发帖
与我相关
我的任务
社区描述
VC/MFC相关问题讨论
社区管理员
  • 基础类社区
  • AIGC Browser
  • encoderlee
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

        VC/MFC社区版块或许是CSDN最“古老”的版块了,记忆之中,与CSDN的年龄几乎差不多。随着时间的推移,MFC技术渐渐的偏离了开发主流,若干年之后的今天,当我们面对着微软的这个经典之笔,内心充满着敬意,那些曾经的记忆,可以说代表着二十年前曾经的辉煌……
        向经典致敬,或许是老一代程序员内心里面难以释怀的感受。互联网大行其道的今天,我们期待着MFC技术能够恢复其曾经的辉煌,或许这个期待会永远成为一种“梦想”,或许一切皆有可能……
        我们希望这个版块可以很好的适配Web时代,期待更好的互联网技术能够使得MFC技术框架得以重现活力,……

试试用AI创作助手写篇文章吧