请问前辈们"保存全部网页"怎么实现?

j1223jesus 2010-11-11 08:26:28

最近在尝试用HtmlView做浏览器,现在做到保存网页这一块,通过getdocumentHTML获取了网页源码,保存html估计直接保存源码就可以了,问题是怎么获取要保存的网页的所有资源(图片,css这些吧),然后再保存目录下生成一个文件夹保存这些资源.
谢谢前辈们帮忙~

...全文

97 2 打赏收藏转发到动态举报

写回复

2 条回复

切换为时间正序

请发表友善的回复…

发表回复

j1223jesus 2010-11-11

打赏
举报

回复

很有用,谢谢

jacky_qiu 2010-11-11

打赏
举报

回复

给个链接，你看能够有用！
http://www.codeproject.com/KB/shell/iesaveas.aspx

本文实例讲述了Python实现抓取HTML网页并以PDF文件形式保存的方法。分享给大家供大家参考，具体如下：一、前言今天介绍将HTML网页抓取下来，然后以PDF保存，废话不多说直接进入教程。二、准备工作 PyPDF2的安装使用（用来合并PDF）： PyPDF2版本：1.25.1 https://pypi.python.org/pypi/PyPDF2/1.25.1 或 https://gi...

一静态网页 (1)静态网页概述在网站设计中，纯粹HTML（标准通用标记语言下的一个应用）格式的网页通常被称为“静态网页”，静态网页是标准的HTML文件，它的文件扩展名是.htm、.html，可以包含文本、图像、声音、FLASH动画、客户端脚本和ActiveX 控件及Java小程序等。静态网页是网站建设的基础，早期的网站一般都是由静态网页制作的。静态网

所谓的动态网页，是指跟静态网页相对的一种网页编程技术。静态网页，随着html代码的生成，页面的内容和显示效果就基本上不会发生变化了——除非你修改页面代码。而动态网页则不然，页面代码虽然没有变，但是显示的内容却是可以随着时间、环境或者数据库操作的结果而发生改变的。——来源百度百科动态网页具有减少工作量、内容更新快、可完成功能多等特点，被很多公司所采用，比如狗东、某宝、某瓣、某乎等等。

进入信息时代以来，很多数据都需要配套软件协助处理，这样可以解决传统方式带来的管理困扰。比如耗时长，成本高，维护数据困难，数据易丢失等缺点。本次使用数据库工具MySQL和编程技术JSP开发的布卡维纳红酒网页，可以实现目标用户群需要的功能，其中管理员管理产品，管理产品类型，管理公告和用户。用户查看产品，收藏产品，对产品发布留言信息，查看公告。总之，布卡维纳红酒网页是基于计算机进行数据的处理，则可以短时间内批量完成数据的管理，就连基本的数据录入，更改错误的数据，统计数据等操作要求都可以轻松完成，这样的系统的运用

对于数据分析师来说，数据获取通常有两种方式，一种是直接从系统本地获取数据，另一种是爬取网页上的数据，爬虫从网页爬取数据需要几步？总结下来，Python爬取网页数据需要发起请求、获取响应内容、解析数据、保存数据共计4步。

3,055

社区成员

8,075

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章