我把某个网页存成了.mht单一Web档案,现在我又想通过这个文件找到Internet网上原来的页面,请问有什么办法可以做到?

oomm 2004-12-22 08:43:56
如题。

就说本页面吧,在IE上点主菜单的“文件”-“另存为”,再文件的保存类型选“Web档案,单一文件(*.mht)”,然后“保存”。这样存盘的页面文件里图象等信息都保留完整,但是麻烦的是我有时还需要找到这个存了档的页面文件在网上的本初原始的网址,就是这个网页本来的URL是在哪里,但查看.mht的原代码似乎也找不出来,请问还有什么好招妙法,可以做到找出MHT档的原本URL所在吗?
...全文
314 24 打赏 收藏 转发到动态 举报
写回复
用AI写文章
24 条回复
切换为时间正序
请发表友善的回复…
发表回复
oomm 2005-01-03
  • 打赏
  • 举报
回复
up
oomm 2004-12-28
  • 打赏
  • 举报
回复
up
honghe1 2004-12-27
  • 打赏
  • 举报
回复
那就自己写一个吧,或者找一个这样的小软件。
oomm 2004-12-27
  • 打赏
  • 举报
回复
靠,应该是常用网页才加入收藏夹呢,只是把某文章或某页面保存下来,不一定非要常去找它的原来URL,但当有这个必要时,就想能通过保存在硬盘上的文件寻出那个URL来了。就这么回事,靠要是凡见着一个有价值的文章的页面就添加到收藏夹里,那不得收藏夹里上万上亿了,也忒二了吧??
honghe1 2004-12-27
  • 打赏
  • 举报
回复
加入收藏夹啊,晕过去。
oomm 2004-12-27
  • 打赏
  • 举报
回复
up
dsclub 2004-12-27
  • 打赏
  • 举报
回复
oomm:其实应该仔细的是你自己吧

你给的那个页面即使没有生命doctype,保存下来(htm或mht)都有doctype声明,请你自己仔细!

另外,我说的是:

一般“另存为”
类似<!-- saved ...-->




只是为了节约上网时间,看更多的帖子!
htm在html和doctype间
mht在doctype前,再定位Content-Location
在CSDN解决问题就是别人给指各方向,然后自己去琢磨!怎么能要求别人全部给做了呢?


我对此帖将不再关注!

oomm 2004-12-27
  • 打赏
  • 举报
回复
回复人: wind0209(风のFeeling) ( ) 信誉:104 2004-12-27 16:03:00 得分: 0

Content-Type:是 text/html;的那个Content-Location:就是了吧。

------------------------------------------

Content-Type:是 text/html的一般有好几个,看来也只有先在其中查找“text/html”,然后在挨个试到底哪个Content-Location是当初的URL了。但是即使这个方法也不见得完全“通用”,你知道某些网页是很特别的,不见得都能找到原始的URL,你多试几个各种网站上的各种页面就会知道我所言不虚了,只通过某几个个别页面就得出结论,还是太仓促和不令人信服了。

不过,看来也没个万全的太好的方法了,上面的方法也就将就了。如果还有高手有很通行的妙法,那请示教!
wind0209 2004-12-27
  • 打赏
  • 举报
回复
Content-Type:是 text/html;的那个Content-Location:就是了吧。
dsclub 2004-12-26
  • 打赏
  • 举报
回复
用浏览器另存下来的东西都会在<!doctype>和<html>之间有类似

<!-- saved from url=3D(0024)http://www.url.com.cn/ =-->

你要url完全可以从这里来取得,<!doctype>和<html>标签在一个页面内出现的不会很多吧?
oomm 2004-12-26
  • 打赏
  • 举报
回复
我试了,用“text/html”来检索,有多个结果。有的页面很麻烦,可以查找到太的的跟“text/html”有关的内容,要一下子就分辨出真正想要的URL还不太容易。
oomm 2004-12-26
  • 打赏
  • 举报
回复
这么说,我是用记事本打开MHT文件,然后靠检索“Content-Type: text/html”字符串来定位搜索源URL了?但要从多个搜索结果里分辨出真正想要的URL也是一个问题呀,有什么规律和窍门吗?
还有,请问,这个方法是通用的吗?
vamzpqde 2004-12-25
  • 打赏
  • 举报
回复
也就是说再保存一次。
vamzpqde 2004-12-25
  • 打赏
  • 举报
回复
你把网页存为mht类型,这没关系。
用IE打开这个mht文件,然后点击“文件->另存为”这次存为“网页全部(*.html;*.html)”即可,这样就可以查看源代码了。一般源代码中都有这个网站的网址。
dsclub 2004-12-25
  • 打赏
  • 举报
回复
其实这个问题的起因是这样的:

是浏览器在你保存网页时把这些注释加在里面的。不光是mht,“另存为”全部htm里面也会有原url的注释块!


不信你保存一个试试。

oomm 2004-12-24
  • 打赏
  • 举报
回复
up
oomm 2004-12-23
  • 打赏
  • 举报
回复
党员干部是比我们一般群众要高,不过这是不是马克斯主义的普遍原理呀?能不能总是很好地与中国革命的具体实践相结合呀?

是不是对所有网页存成的*.mht文件都具有普遍适用性呀?

您放心,结帖时会给你这个好领导好同志高分的,讨好干部的事俺还会做,柳絮马匹都会拍。
oomm 2004-12-23
  • 打赏
  • 举报
回复
up
dsclub 2004-12-22
  • 打赏
  • 举报
回复
对了,忘说了不是用浏览器来打开,使用文本编辑器(记事本或Editplus等)来打开它,看那个代码才管用!!


呵呵,结帖吧
dsclub 2004-12-22
  • 打赏
  • 举报
回复
mht里这个信息吧

比如我刚存的http://cssvault.com

From: <由 Microsoft Internet Explorer 5 保存> Subject: CSS Vault ? The Web's CSS Site Date: Wed, 22 Dec 2004 23:30:59 +0800 MIME-Version: 1.0 Content-Type: multipart/related; type="text/html"; boundary="----=_NextPart_000_0000_01C4E87E.4AF5E9D0" X-MimeOLE: Produced By Microsoft MimeOLE V6.00.2900.2180 This is a multi-part message in MIME format. ------=_NextPart_000_0000_01C4E87E.4AF5E9D0 Content-Type: text/html; charset="utf-8" Content-Transfer-Encoding: quoted-printable Content-Location: http://cssvault.com/ =EF=BB=BF
Forever Geek=20 Holiday Gift Guide.

看到地址了吧
加载更多回复(4)

61,115

社区成员

发帖
与我相关
我的任务
社区描述
层叠样式表(英文全称:Cascading Style Sheets)是一种用来表现HTML(标准通用标记语言的一个应用)或XML(标准通用标记语言的一个子集)等文件样式的计算机语言。
社区管理员
  • HTML(CSS)社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧