社区
Java EE
帖子详情
请问我想把mhtml文件转换成xml格式要怎么做?
chaohui10
2008-03-26 02:03:05
rt
...全文
112
2
打赏
收藏
请问我想把mhtml文件转换成xml格式要怎么做?
rt
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
2 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
Xstream for Json 完整范例(绝对好用)
很多人都用过Xstream对
XML
生成和读取,但是对Json的序列化和对象化,还很少有人知道。只需两个类包,就可以比较好的完成了,还不试试……
Collector资料收集管理器
如果你喜欢这个免费软件,请MAIL一封信以对我的支持。 Collector资料收集管理器 V4.1 Collector资料收集管理器能够把您收集的文本、网页、图片等资料都存放在一起,统一管理的绿色免费软件。 使用系统图标,支持大容量数据库,支持拖拉操作,采用视窗风格,目录树结构管理,所见即所得的设计理念,操作方便。 上网浏览网页时允许通过定制IE的右键菜单来方便收集网页、图片和文字。 本软件特色是可以直接把整个网页保存成MHT或JPG
格式
的
文件
,独特的收集网页图片模式。 本地导入速度一流,比其它同类的软件都快很多(可以在网上找一个同类软件导入过万条记录比较)。 是一个非常实用的电子书制作工具;可以把数据库
文件
转换成
可执行
文件
(*.exe),也可以制作成CHM
文件
。 您可以给书籍
文件
或者节点设置密码。 可以实时备份数据库,可查看修改记录,保证你的数据安全。 免费分享数据库。 附带一个例子数据库,里面有使用方法。 讨论Collector 资料收集管理器的QQ群号码 27585577 论坛 http://14500001.blog.163.com/ http://user.qzone.qq.com/14500001 V4.1版本 更新日期 2010-03-20 更新内容 1、调整菜单; 2、修正批量改节点功能; 3、添加另存数据库功能; 4、修正对实时备份数据库的判断。 更新日期 2010-01-04 更新内容 1、升级数据库版本,支持更多功能; 2、使用SQLite数据库(RTB)进行实时备份数据库,数据库(HDF)打开始加载。 2、全新界面,可改变布局和改变皮肤; 3、查询状态下可修改数据; 4、EXE电子书
文件
可自定义图标。 更新日期 2009-03-24 21:00:00 更新内容 1、修正新建数据库的一个问题; 2、改写保存数据库方式; 更新日期 2009-02-21 23:45:00 更新内容 1、修正不允许运行多个Collector时,程序最小化无法密码保护问题; 2、修正制作EXE电子书的一个问题; 3、添加收集网页时先对数据进行校验再导入,防止导入空数据破坏节点; 4、修正判断OFFICE是否安装的问题。 2008-10-15 16:35:00 更新内容 1、一些微小的改动 2、修正软件在数据库只读环境下导出的问题 2008-08-25 更新内容 1、添加翻页阅读; 2、添加批量改名; 3、添加闹钟提醒; 4、添加最小化到任务栏; 5、添加保存时检查索引。 2008-08-01 16:10:00 更新内容 1、修正由于空
文件
夹无法生成CHM电子书的问题; 2008-07-17 更新内容 1、修正导出CHM
文件
每个目录的连接。 2008-07-10 更新内容 1、修正判断是否安装OFFICE的问题; 2、优化收集网页(htm
格式
)代码。 2008-06-26 14:30:00 更新内容 1、修正收集某些网页时无法浏览的问题; 2008-06-19 14:15:00 更新内容 1、修正收集网页时某些图片无法显示问题; 2、修正收集图片排序问题; 更新日期 2008-05-09 14:00:00 更新内容 1、修正新建数据库新建
文件
提示密码问题; 更新日期 2008-04-24 15:30:00 更新内容 1、修正新建数据库导入本地
文件
提示密码问题; 2、修正无法打开只读属性
文件
的问题; 3、修正回收站无法导出CHM问题; 4、...... 更新日期 2008-04-16 15:00:00 更新内容 1、更换文本
文件
编辑,支持语法高亮显示; 2、添加网页编辑功能; 3、使用软件自身
做
电子书执行
文件
,大大减少软件大小。 4、..... 更新日期 2008-03-14 16:00:00 更新内容 1、支持OFFICE2007最新的XLSX、DOCX、PPTX
格式
文件
。 2、添加回收站功能。 3、添加节点排序功能。 4、修正一个加密问题。 5、修正按内容搜索后,切换到编辑窗口后不能编辑。 更新日期 2008-03-04 10:30:00 更新内容 1、添加读书模式(文本类型
文件
); 2、添加自定义调用外部编辑器编辑功能(文本类型
文件
); 3、修正修改节点(
文件
夹)备注会损坏节点图标问题; 4、添加记忆悬浮窗位置功能; 5、修正收集图片时收集窗体无法最前端功能(IE7); 6、加快调用QQ抓图速度; 7、修改导入本地
文件
不是在选中节点下的问题 更新日期 2008-02-23 14:00:00 更新内容 1、修改截图,使用最新的QQ截图功能; 2、修正加载数据库时的一个问题; 3、判断是否使用OFICE2007,对OFFICE2007,不再使用IE打开方式。 更新日期 2008-02-01 15:50:00 更新内容 1、修正打开数据库CPU占用率很高的问题 2008-01-25 11:00:00 更新内容 1、添加...... 2、添加抓图到文本
文件
功能,保存时需要转为RTF
格式
。 3、修正只读打开还能添加数据的问题。 2007-12-29 1、添加书签保存、管理功能 2、修正一个损坏节点问题 3、添加编辑文本的一些功能 4、添加数据库列表功能 5、修正一些小问题 更新日期 2007-12-21 1、修正网页滚动抓图问题 更新日期 2007-12-15 1、添加最小化到托盘选项 2、添加启动显示悬浮窗选项 3、添加更改软件所在
文件
夹图标选项 4、添加判断导入网页路径是否重复功能 5、添加支持从网页(暂时只文本)或图片拖拉到悬浮窗保存 6、修改软件内部拖拉功能(按Ctrl或Alt和不按功能不同) 7、修改软件启动的语言为上次选择的语言 8、添加关闭程序不提示备份选项 9、添加导入TXT
文件
取第一行内容为标题功能 更新内容(重要提示:请及时备份数据) 2007-11-18 11:25:00 修正一个导入
文件
会损坏节点问题; 修正修改节点密码; 修正....... 2007-10-16 1、减少IE右键菜单(需重新创建到IE浏览器右键菜单才能生效) 2、添加收集时可编辑节点信息。 2007-10-10 15:55:00 1、添加word
文件
显示常用、
格式
工具栏及不显示审阅工具栏 2、添加Excel、PowerPoint
文件
显示常用、
格式
工具栏 2007-09-16 16:00:00 美化界面 自动提示版本更新 修正编辑文本保存的问题(之前是OK的) 2007-09-11 13:50:00 修正节点标题的复制粘贴问题 修正密码框焦点问题 修正菜单导入
文件
时只有exe
文件
的错误(之前是OK的) 2007-09-09 修正显示目录栏宽度问题; 修正自身复制监视剪贴板的问题; 修正收集网页图片的一个小问题。 V2.9 2007-09-06 17:00:00 添加调用OFFICE打开EXCEL、WORD、PowerPoint
文件
功能,而且修改后能自动回存到数据库。 修正浏览文本时TAB键不可用的问题。 添加最前端按钮。 添加直接调用QQ和作者交流; 2007-08-24 13:25:00 添加节点有附件时图标异样显示 2007-08-15 10:50:00 修正新建一个数据库时不能新建一个目录或
文件
2007-08-10 15:45:00 1、添加修改文本的一些功能。 2、修正文本状态下设标题错误问题; 2.85 1、修正在VISTA下MHT
格式
收集网页无内容显示问题。 2.84 1、修正在VISTA下无法使用问题。 2.83版本 1、修正一些搜索问题; 2、添加新建根目录
文件
菜单。 2.82版本 1、修正在搜索数据库时导入本地
文件
会导致节点损坏的问题; 2、加快加载数据库。 3、改删除节点快捷方式为DEL键。 2.81版本 1、修正合并数据库会导致数据库损坏的问题; 2.8版本 1、添加内嵌打开、修改、保存EXCEL、WORD、PowerPoint
文件
功能(需要安装OFFICE); 2、添加内嵌打开PDF
文件
功能(需要安装PDF软件); 3、修正繁体下的一些问题。 4、添加图片预览功能; 5、修正一个会导致数据库损坏的问题; 6、修正几个小问题。 2.7版本 1、修改下载功能,添加HTTP代理模式; 2、添加标题着色功能; 3、修改收集网页(Htm)
格式
方法; 4、右键收集可以选择导入当前目录; 2.6版本 1、添加下载数据库功能。 2、创建或清除快捷方式无须重新打开ie。 3、修改加载图标算法,超速打开数据库。 打开数据库后请使用修复图标功能,再次打开才能体现。 2.5版本 1、添加附件功能; 2、自定义抓图压缩率。 3、添加下载数据库功能。 4、创建或清除快捷方式无须重新打开ie。 2.4版本 1、添加最小化密码保护; 2、自定义滚动抓图刷新时间。 3、修正导出有重名的
文件
的问题。 4、修正查询HTM
格式
文件
问题。 5、修正下载问题。 2.3版本 1、添加制作EXE
格式
电子书功能; 2、修正节点标题粘贴问题。 3、修正合并2.2版本数据库HTM
格式
的
文件
无法浏览的情况。 4、修改TXT
文件
被修改转为RTF的提示。 .... 2.2版本 1、修改保存网页HTM方式; 2、添加选择多张图片保存成HTM方式; 3、添加简单的图像编辑功能; 4、修改数据库结构(打开旧版本数据库会自动转换),添加
文件
备注; 注意:新版本数据库不能使用旧版本软件打开。 5、添加收集网页时自动保存功能; 6、...... 2.1版本 1、修改抓图方式,改为调用QQ链接库抓图(无需安装QQ); 2、修正在2003下抓网页为JPG图片不全问题; 3、修正在XP下导入网页图片节点添加问题; 4、搜索状态下添加导出功能; 5、添加数据库所在磁盘空间不足时导入过多数据提示; 6、修改在线升级; 7、添加节点手动排序; 8、加大悬浮窗口; 9、标题栏可以使用系统右键菜单(剪切粘贴复制); 10、在菜单中添加书签功能; 11、在菜单中添加导入功能; 12、添加清除软件在系统中的所有痕迹功能; 2.0版本 1、修正在WIN98下程序在根目录运行出错的问题; 2、修正在繁体系统下语言版本的问题; 3、添加在文档中插入图片和插入附件功能; 4、添加在线升级功能; 5、添加重要更能:支持所有
文件
类型; 6、添加自定义热键功能; 7、添加多种选项把保存网页成图片。 8、修改抓图模式。 9、修正一些错误。 1.9版本 1、添加导出数据生成程序数据库HDF
格式
功能。 2、修正合并数据库没有考虑到合并的数据库密码问题; 3、修正旧版本选择不压缩的数据库转为新版本的数据库浏览时数据出错的问题。 4、把hha.dll和hhc.exe这两个
文件
打包进执行
文件
。 5、添加制作CHM
文件
选项。 6、美化菜单; 使用技巧 1、务必要看例子数据库的使用方法。 2、浏览网页如果乱码,请取消使用流浏览,IE5.0版本不支持MHT
文件
格式
请使用IE5.5或以上版本。 3、最小化可以双击右下角的图标来显示主窗体。 4、收集网页数据时最好先把一个数据库关联到我的最爱,这样就可以在软件没有运行的状态下点击IE右键菜单直接启动软件导进设好的数据库里面,无须先启动软件。注意:软件可以同时运行多个,收集网页时请只运行一个。 5、如果你
想
修改左边目录
文件
的标题,可以把在右边选中的文字拖拉过去就行了,文本网页都可以。 6、请经常备份数据库。 7、如果没有图片的网页不推荐保存成MHT
格式
,因为MHT
格式
文件
大,而且打开耗内存(这是IE的问题)。 8、如果你删除了脚本
文件
,请重新创建IE快捷方式。 1.8版本 1、添加合并数据库功能; 2、添加是否允许运行多个程序功能; 3、添加选择压缩方式功能; 4、优化内存使用; 5、修正从菜单功能中导进
文件
数据对不上的问题; 6、修正添加无内容
文件
时的BUG; 7、添加只读打开功能(要设置密码); 1.7版本 1、修改数据库
格式
,添加一些数据库信息,程序会把旧数据库自动转换到新版本的数据库
格式
,在同目录下面有后缀名为OLD的原数据库的备份
文件
,以防万一出错。 2、新版本已经把Collector.ini放到可执行
文件
的当前目录,而且新版本还有一个language
文件
夹和desktop.ini、Collector.ico两个
文件
。 3、添加清除本软件在注册表的信息,如果你不
想
用本软件可以选中清除软件痕迹菜单。 4、添加生成CHM
格式
功能(需要把hha.dll和hhc.exe这两个
文件
放在和Cellector.exe同一目录) 5、添加记录导进
文件
的路径功能。 6、添加书签功能,没有限制书签数目,搜索时也可以使用。 7、添加导入和其它一些菜单。 8、添加一些小功能和修正一些错误。 在例子数据库里添加了生成CHM
文件
和把网页抓图保存成JPG
文件
的源代码,希望各位指点。 1.6版本 1、添加浏览网页时把网页抓图保存成JPG
文件
功能(针对单框架网页); 2、添加设定数据库密码功能; 3、添加热键抓图功能(ALT+A); 4、添加最小化窗体或显示功能(ALT+Z); 5、修正把大网页保存成MHT
文件
出错的问题; 1.5版本 1、添加浏览网页时放大网页功能; 2、修正由于输入法引起的一个错误; 3、优化收集网页代码,改为直接使用内存流,加快导入速度。 1.4版本 1、重写使用IE右键收集网页的代码,能很好的收集网页(可以和其它软件对比看看结果),大大加强了IE收集功能, 2、添加把网页保存成文本功能, 3、添加支持RTF
文件
, 4、添加备份数据功能, 5、大幅度提高了打开数据库的速度, 6、修正了一次性导进超过5万条记录出错的BUG, 注意:1.4版本IE收集功能改变太大,如果使用了之前的版本 第一,删除Collector.exe根目录下面的*.htm
文件
,替换使用新版本的Collector.exe
文件
。 第二,手工删除IE右键带☆号的菜单(使用其它软件),运行本程序再重新创建IE右键菜单。 默认支持以下类型 .HTM;.
HTML
;.HTX;.HTW;.MHT;.M
HTML
;.S
HTML
;.
XML
;.EML;.SWF;.PHP;.TXT;.RTF;.JPEG;.JPG;.GIF;.BMP;.TIFF;.PCX;.ICO;.CUR;.PNG;.WMF;.EMF;.TGA;.PXM;.TIF;.XIF;.JPE;.JIF;.JFIF;.DCX;.ANI;
html
表单文本转换,把
HTML
表单提交的数据转化成
XML
文件
通常,在asp中进行的form表单提交的数据都被写进数据库管理系统中去,如果你
想
要你的数据是方便携带的数据,你可以把它写进一个
XML
文件
中去。这种方法是跨平台的,因此你所收集的信息不需要进行转换。为了实现上面的
想
法,你必须先利用Microsoft
XML
DOM建立一个
XML
文件
,Microsoft
XML
DOM对象有一个扩展对象库,它可以创建组成
XML
文件
所需要的元素、属性、属性值。当
XML
DOM...
实现
html
转
Xml
最近在
做
一些网页信息采集的工作,说通俗点就是爬虫工具,要监控页面中某一部分内容是否发生变化。起初考虑用正则表达式去匹配网页源码,经过咨询有经验人士,推荐使用xpath去获取页面内容能获得更好的效率。但是对于
html
这种宽松语法要求的语言来说,不可能100%地完全符合
xml
标准,那么就没法使用xpath,说得更直接点就是:不能把
html
源码直接加载到
xml
document中。为了使用xpath,只能
如何使用Java解析
xml
文件
本文参考两篇博客整理而成,http://blog.csdn.net/u014352836/article/details/46646777,http://blog.csdn.net/zflovecf/article/details/78908788
XML
现在已经成为一种通用的数据交换
格式
,平台的无关性使得很多场合都需要用到
XML
。本文将详细介绍用Java解析
XML
的四种方法。...
Java EE
67,538
社区成员
225,852
社区内容
发帖
与我相关
我的任务
Java EE
J2EE只是Java企业应用。我们需要一个跨J2SE/WEB/EJB的微容器,保护我们的业务核心组件(中间件),以延续它的生命力,而不是依赖J2SE/J2EE版本。
复制链接
扫一扫
分享
社区描述
J2EE只是Java企业应用。我们需要一个跨J2SE/WEB/EJB的微容器,保护我们的业务核心组件(中间件),以延续它的生命力,而不是依赖J2SE/J2EE版本。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章