如何分析HTML文件,生成一棵标记树?

ChipHead 2002-12-09 05:56:24
我想实现自动格式化HTML文件的功能。也就是说,能够自动把任意HTML文件格式化为自动缩进的格式,例如:
<HTML>
<BODY>
<TABLE>
<TR>
<TD>
<P>
第一列
</P>
</TD>
......
</TR>
......
</TABLE>
</BODY>
</HTML>

为了实现这个功能,必须能够分析HTML文件,取出其中每一个标记,并创建一棵标记树。可是,由于存在单引号和双引号,以及它们的嵌套使用,要实现这个功能就有些困难了。

那位高人有比较好的算法?
...全文
59 9 打赏 收藏 转发到动态 举报
写回复
用AI写文章
9 条回复
切换为时间正序
请发表友善的回复…
发表回复
shadow06 2003-01-07
  • 打赏
  • 举报
回复
楼上的大哥,给我也发一份好吗,谢谢。
Shadow06@263.net
ChipHead 2002-12-12
  • 打赏
  • 举报
回复
php我不会,我用Delphi的。不过我想核心算法应该是一样的。谢了。
yk990@hotmail.com
skywatcher 2002-12-11
  • 打赏
  • 举报
回复
容易,我也正准备写呢,把你的E-mail给我,我写好了给你发?对了,你要用什么解析啊,我可能用php
ChipHead 2002-12-11
  • 打赏
  • 举报
回复
我不是需要工具,我需要算法(来实现这些工具的功能)。没有人能帮我吗?
wanghr100 2002-12-10
  • 打赏
  • 举报
回复
HTML-Kit 292 Beta 4

http://www.skycn.com/soft/449.html

软件介绍:
让你在一个简单易用的环境里编辑、格式化、校验、预览、发布 HTML文档, 该软件可以直接指出错误所在并可选择自动更新错误.其他的特点还有支持拖放的全功能编辑器, 语法加亮等。

wanghr100 2002-12-10
  • 打赏
  • 举报
回复
UltraEdit中的HTML Tidy是一个很棒的格式化、检查和整理HTML代码的工具。当使用该功能时将生成一个标题为“** HTML Tidy Output **”的新文件用来显示检查到的任何错误或警告,我们只需用鼠标双击某错误或警告即可将光标定位到原文件的相应位置,这样可以交互完成HTML文档的检查和整理。

http://download.sina.com.cn/scgi/detail.pl?s_id=432
flmn 2002-12-10
  • 打赏
  • 举报
回复
参考xml dom
ChipHead 2002-12-10
  • 打赏
  • 举报
回复
我就是想自己实现这个功能啊!

因为如果能创建一棵树,还可以衍生出其他很多应用,例如HTML语法检查、Robot Spider之类……
方工 2002-12-09
  • 打赏
  • 举报
回复
HTML DOM 本来就是一个树,自己解析源文件难度相当大。
不如现装入html到浏览器,让DOM自动解析。
DW和其他可视工具已经有这个功能。

61,112

社区成员

发帖
与我相关
我的任务
社区描述
层叠样式表(英文全称:Cascading Style Sheets)是一种用来表现HTML(标准通用标记语言的一个应用)或XML(标准通用标记语言的一个子集)等文件样式的计算机语言。
社区管理员
  • HTML(CSS)社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧