社区
非技术区
帖子详情
如何分析并判断一个HTML文件的所有<>中的标记是否合法,并且成对出现??????
appow
2002-01-25 10:18:04
如何分析并判断一个HTML文件的所有超文本标记是否合法??????
...全文
608
11
打赏
收藏
如何分析并判断一个HTML文件的所有<>中的标记是否合法,并且成对出现??????
如何分析并判断一个HTML文件的所有超文本标记是否合法??????
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
11 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
appow
2002-01-25
打赏
举报
回复
JAVA中没有现成的类库吗?
haichuang
2002-01-25
打赏
举报
回复
那你就要建立一个合法标签表进行一一对照比较了!
appow
2002-01-25
打赏
举报
回复
以上所言即是,那如果我想知道HTML的标记是不是合法的呢?比如<tttt>在HTML中是不会被解析的呀
gzgangster
2002-01-25
打赏
举报
回复
in = new StringReader(pageContent.toString());
chr = in.read();
while(chr!=-1){/**主循环**/
chr = in.read();
if(chr=='<'){/**发现一个TAG并开始处理**/
chr = in.read();
while(chr!='>'){
if(chr=='<')
return false;/**没有成对出现**/
chr = in.read();
}
}
return ture;
你去试试,希望能对你有用.
lyneville
2002-01-25
打赏
举报
回复
在<开始到>结束, 明白吗?
skyyoung
2002-01-25
打赏
举报
回复
计算“<”和“>”的个数是否偶数。比较简单的算法
appow
2002-01-25
打赏
举报
回复
我的信箱是larrow@263.net
麻烦你把那段源码发来吧,谢谢了!
pengz
2002-01-25
打赏
举报
回复
要写HTML 的parser?去看netscape的源码吧。很痛苦的~
gzgangster
2002-01-25
打赏
举报
回复
不好意思,打错几个字。更正一下。
你如果是仅需要在WINDOWS环境下运行,建议你使用IE提供的API接口,效果就好比是用IE去打开一遍,如果没有错误返回,那么所有的TAG及语法都是正确的了.否则就有问题,还可以返回错误出现的具体位置及类型。这是最简单的办法.
如果需要跨平台应用,这个办法就不通用.必须考虑不同浏览器的API.呵!是不是有点复杂?
可以考虑上面仁兄的建议,建立一个HTML TAG BNF,还有一个值得注意的问题就是,TAG对了,不一定语法就通过了,还需要考虑TAG中的内容.实现起来比较复杂.如果你需要我可以提供一个我写的程序供你参考,但注释不够,看起来会有点吃力.
gzgangster
2002-01-25
打赏
举报
回复
你如果是仅需要在WINDOWS环境下运行,建议你使用IE提供的API接口,效果就好比是用IE去解析一遍,如果没有错误返回,那么所有的TAG及语法都是正确的了.否则就有问题,还可以返回这是最简单的办法.
如果需要跨平台应用,这个办法就不通用.不许考虑不同浏览器的API.呵!是不是有点复杂?
可以考虑上面仁兄的建议,建立一个HTML TAG BNF,还有一个值得注意的问题就是,TAG对了,不一定语法就通过了,还需要考虑TAG中的内容.实现起来比较复杂.如果你需要我可以提供一个我写的程序供你参考,但注释不够,看起来会有点吃力.
zlq
2002-01-25
打赏
举报
回复
HTML基本上有这些:都是需要编程实现.
<A </A> <ABBR> <ABBR </ABBR> <ABOVE> <ACRONYM> <ACRONYM </ACRONYM> <ADDRESS> <ADDRESS </ADDRESS> <APPLET </APPLET> <ARRAY> <AREA </AREA
<B> <B </B> <BASE <BASEFONT <BDO> <BDO </BDO> <BGSOUND <BIG> <BIG </BIG> <BLINK> </BLINK> <BLOCKQUOTE> <BLOCKQUOTE </BLOCKQUOTE> <BODY <BODY> </BODY> <BOX> <BR <BR> <BIG <BLINK <BUTTON> </BUTTON>
<CAPTION> <CAPTION </CAPTION> <CENTER> <CENTER </CENTER> <CITE> <CITE </CITE> <CODE> <CODE </CODE> <COL> <COL <COLGROUP <COLGROUP> </COLGROUP> <COMMENT> </COMMENT>
<DD> <DD </DD> <DEL> <DEL </DEL> <DFN> <DFN </DFN> <DIR> <DIR </DIR> <DIV> <DIV </DIV> <DL> <DL </DL> <DT> <DT </DT>
<EM> <EM </EM> <EMBED
<FIELDSET> <FIELDSET </FIELDSET> <FIG> <FONT </FONT> <FORM> <FORM </FORM> <FRAME <FRAMESET </FRAMESET>
<H1> <H1 </H1> <H2> <H2 </H2> <H3> <H3 </H3> <H4> <H4 </H4> <H5> <H5 </H5> <H6> <H6 </H6> <HEAD> <HEAD </HEAD> <HR> <HR <HTML> <HTML </HTML>
<I> <I </I> <IFRAME> </IFRAME> <ILAYER> </ILAYER> <IMG <INPUT> <INPUT <INS> <INS </INS> <ISINDEX> <ISINDEX
<KBD> <KBD </KBD>
<LABEL> <LABEL </LABEL> <LAYER> <LAYER </LAYER> <LEGEND> <LEGEND </LEGEND> <LI> <LI </LI> <LINK <LISTING> </LISTING>
<MAP </MAP> <MARQUEE </MARQUEE> <MENU> <MENU </MENU> <META <MULTICOL> </MULTICOL>
<NEXTID <NOBR> </NOBR> <NOFRAMES> </NOFRAMES> <NOLAYER> </NOLAYER> <NOTE> </NOTE> <NOSCRIPT> </NOSCRIPT>
<OBJECT> <OBJECT </OBJECT> <OL> <OL </OL> <OPTION> <OPTION </OPTION> <OPTGROUP> <OPTGROUP </OPTGROUP>
<P <P> </P> <PARAM <PRE> <PRE </PRE>
<Q> <Q </Q> <QUOTE>
<RANGE> <ROOT>
<S> <S </S> <SAMP> <SAMP </SAMP> <SCRIPT <SCRIPT> </SCRIPT> <SELECT <SELECT> </SELECT> <SMALL> <SMALL </SMALL> <SOUND <SPACER> <SPAN> <SPAN </SPAN> <SQRT> <STRIKE> <STRIKE </STRIKE> <STRONG> <STRONG </STRONG> <STYLE> <STYLE </STYLE> <SUB> <SUB </SUB> <SUP> <SUP </SUP>
<TABLE> <TABLE </TABLE> <TBODY> <TBODY </TBODY> <TD <TD> </TD> <TEXT> <TEXTAREA <TEXTAREA> </TEXTAREA> <TFOOT> <TFOOT </TFOOT> <TH <TH> </TH> <THEAD> <THEAD </THEAD> <TITLE> </TITLE> <TR <TR> </TR> <TT> </TT> <TT
<U> <U </U> <UL> <UL </UL>
<VAR> </VAR> <VAR
<WBR>
<XMP> </XMP>
.
html
网页
文件
:标题,内容,url的提取
对下载下来的
文件
做处理,将网页
文件
中
的,,都提取出来。读取
文件
:既然是对网页
文件
做搜索,就需要程序
中
有网页
文件
。所以就需要将网页
文件
从下载的目录
中
,读到程序
中
,也就是读到内存储存起来,方便后续的处理。...
HTML
括号匹配算法
HTML
标记
应该
成对
、嵌套
出现
, 开
标记
是这种形式,闭
标记
是这种形式。 输入格式: 共1行,为
一个
字符串,即
一个
HTML
文档
中
的内容。 输出格式: 共1行,为True或者False,表示该字符串
中
的
标记
是否
匹配。 输入...
太理web课程答案——web程序设计课程答案 (第五章 构建web表单)持续发布
中
——
下列选项
中
,不属于表单
标记
<form>的常用属性的是( )。 A、 action B、 size C、 method D、 name 我的答案:B 2【单选题】 在
HTML
中
,<form method=””>,method属性表示( )。...
B/S系统期末复习宝典——选择填空
判断
部分(一)
第1章 网页开发基础 习题 一、 填空题 在CSS
中
,用于设置行间距的属性是【 】。 在CSS
中
,用于定义字体...【 】是
一个
表示和处理文档的应用程序接口(API),可用于动态访问、更新文档的内容、结构和样式。 二、 判
php语言
标记
用的是什么
在网页开发的世界里,...本文旨在为读者提供
一个
清晰的教程,介绍PHP语言
中
的基本
标记
,以及它们是如何工作的。要开始学习PHP,首先需要了解如何告诉服务器哪一部分是PHP代码。这通过使用特定的起始和结束标签来实现。
非技术区
23,407
社区成员
70,514
社区内容
发帖
与我相关
我的任务
非技术区
Java 非技术区
复制链接
扫一扫
分享
社区描述
Java 非技术区
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章