###高分求教!!高手请进!!!!!!!!!

hzapeng 2003-04-13 04:39:29
如何去掉一文本中的html标记即去掉< >之间(含<>)的字符串.使之成为纯文本.

如 <p><font size=9><a href=xxx.htm>你好</a></font><img src=a.jpg></p>

转变成:你好


听说可以用正则表达式替换,不知如何实现,请高手赐教!
...全文
14 点赞 收藏 11
写回复
11 条回复
切换为时间正序
当前发帖距今超过3年,不再开放新的回复
发表回复
gary_shi 2003-04-14
括号匹配啊。
StringBuffer buffer;
int i = 0;
while (i< inStr.length){
if("<"=inStr.charAt(i)){
while(">"!=inStr.charAt(i)) i++;
}else{
buffer.add(inStr.charAt(i))
i++;
}
}

大致是上面那样的代码,我只是在这里随手写的,可能过不了编译,而且也不强壮,有可能会出错。
回复
gongqh21 2003-04-14
so easy!
回复
hzapeng 2003-04-14
删除和过虑有区别吗??就是实现我举的例子那样啊,变成不含任何html标记的纯文本,不是简单得将"<"替换成"<" 。

唉,你们的回答,让我失望,,真正的高手在哪里???


回复
XBulletin 2003-04-13
不好意思搂主:
你是要删除啊,不是过滤:
算我以前没有说:

狂汉......

删除:的话就应该用 chy018(pillar) ( ) 的方法了,不过为什么要删除? 不懂?


GOOD
LUCK!
回复
XBulletin 2003-04-13
to: proZeus(proZeus)
完全可以!
回复
java_alias 2003-04-13
楼上的回答...很晕...
回复
chy018 2003-04-13
分析字符串

遇到 "<" 就开始删,直到删到 ">" , 然后重复调用
回复
mercury1231 2003-04-13
做html解析器吗?
回复
proZeus 2003-04-13
楼上的不能去掉这些吧:font size=9
回复
XBulletin 2003-04-13
再详细点:
html; 你的字符串
"<": 你要代替的字符串
"<" :代替"<"的字符串;
这样,html中的"<"就全部被"<"代替了

理解了吗?

回复
XBulletin 2003-04-13
不错
使用正则表达式:将<>中的'<'和'>'用 html中的特殊符号代替:
你的断代码

html = Replace(html, "&", "&");
html = Replace(html, "<", "<");
html = Replace(html, ">", ">");

GOOD LUCK !
回复
相关推荐
发帖
Web 开发
创建于2007-09-28

8.0w+

社区成员

Java Web 开发
申请成为版主
帖子事件
创建了帖子
2003-04-13 04:39
社区公告
暂无公告