###高分求教!!高手请进!!!!!!!!!

hzapeng 2003-04-13 04:39:29
如何去掉一文本中的html标记即去掉< >之间(含<>)的字符串.使之成为纯文本.

如 <p><font size=9><a href=xxx.htm>你好</a></font><img src=a.jpg></p>

转变成:你好


听说可以用正则表达式替换,不知如何实现,请高手赐教!
...全文
31 11 打赏 收藏 转发到动态 举报
写回复
用AI写文章
11 条回复
切换为时间正序
请发表友善的回复…
发表回复
gary_shi 2003-04-14
  • 打赏
  • 举报
回复
括号匹配啊。
StringBuffer buffer;
int i = 0;
while (i< inStr.length){
if("<"=inStr.charAt(i)){
while(">"!=inStr.charAt(i)) i++;
}else{
buffer.add(inStr.charAt(i))
i++;
}
}

大致是上面那样的代码,我只是在这里随手写的,可能过不了编译,而且也不强壮,有可能会出错。
gongqh21 2003-04-14
  • 打赏
  • 举报
回复
so easy!
hzapeng 2003-04-14
  • 打赏
  • 举报
回复
删除和过虑有区别吗??就是实现我举的例子那样啊,变成不含任何html标记的纯文本,不是简单得将"<"替换成"<" 。

唉,你们的回答,让我失望,,真正的高手在哪里???


XBulletin 2003-04-13
  • 打赏
  • 举报
回复
不好意思搂主:
你是要删除啊,不是过滤:
算我以前没有说:

狂汉......

删除:的话就应该用 chy018(pillar) ( ) 的方法了,不过为什么要删除? 不懂?


GOOD
LUCK!
XBulletin 2003-04-13
  • 打赏
  • 举报
回复
to: proZeus(proZeus)
完全可以!
java_alias 2003-04-13
  • 打赏
  • 举报
回复
楼上的回答...很晕...
chy018 2003-04-13
  • 打赏
  • 举报
回复
分析字符串

遇到 "<" 就开始删,直到删到 ">" , 然后重复调用
mercury1231 2003-04-13
  • 打赏
  • 举报
回复
做html解析器吗?
proZeus 2003-04-13
  • 打赏
  • 举报
回复
楼上的不能去掉这些吧:font size=9
XBulletin 2003-04-13
  • 打赏
  • 举报
回复
再详细点:
html; 你的字符串
"<": 你要代替的字符串
"<" :代替"<"的字符串;
这样,html中的"<"就全部被"<"代替了

理解了吗?

XBulletin 2003-04-13
  • 打赏
  • 举报
回复
不错
使用正则表达式:将<>中的'<'和'>'用 html中的特殊符号代替:
你的断代码

html = Replace(html, "&", "&");
html = Replace(html, "<", "<");
html = Replace(html, ">", ">");

GOOD LUCK !

81,092

社区成员

发帖
与我相关
我的任务
社区描述
Java Web 开发
社区管理员
  • Web 开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧