正则表达式提取html串的问题

zhxjcooler 2013-04-24 04:02:42
String ddd = "<span dd \\. >rereer </span><div>dfdsd</div></br>ddds</span><tr><tbody>";
patternStrs="<[\\s]*[^img][^br/][^>]*>";
Pattern linkPattern = Pattern
.compile(patternStrs, Pattern.CASE_INSENSITIVE);
Matcher m_linkPattern = linkPattern.matcher(ddd);
ddd =m_linkPattern.replaceAll("");
System.out.println(ddd);


我想让一个html文件只保留图片和<br/>串和纯文本怎么做
上面的代码过滤后怎么<tr><tbody>这两个标识还在,
我想要的结果是rereer dfdsd<br/>ddds要怎么写正则
...全文
48 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
幽狼 2013-04-24
  • 打赏
  • 举报
回复
</?(?!\b(?:img|br)\b)[a-z][a-z\d]*\b[^>]*>

67,512

社区成员

发帖
与我相关
我的任务
社区描述
J2EE只是Java企业应用。我们需要一个跨J2SE/WEB/EJB的微容器,保护我们的业务核心组件(中间件),以延续它的生命力,而不是依赖J2SE/J2EE版本。
社区管理员
  • Java EE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧