", "upDate": "2021-05-28T16:36:20+08:00" }

如何用正则表达式去掉

goldtogo 2008-05-27 02:48:35
例如文本如下

<script language="javascript">
....
</script>正文<script>.... </script>


要求最后只保留正文,而去掉两边的javascript标签,以及其标签中间的那些内容,javascript可能有很多行
...全文
241 3 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
goldtogo 2008-05-27
  • 打赏
  • 举报
回复
感谢!
老紫竹 2008-05-27
  • 打赏
  • 举报
回复
str = str.replaceAll("(?s)<script.*?>(.*?)</script>","$1");

用这个更好一些,考虑了<script>121212<script>之类的不规范的写法
    String str = "<script type='text/javascript'>fkldsjlfakdf\nfdlsjfakldf</script>";
str = str.replaceAll("(?s)<script.*?>(.*?)</script>","$1");
System.out.println(str);
老紫竹 2008-05-27
  • 打赏
  • 举报
回复
    String str = "<script type='text/javascript'>fkldsjlfakdf\nfdlsjfakldf</script>";
str = str.replaceAll("(?s)<script\\s*.*?>(.*?)</script>","$1");
System.out.println(str);


请参考,这个支持多行匹配。
正则的部分,可以看这个 http://www.java2000.net/viewthread.jsp?tid=802#T2332

62,634

社区成员

发帖
与我相关
我的任务
社区描述
Java 2 Standard Edition
社区管理员
  • Java SE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧