爬虫爬到的网页源码 怎么删除js代码

阿里帽子 2019-08-02 01:59:26
爬别人的首页源代码 拿到以后 怎么清除源代码里面的所有js代码?有相关案例或正规表达式吗
...全文
130 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
  • 打赏
  • 举报
回复

(?is)<script.*?>.*?</script>
  • 打赏
  • 举报
回复
html本身是xml,可以按xml的方式操作, 正则可以试试
<script\b[^>]*>(\s*</scirpt>)?

62,047

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术交流专区
javascript云原生 企业社区
社区管理员
  • ASP.NET
  • .Net开发者社区
  • R小R
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见,支持健康理性的辩论和互动,反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。

试试用AI创作助手写篇文章吧