求一提取HTML的的正则表达式(在线等待)

fys 2006-10-17 10:04:45

程序抓回一段HTML，例如：
<table width=0>
<tr><td><img src="xxx.jpg"><br>
<p><a href="#">美丽图</a></p>
</td></tr></table>
要求实现只保留正文内容及<img><p></p><br>四种HTML标记，将其它HTML替换为空格。

...全文

260 10 打赏收藏转发到动态举报

写回复

用AI写文章

10 条回复

切换为时间正序

请发表友善的回复…

发表回复

netlg 2006-10-19

打赏
举报

同意gzdiablo() 的两贴，

我也纳闷为什么很多人不知道尽快结贴，不是为了省分吧，一发贴分就已经给出去了，不合逻辑
mt

gzdiablo 2006-10-19

打赏
举报

最后提一句记得结帖我解答了100多条问题只有25条拿了分再这样我就不来这混了

gzdiablo 2006-10-19

打赏
举报

petshop4 2006-10-18

打赏
举报

youstr=Regex.Replace(youstr,"<(?!img|br|p|/p).*?>","")

lip009 2006-10-17

打赏
举报

<(?!img|br|p|\/p)[^<>]*>
这一段是正则表达式内容

lip009 2006-10-17

打赏
举报

是否是LZ想要的结果?

lip009 2006-10-17

打赏
举报

fys 2006-10-17

打赏
举报

没人知道？

fys 2006-10-17

打赏
举报

顶

fys 2006-10-17

打赏
举报

Regex.Replace(strhtml, "<[^>]*[^p]>", "", RegexOptions.IgnoreCase)
用这个还差img的没法排除掉

爬虫就是请求网站并提取数据的自动化程序。...得到的内容可能是HTML,可以用正则表达式，页面解析库进行解析，可能是Json,可以直接转换为Json对象解析，可能是二进制数据，可以做保存或者进一步的处理保存

java.util.regex 用于匹配字符序列与正则表达式指定模式的类。 java.util.spi java.util 包中类的服务提供者类。 java.util.zip 提供用于读写标准 ZIP 和 GZIP 文件格式的类。 javax.accessibility 定义了用户...

java.util.regex 用于匹配字符序列与正则表达式指定模式的类。 java.util.spi java.util 包中类的服务提供者类。 java.util.zip 提供用于读写标准 ZIP 和 GZIP 文件格式的类。 javax.accessibility 定义了用户界面...

正则表达式是一段字符串，可以表示一段有规律的信息。 re语法 正则表达式－语法 python中的正则表达式 所有正则表达式相关的都在re包中 re.compile() re匹配模型两个参数（正则表达式，更改字符匹配规则） re....

在用正则表达式匹配网址信息的时候，经常会匹配到空的列表。还在这个地方卡了两三天的时间。最后通过问朋友的方式得以解决。 正则表达式匹配的会经常有隐含符的情况，所以在所选标签匹配不到的情况下，应该先匹配...

.NET社区

62,041

社区成员

669,051

社区内容

发帖

与我相关

我的任务

javascript云原生企业社区

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见，支持健康理性的辩论和互动，反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。

试试用AI创作助手写篇文章吧

+ 用AI写文章