求正则提示,匹配html代码中的标签种类,匹配结果中没有重复标签

jiuhexuan 2008-07-10 10:17:51
目的,匹配html中的标签种类
例如,html中有很多 <a>标签,但他们是一种标签
代码
<a href=> </a> </a>
<b> </b>
<a href=> </a> </a>

求匹配出两组匹配,分别是 <a>, <b>,而不是三个, <a>, <b>, <a>

也就是匹配结果去除重复
...全文
79 10 打赏 收藏 转发到动态 举报
写回复
用AI写文章
10 条回复
切换为时间正序
请发表友善的回复…
发表回复
jiuhexuan 2008-07-10
  • 打赏
  • 举报
回复
hehe,有这种场合的
zdfbj 2008-07-10
  • 打赏
  • 举报
回复
挺有意思的~~~~~
jiuhexuan 2008-07-10
  • 打赏
  • 举报
回复
谢谢,我也感觉表达式只是针对单个匹配,匹配组过滤要用其它方法了
jedliu 2008-07-10
  • 打赏
  • 举报
回复
这容易啊,根据正则找出第一个后,把其他的清楚就是了!
这里有个清楚标签的方法你看看(通过正则来找到,然后删除):
http://www.cnblogs.com/lifenostink/archive/2008/01/03/1024176.html
HimeTale 2008-07-10
  • 打赏
  • 举报
回复
[Quote=引用 2 楼 jiuhexuan 的回复:]
那样效率不高,应该有直接正则的匹配限制把
[/Quote]
据我所知,没有那种功能.
即使有也要匹配多次,
还不如简单的匹配一次再去掉重复.
<[^\s/>]+(?=\s|>)
jiuhexuan 2008-07-10
  • 打赏
  • 举报
回复
up
xiaojing7 2008-07-10
  • 打赏
  • 举报
回复
不懂!
NewUser2008 2008-07-10
  • 打赏
  • 举报
回复
up
jiuhexuan 2008-07-10
  • 打赏
  • 举报
回复
那样效率不高,应该有直接正则的匹配限制把
HimeTale 2008-07-10
  • 打赏
  • 举报
回复
都匹配出来然后再去掉重复的呗

110,891

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • AIGC Browser
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧