求几个正则表达式

will_g 2011-08-19 05:10:07
1.字符串1:<aaa> <bbbb/> </ccc> 哈哈哈</aaa>
需要识别<aaa> <bbbb/> </ccc> </aaa> 4个标记(别把整句话 <aaa> <bbbb/> </ccc> 哈哈哈</aaa> 当一个标记识别了)

2.字符串2:哈哈哈www.aa.com哈哈http://www.aa.com/aa/a哈哈
需要识别www.aa.com和http://www.aa.com/aa/a 即将字符串中的url识别出来

3 字符穿3:哈哈哈C:\aaa\aaa.txt哈哈哈C:\aaa哈
需要识别C:\aaa\aaa.txt和C:\aaa 即将字符串中的文件路径识别出来

万分感谢!!!!!
...全文
45 点赞 收藏 2
写回复
2 条回复
切换为时间正序
当前发帖距今超过3年,不再开放新的回复
发表回复
兔子党-督察 2011-08-21
[Quote=引用楼主 mac_will 的回复:]
1.字符串1:<aaa> <bbbb/> </ccc> 哈哈哈</aaa>
需要识别<aaa> <bbbb/> </ccc> </aaa> 4个标记(别把整句话 <aaa> <bbbb/> </ccc> 哈哈哈</aaa> 当一个标记识别了)

2.字符串2:哈哈哈www.aa.com哈哈http://www.aa.com/aa/a哈哈
需要识别www.aa.com和http://www.……
[/Quote]
1. <[^>]*?>
2. (?i)(https?://)?www\.[^\s\u4e00-\u9fa5]+
3. (?i)[a-z]:\\[^\s\u4e00-\u9fa5]+
回复
RLib 2011-08-21
1.多次匹配\<(?<rrrfff>[^\>]+)\>[^\<]*\<(\k<rrrfff>)\>,取得每个标签和其子标签。

2.匹配冒号、斜杠、点号和字母就行,很简单就不写了

3.看2
回复
相关推荐
发帖
.NET技术其他语言
创建于2007-09-28

1831

社区成员

.NET技术 其他语言讨论
申请成为版主
帖子事件
创建了帖子
2011-08-19 05:10
社区公告
暂无公告