导航
  • 主页
  • C#综合技术
  • C#互联网桌面应用
  • AppLauncher
  • WinForm
  • WPF
  • 问答

关于正则表达式的问题

jonsonzxw 2004-02-04 10:03:22
我想通过正则表达式解析HTML标签,包括取得标记名称、属性和内容,可是如下的正则表达式却取不到属性,也就是说属性是空的,请高手赐教:

Regex extractHTMLRegex = new Regex("<(?<outertag>[a-z]+[\\d]?)(?<attributes>[^>]*)*>"+
"(?<innerhtml>(<(?<innertag>[a-z]+[\\d]?)[^>]*>.*?</\\k<innertag>>|"+
"<[a-z]+[\\d]?[^>]*>|(?>[^<]*))*(?=</\\k<outertag>>))?",
RegexOptions.IgnoreCase |
RegexOptions.Compiled |
RegexOptions.ExplicitCapture |
RegexOptions.Singleline);

---------------------------------------------------
String sTag = matchMade.Groups[1].Value; //标记可正确获取
String sAttribute = matchMade.Groups[2].Value; //属性为空,什么都不输出????????????
...全文
24 点赞 收藏 4
写回复
4 条回复
切换为时间正序
请发表友善的回复…
发表回复

还没有回复,快来抢沙发~

发动态
发帖子
C#
创建于2007-09-28

10.4w+

社区成员

.NET技术 C#
申请成为版主
社区公告

全世界最好的语言,没有之一.