关于正则表达式的问题

jonsonzxw 2004-02-04 10:03:22
我想通过正则表达式解析HTML标签,包括取得标记名称、属性和内容,可是如下的正则表达式却取不到属性,也就是说属性是空的,请高手赐教:

Regex extractHTMLRegex = new Regex("<(?<outertag>[a-z]+[\\d]?)(?<attributes>[^>]*)*>"+
"(?<innerhtml>(<(?<innertag>[a-z]+[\\d]?)[^>]*>.*?</\\k<innertag>>|"+
"<[a-z]+[\\d]?[^>]*>|(?>[^<]*))*(?=</\\k<outertag>>))?",
RegexOptions.IgnoreCase |
RegexOptions.Compiled |
RegexOptions.ExplicitCapture |
RegexOptions.Singleline);

---------------------------------------------------
String sTag = matchMade.Groups[1].Value; //标记可正确获取
String sAttribute = matchMade.Groups[2].Value; //属性为空,什么都不输出????????????
...全文
54 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复

110,538

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧