求一正则表达式匹配a标签

chduguxue 2010-05-18 01:07:07
例如 <a href=" http://xxoo.html">a业务员</a>
我想提取出 这个URL+“a业务员”这样的东西,正则怎么写?能实现么
我有试过这样写,但是效果不佳


strZhengZe = "href=\"(?<url>.*?)\">([^<>]+)<";
Regex reg = new Regex(strZhengZe, RegexOptions.IgnoreCase);
MatchCollection mc = reg.Matches(strSource);
if (mc.Count > 0)
{
string[] strHref = new string[mc.Count];
int i = 0;
foreach (Match m in mc)
{
strHref[i] = m.Groups[1].Value;
strJieGuo = strJieGuo + strHref[i] + "\n";
i++;
}
}

这个 href=\"(?<url>.*?)\">([^<>]+)< 匹配出来只有 “a业务员”
而正则我单独用 href=\"(?<url>.*?)\" 就可以匹配出前面的url
请问一下我要怎么写才可以把 http://xxoo.html">a业务员 一起匹配出来?
小弟拜谢了
...全文
712 12 打赏 收藏 转发到动态 举报
写回复
用AI写文章
12 条回复
切换为时间正序
请发表友善的回复…
发表回复
兔子-顾问 2010-05-18
  • 打赏
  • 举报
回复
很合理。 ^_^ 客客师傅厉害。
whoami333 2010-05-18
  • 打赏
  • 举报
回复
Mark.
chduguxue 2010-05-18
  • 打赏
  • 举报
回复
谢谢各位大哥哈
第一个最先整出正确答案,所以分大部分给他了,由于我这里上csdn非常卡,我接贴的的时候才看到楼上大哥的回复。。。实在不好意思。。。
兔子-顾问 2010-05-18
  • 打赏
  • 举报
回复
复制错了。。。。
<a href=(['"]?)\s*(?<url>[^ "']+)\1>(?<text>[\s\S]*?)</a>
chduguxue 2010-05-18
  • 打赏
  • 举报
回复
[Quote=引用 2 楼 lxcnn 的回复:]
try...


C# code
string test = "<a href=\"http://xxoo.html\">a业务员</a>";
Regex reg = new Regex(@"(?is)<a[^>]*?href=(['""]?)(?<url>[^'""\s>]+)\1[^>]*>(?<text>(?:(?!</?a\b).)……
[/Quote]
果然是高手,完全正确,非常感谢,这就结贴
长腿爸爸 2010-05-18
  • 打赏
  • 举报
回复
示例,你试试吧:

示例:
<a href="html/1.html">第一个页面</a>

1.
Regex reg = new Regex(@"(?is)<a[^>]*?href=(['""]?)(?<url>[^'""\s>]+)\1[^>]*>(?<text>(?:(?!</?a\b).)*)</a>");
MatchCollection mc = reg.Matches(yourStr);
foreach (Match m in mc)
{
richTextBox2.Text += m.Groups["url"].Value + "\n";
richTextBox2.Text += m.Groups["text"].Value + "\n";
}

2.
MatchCollection mc= Regex.Matches(str, @" <a[^> ]*href=([ ' " "]?)(? <url> [^ ' " "> \s]*)\1?[^> ]*> (? <text> [^ <]

*) </a> ", RegexOptions.IgnoreCase);
foreach (Match m in mc)
{
Response.Write(m.Groups[ "url "].Value);
Response.Write(m.Groups[ "text "].Value);
}

3.
MatchCollection mc = Regex.Matches(@"<a href=""html/1.html"">第一个页面</a>",
@"(?isn)<a.+?href=""(?<url>[^""]+)[^>]+>(?<text>.+?)</a>");
foreach (Match m in mc)
{
MessageBox.Show(m.Groups["url"].Value + Environment.NewLine +
m.Groups["text"].Value);
}

4.
MatchCollection mc = Regex.Matches(@"<a href=""html/1.html"">第一个页面</a>",
@"(?isn)<a.+?href=""(?<url>[^""]+)[^>]+>(?<text>.+?)</a>");
foreach (Match m in mc)
{
MessageBox.Show(m.Groups["url"].Value + Environment.NewLine +
m.Groups["text"].Value);
}
chduguxue 2010-05-18
  • 打赏
  • 举报
回复
[Quote=引用 3 楼 wuyazhe 的回复:]
<a href=" http://xxoo.html">a业务员</a>
-------------------------------------------
<a href=(['"]?)(?<url>[^ "']+)\1>(?<text>.*?)</a>


C# code

strZhengZe = "href=\"(?<url>.*?)\">([^<>]+)<";
Reg……
[/Quote]

大哥你这个匹配出来text全部为空
兔子-顾问 2010-05-18
  • 打赏
  • 举报
回复
重复了……
刚连沙发都没有……
-过客- 2010-05-18
  • 打赏
  • 举报
回复
楼主的例子中href="后有一个空格,正常的URL中一般是不会出现空格的,需要确认一下是否真的存在

如果存在,那就不能要这么高的灵活性了,只匹配href=后“"”的正则

            string test = "<a href=\" http://xxoo.html\">a业务员</a>";
Regex reg = new Regex(@"(?is)<a[^>]*?href=""(?<url>[^""]+)""[^>]*>(?<text>.+?)</a>");
MatchCollection mc = reg.Matches(test);
foreach (Match m in mc)
{
richTextBox2.Text += m.Groups["url"].Value + "\n";
richTextBox2.Text += m.Groups["text"].Value + "\n";
}
兔子-顾问 2010-05-18
  • 打赏
  • 举报
回复
<a href=" http://xxoo.html">a业务员</a>
-------------------------------------------
<a href=(['"]?)(?<url>[^ "']+)\1>(?<text>.*?)</a>


strZhengZe = "href=\"(?<url>.*?)\">([^<>]+)<";
Regex reg = new Regex(strZhengZe, RegexOptions.IgnoreCase);
MatchCollection mc = reg.Matches(strSource);
if (mc.Count > 0)
{
string[] strHref = new string[mc.Count];
int i = 0;
foreach (Match m in mc)
{
strHref[i] = "Url="+m.Groups["url"].Value+"\tText="+m.Groups["text"].Value;
strJieGuo = strJieGuo + strHref[i] + "\n";
i++;
}
}
-过客- 2010-05-18
  • 打赏
  • 举报
回复
try...

            string test = "<a href=\"http://xxoo.html\">a业务员</a>";
Regex reg = new Regex(@"(?is)<a[^>]*?href=(['""]?)(?<url>[^'""\s>]+)\1[^>]*>(?<text>(?:(?!</?a\b).)*)</a>");
MatchCollection mc = reg.Matches(test);
foreach (Match m in mc)
{
richTextBox2.Text += m.Groups["url"].Value + "\n";
richTextBox2.Text += m.Groups["text"].Value + "\n";
}
皇城龙三 2010-05-18
  • 打赏
  • 举报
回复
最简单的办法,分别匹配,然后再加在一起就可以了阿。

a="href=\"(?<url>.*?)\">([^<>]+)<";

b=href=\"(?<url>.*?)\"

c=b+a

62,046

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术交流专区
javascript云原生 企业社区
社区管理员
  • ASP.NET
  • .Net开发者社区
  • R小R
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见,支持健康理性的辩论和互动,反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。

试试用AI创作助手写篇文章吧