正则表达式问题!!!!!(高分)

dongxin2000 2009-01-07 02:44:06


1.已经获得网页HTML
WebRequest request = WebRequest.Create(webUrl);
WebResponse response = request.GetResponse();
StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.GetEncoding("gb2312"));
return reader.ReadToEnd();

2.查找<a href="/pages/company.aspx?version=cn&corpid=1111111111" class="name" target="_blank">AAAAAAAAAAAA</a>标记
3.得到corpid=1111111111 以及 AAAAAAAAAA

使用Regex以及正则表达式实现,请问2,3步如何编写?谢谢啦!!!
...全文
98 8 打赏 收藏 转发到动态 举报
写回复
用AI写文章
8 条回复
切换为时间正序
请发表友善的回复…
发表回复
优途科技 2009-01-10
  • 打赏
  • 举报
回复
string s = "..";
Regex re = new Regex(@"<a[^>]*href=(""(?<href>[^""]*)""|'(?<href>[^']*)'|(?<href>[^\s>]*))[^>]*>(?<text>.*?)</a>", RegexOptions.IgnoreCase | RegexOptions.Singleline);
Match m = re.Match(s);
if(m.Success)
{
string link = m.Groups["href"].Value;
string text = Regex.Replace(m.Groups["text"].Value,"<[^>]*>","");
Console.WriteLine("link:{0}\ntext:{1}", link, text);
}
止戈而立 2009-01-10
  • 打赏
  • 举报
回复
Regex reg = new Regex(@"(?i)<a href=(['""])(?<link>[^'""]*)\1[^>]*>(?<text>[\s\S]*?)</a>"); 
foreach(Match m in reg.Matches("你的网页代码"))
{
string link=m.Groups["link"].Value;//结果是/pages/company.aspx?version=cn&corpid=1111111111
string text=m.Groups["text"].Value;//结果是AAAAAAAAAA
}

wackyboy 2009-01-07
  • 打赏
  • 举报
回复

string No = "<a href=\"/pages/company.aspx?version=cn&corpid=1111111111\" class=\"name\" target=\"_blank\">AAAAAAAAAAAA </a>";// Console.ReadLine();
Regex re = new Regex("<a\\s+href=\".*?&(.*?)\".*?>(.*?)</a>");
MatchCollection mc = re.Matches(No);
foreach (Match m in mc)
{
for (int i = 0; i < m.Groups.Count;i++)
{
Console.WriteLine("Group " + i + ": " + m.Groups[i].Value);
}
}
yqlx521 2009-01-07
  • 打赏
  • 举报
回复
bu不会,关注,帮顶
erytbc 2009-01-07
  • 打赏
  • 举报
回复
ding
lange_love 2009-01-07
  • 打赏
  • 举报
回复
..
HDNGO 2009-01-07
  • 打赏
  • 举报
回复
第三步可以这么搞。。。


string s = "..";
Regex re = new Regex(@"<a[^>]*href=(""(?<href>[^""]*)""|'(?<href>[^']*)'|(?<href>[^\s>]*))[^>]*>(?<text>.*?)</a>", RegexOptions.IgnoreCase | RegexOptions.Singleline);
Match m = re.Match(s);
if(m.Success)
{
string link = m.Groups["href"].Value;
string text = Regex.Replace(m.Groups["text"].Value,"<[^>]*>","");
Console.WriteLine("link:{0}\ntext:{1}", link, text);
}

xiaojin0710 2009-01-07
  • 打赏
  • 举报
回复
学习,顶

110,536

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧