c# 正则 提取 。麻烦各位了 !

zell419 2012-02-13 04:29:08

<div class="pagebox"><span class="pagebox_pre_nolink">上一页</span><span class="pagebox_num_nonce">1</span><span class="pagebox_num"><a target="_self" href="102641554-2.html" class="page">2</a></span><span class="pagebox_num"><a target="_self" href="102641554-3.html" class="page">3</a></span><span class="pagebox_num"><a target="_self" href="102641554-4.html" class="page">4</a></span><span class="pagebox_num"><a target="_self" href="102641554-5.html" class="page">5</a></span><span class="pagebox_next"><a href="102641554-2.html">下一页</a></span></div>



输出 102641554-2.html 2
102641554-3.html 3
102641554-4.html 4
102641554-5.html 5

也是说要 class="page"的标签的src属性和值 ,两个都要 ,源数据还有其它的标签 所以class="page"条件也要 。
...全文
105 3 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
zell419 2012-02-13
  • 打赏
  • 举报
回复
1楼的朋友 class="page"条件好像没有吧 。
谢谢各位 。结贴 。
PS:火狐不管是“查看选中部分源代码"还是firebug都会重新组织 。
huangwenquan123 2012-02-13
  • 打赏
  • 举报
回复
            string str = @"<div class=""pagebox""><span class=""pagebox_pre_nolink"">上一页</span><span class=""pagebox_num_nonce"">1</span><span class=""pagebox_num""><a target=""_self"" href=""102641554-2.html"" class=""page"">2</a></span><span class=""pagebox_num""><a target=""_self"" href=""102641554-3.html"" class=""page"">3</a></span><span class=""pagebox_num""><a target=""_self"" href=""102641554-4.html"" class=""page"">4</a></span><span class=""pagebox_num""><a target=""_self"" href=""102641554-5.html"" class=""page"">5</a></span><span class=""pagebox_next""><a href=""102641554-2.html"">下一页</a></span></div>";
Regex reg = new Regex(@"(?is)<a[^>]*?href=(['""\s]?)(?<url>[^'""\s]+)\1[^>]*?class=""page""[^>]*?>(?<text>.*?)</a>");
foreach (Match m in reg.Matches(str))
Console.WriteLine("{0} {1}", m.Groups["url"].Value, m.Groups["text"].Value);
maddemon 2012-02-13
  • 打赏
  • 举报
回复
href="([^"]+)"[^>]*>(\d+)</a>



1: 102641554-2.html
2: 2
1: 102641554-3.html
2: 3
1: 102641554-4.html
2: 4
1: 102641554-5.html
2: 5

62,243

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术交流专区
javascript云原生 企业社区
社区管理员
  • ASP.NET
  • .Net开发者社区
  • R小R
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见,支持健康理性的辩论和互动,反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。

试试用AI创作助手写篇文章吧