采集URL地址

w809026418 2009-12-08 02:38:22
我获取到了网页的源文件,想找出网页中符合我要求的URL地址
URL:http://product.dangdang.com/product.aspx?product_id=20658937
http://product.dangdang.com/product.aspx?product_id=20679355
类似这样的地址,如果我写入限制条件为product_id那么我就是想获取含有product_id这个的所有URL地址,并且不能
重复。


那样我的正则表达式应该怎么写?

我这里有获取所有URL的方法。
public string GetHref(string HtmlCode)
{
string MatchVale = "";
string Reg = @"(h|H)(r|R)(e|E)(f|F) *= *('|"")?((\w|\\|\/|\.|:|-|_)+)('|""| *|>)?";
foreach (Match m in Regex.Matches(HtmlCode, Reg))
{
MatchVale += (m.Value).ToLower().Replace("href=", "").Trim() + "||";
}
return MatchVale;
}
...全文
131 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
ICrazyBoy 2009-12-08
  • 打赏
  • 举报
回复
帮忙顶一下,等待正则表达式高手前来帮你解决问题吧???????????
w809026418 2009-12-08
  • 打赏
  • 举报
回复
估计没什么希望了,自己顶一下。

62,052

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术交流专区
javascript云原生 企业社区
社区管理员
  • ASP.NET
  • .Net开发者社区
  • R小R
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见,支持健康理性的辩论和互动,反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。

试试用AI创作助手写篇文章吧