郁闷 这个正则还是有问题啊。。。 请高手赐教了

lijing3333 2011-10-09 10:26:04
我想抓取京东的商品信息

例如 http://www.360buy.com/product/503023.html

现在我的代码如下


WebClient client = new WebClient();
byte[] byteArr = client.DownloadData(TextBox1.Text.Trim());
string htmlStr = System.Text.Encoding.GetEncoding("gb2312").GetString(byteArr);
MatchCollection matches = Regex.Matches(htmlStr, @"(?is)<div class=""mc fore tabcon"">(.*?)</div>");

foreach (Match match in matches)
Response.Write(match.Groups[1].Value);


现在的问题是 我只能抓取一部分 不能完全获取 div class="mc fore tabcon" 里面的内容

我这个正则是不是有问题? 求教了。。。。
...全文
59 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
酷儿 2011-10-09
  • 打赏
  • 举报
回复
路过 学习一下下
诺维斯基 2011-10-09
  • 打赏
  • 举报
回复
[Quote=引用 1 楼 cj205 的回复:]
(.*?)
如果你的<div>里面有嵌套div了 那很遗憾 你肯定不能全部获取
解决方案就是使用平衡组,或者是使用贪婪匹配
[/Quote]
加0长度断言也可以。
Mr-Jee 2011-10-09
  • 打赏
  • 举报
回复
(.*?)
如果你的<div>里面有嵌套div了 那很遗憾 你肯定不能全部获取
解决方案就是使用平衡组,或者是使用贪婪匹配

62,039

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术交流专区
javascript云原生 企业社区
社区管理员
  • ASP.NET
  • .Net开发者社区
  • R小R
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见,支持健康理性的辩论和互动,反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。

试试用AI创作助手写篇文章吧