正则达人请进,高分求一个正则!!!!

uscu400 2013-11-06 03:46:17
http://news.baidu.com/ns?from=news&cl=2&bt=0&y0=2013&m0=11&d0=6&y1=2013&m1=11&d1=6&et=0&q1=%B1%B1%BE%A9&submit=%B0%D9%B6%C8%D2%BB%CF%C2&q3=&q4=&s=1&mt=0&lm=0&begin_date=2013-11-6&end_date=2013-11-6&tn=newsdy&ct1=1&ct=1&rn=20&q6=

这是一个baidu新闻的搜索结果页,循环得到搜索结果的前10条新闻标题及链接其他内容不需要。
...全文
315 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
datahandler2 2013-11-07
  • 打赏
  • 举报
回复
<a\s+href="(?<href>[^"]*)"[^\>]*><em>(?<text>[^<]*)</em>
工作鸟 2013-11-06
  • 打赏
  • 举报
回复
<h3\sclass="c-title"><a\shref="(?<Url>[^"]*)[^>]*>(?<Title>.*?)</a>
每页有20个,前10个自行在程序中计数搞定。
Ahoo 2013-11-06
  • 打赏
  • 举报
回复
使用 HtmlAgilityPack ,再也不用担心 html 内容提取啦!
c02645 2013-11-06
  • 打赏
  • 举报
回复


            WebClient wc = new WebClient();
            string html = Encoding.UTF8.GetString(wc.DownloadData("http://news.baidu.com/ns?from=news&cl=2&bt=0&y0=2013&m0=11&d0=6&y1=2013&m1=11&d1=6&et=0&q1=%B1%B1%BE%A9&submit=%B0%D9%B6%C8%D2%BB%CF%C2&q3=&q4=&s=1&mt=0&lm=0&begin_date=2013-11-6&end_date=2013-11-6&tn=newsdy&ct1=1&ct=1&rn=20&q6="));
            MatchCollection mc = Regex.Matches(html, "(?is)class=\"c-title\".*?href=\"(.*?)\".*?data-click=.*?>(.*?)</a>", RegexOptions.Singleline);
            int i = 0;
            foreach (Match match in mc)
            {
                i++;
                if (i > 10) break;
                Console.WriteLine(match.Groups[1].Value + "          " + match.Groups[2].Value);
            }
uscu400 2013-11-06
  • 打赏
  • 举报
回复
求正则达人啊。。。。
Teln_小凯 2013-11-06
  • 打赏
  • 举报
回复
楼主慢慢弄哈,这个地址能够得到源码,自己慢慢截取 把

62,046

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术交流专区
javascript云原生 企业社区
社区管理员
  • ASP.NET
  • .Net开发者社区
  • R小R
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见,支持健康理性的辩论和互动,反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。

试试用AI创作助手写篇文章吧