求高手帮忙写个正则表达式

mgx7758521 2013-06-24 05:14:38

小弟在做一个winform的爬虫,想写个正则表达式来读数据,但是技术有限,一直写不出来。请高手帮忙下。

<li>
<div>
<h3><a href="http://1.html" target="_blank" >标题</a></h3>
<p>摘要</p>
</div>
<p class="source">来自:<a href="2.html" target="_blank">来源</a>
作者:<a href="3.html" target="_blank">作者</a>
时间:<span>时间</span>
回复:<span>回复数</span></p>
</li>

想得到的结果
1.html 标题 摘要 来源 作者 时间 回复数
这几个数值,拜托啦~~~~
...全文
157 7 打赏 收藏 转发到动态 举报
写回复
用AI写文章
7 条回复
切换为时间正序
请发表友善的回复…
发表回复
mgx7758521 2013-06-25
  • 打赏
  • 举报
回复
引用 3 楼 nice_fish 的回复:

(?is)<li>\s*<div>\s*<h3><a href="(?<html>.*?)".*?>(?<title>.*?)</a></h3>\s*<p>(?<sence>.*?)</p>\s*</div>\s*<p class="source">.*?<a href.*?>(?<source>.*?)</a>\s*.*<a href=".*?>(?<author>.*?)</a>\s*.*?<span>(?<time>.*?)</span>\s*.*?<span>(?<retimes>.*?)</span></p>\s*</li>
根据你的需求从左往右的去取吧
谢谢大神啦。。。
_小黑_ 2013-06-24
  • 打赏
  • 举报
回复
引用 4 楼 hjywyj 的回复:
lxcnn
  • 打赏
  • 举报
回复
你可以尝试用:htmlagilitypack 学习一下xpath的语法,你会发现比正则相对的容易一点。
  • 打赏
  • 举报
回复
lxcnn
  • 打赏
  • 举报
回复

(?is)<li>\s*<div>\s*<h3><a href="(?<html>.*?)".*?>(?<title>.*?)</a></h3>\s*<p>(?<sence>.*?)</p>\s*</div>\s*<p class="source">.*?<a href.*?>(?<source>.*?)</a>\s*.*<a href=".*?>(?<author>.*?)</a>\s*.*?<span>(?<time>.*?)</span>\s*.*?<span>(?<retimes>.*?)</span></p>\s*</li>
根据你的需求从左往右的去取吧
mgx7758521 2013-06-24
  • 打赏
  • 举报
回复
引用 1 楼 coobai 的回复:
Return_false
coobai 2013-06-24
  • 打赏
  • 举报
回复
Return_false

110,535

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧