求C#技术专家 正则表达式识别HTML的内容 提取

qq_34213012 2016-03-11 02:43:47
html内容如下


<div class="concenter">
<p><img src="/images/czcg.gif" alt="" />我是标题我是标题</p>
<p>我是内容我是内容我是内容,</p>
<p>感谢您的使用。</p>
<p><input class="btngray" style="width:90%;" name="" type="button" value="我市价的"

onclick="javascript:window.location.href='/1212/3232.jsp'" /></p>
</div>



需要提取的内容分别是 标题和内容 2个分开提取出来
我是标题
我是内容

因为不会正则 只能完成这些工作 靠大神们帮忙了 万分感谢 能帮助解决问题者 100分感谢
c#代码如下


string html = "<div class=\"concenter\"><p><img src=\"/images/czcg.gif\" alt=\"\" />我是标题</p><p>我是内容我是内容我是内容,</p><p>感谢您的使用。</p><p><input class=\"btngray\" style=\"width:90%;\" name=\"\" type=\"button\" value=\"查看充值缴费记录\" onclick=\"javascript:window.location.href='/2121/121.jsp'\" /></p></div>";
...全文
203 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
qq_34213012 2016-03-11
  • 打赏
  • 举报
回复
引用 4 楼 q107770540 的回复:
void Main()
{
	string html = "<div class=\"concenter\"><p><img src=\"/images/czcg.gif\" alt=\"\" />我是标题</p><p>我是内容我是内容我是内容,</p><p>感谢您的使用。</p><p><input class=\"btngray\" style=\"width:90%;\" name=\"\" type=\"button\" value=\"查看充值缴费记录\" onclick=\"javascript:window.location.href='/2121/121.jsp'\" /></p></div>";
	
	var reg=new Regex("(?is)<div class=\"concenter\">.*?<p><img .*?>(?<title>.*?)</p>.*?<p>(?<content>.*?)</p>");
	Match m =reg.Match(html);
	Console.WriteLine(m.Groups["title"].Value);
	Console.WriteLine(m.Groups["content"].Value);
}
好的 万分感谢大牛 100分结贴给您
q107770540 2016-03-11
  • 打赏
  • 举报
回复
void Main()
{
	string html = "<div class=\"concenter\"><p><img src=\"/images/czcg.gif\" alt=\"\" />我是标题</p><p>我是内容我是内容我是内容,</p><p>感谢您的使用。</p><p><input class=\"btngray\" style=\"width:90%;\" name=\"\" type=\"button\" value=\"查看充值缴费记录\" onclick=\"javascript:window.location.href='/2121/121.jsp'\" /></p></div>";
	
	var reg=new Regex("(?is)<div class=\"concenter\">.*?<p><img .*?>(?<title>.*?)</p>.*?<p>(?<content>.*?)</p>");
	Match m =reg.Match(html);
	Console.WriteLine(m.Groups["title"].Value);
	Console.WriteLine(m.Groups["content"].Value);
}
q107770540 2016-03-11
  • 打赏
  • 举报
回复
(?is)<div class="concenter">.*?<p><img .*?>(?<title>.*?)</p>.*?<p>(?<content>.*?)</p>
qq_34213012 2016-03-11
  • 打赏
  • 举报
回复
引用 1 楼 q107770540 的回复:
有什么规则呢???
就是提取出里面的: 我是标题我是标题 我是内容我是内容我是内容,
q107770540 2016-03-11
  • 打赏
  • 举报
回复
有什么规则呢???

110,529

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧