正则表达式匹配html标签内的内容

cm君 2015-05-08 11:30:12
例如标签如下
<div class="tour-title">
<h3 >这里是要匹配的内容,但是可能包括<这个符号</h3>

我想匹配的内容是“这里是要匹配的内容,但是可能包括<这个符号”
我原本用的正则式
boost::regex re("<\\s*div\\s*class\\s*=\\s*\"tour-title\"\\s*>\\s*<\\s*h3\\s*>([^<]*)<\\s*/\\s*h3\\s*>",
boost::regex::normal | boost::regbase::icase);
这个正则式在内容里面包括“<”这个符号时会出问题吧,那应该怎么处理好呢?
...全文
819 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
ralln 2015-05-09
  • 打赏
  • 举报
回复
用零宽断言吧,(?=<h3>).*(?<=</h3>)

3,055

社区成员

发帖
与我相关
我的任务
社区描述
VC/MFC HTML/XML
社区管理员
  • HTML/XML社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧