关于C#里解析HTML用的正则表达式问题

huangya0 2005-04-30 03:18:53
用正则表达式"<td[^>]+class=\"bodytxt\".*?>[.\n]*?</td>"匹配不了 <td class="bodytxt">
63A BONHAM ROAD HONG KONG</td>
和<td align="left" class="bodytxt">

Chairman of SMC<br>学校管理委员会主席:
<br>
MS IP LING-BIK <br>
叶灵璧女士    <br><br>
</td></tr>
<tr><td align="left" class="bodytxt">Head of School 校长: <br>
MR HO YUE SHUN
<br>
何汝淳先生
</td>
请问那个高手可以指点一下,帮我修改一个正则表达式,我试过设置System.Text.RegularExpressions.RegexOptions.Multiline也不行
...全文
255 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
Macor 2005-05-09
  • 打赏
  • 举报
回复
"((<td class=\"bodytxt\">)(?<ms>.[^<]*)(</td>))"
这个正则表达式代表 匹配所有"<td class="bodytxt">和 </td>之间的数据
好像跟有没有回车没有关系
mobydick 2005-05-02
  • 打赏
  • 举报
回复
string regexStr = @"<td[^>]+class=""bodytxt"".*?>\s*[^<]*</td>";//在<td>结束时加上一个/s+匹配空白字符,也就包括回车换行了。
huangya0 2005-04-30
  • 打赏
  • 举报
回复
<td class="bodytxt">
63A BONHAM ROAD HONG KONG</td>
就这个行了,第一行的时侯有换行,而我写了一个这样的正则表达式
"<td[^>]+class=\"bodytxt\".*?>[.\n]*?</td>"
但匹配不了
Macor 2005-04-30
  • 打赏
  • 举报
回复
太多空格,建议楼主下次发贴的时候把这个弄整齐点,下次再给你看
huangya0 2005-04-30
  • 打赏
  • 举报
回复
就是在<td></td>间的内容有些有换行的,但有些没有换行的,要怎么写正则表达式呢
上面我写的正则表达式能匹配这些<td class="bodytxt">Tel. 电话: <br>25470310 </td>
但就是不能匹配<td></td>中间有换行的

110,539

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧