python 正则的奇怪问题,各位看看

king6o60 2009-07-09 11:35:57
data内容:
<tr >
<td>131</td>
<td>8</td>
<td class="s"><a href="/f?kz=601470589" target=_blank > 本吧强烈不欢迎以学黑客技术为目的的访问者 </a>[<font class="red">置顶</font>] </td>
<td><a href="http://passport.baidu.com/?detail&aid=6&default_tab=1&un=andelf" target=_blank><font color='#000000'>andelf</font></a></td>
<td>7-8  <a href="http://passport.baidu.com/?detail&aid=6&default_tab=1&un=FE%D0%C7%BA%D3" target=_blank><font color='#000000'> FE星河</font></a></td>
</tr>

想要匹配发帖数,回帖数,帖子链接,以及帖子题目,和发帖人。
但是匹配发帖人的时候出现问题。


<td>(\d+)</td>\s*<td>(\d+)</td>\s*<td\s+class="s"><a\s+href="/f\?kz=\d+"\s+target=_blank\s*>.{1,50}?</a>
是可以正常匹配的,但是加上匹配发帖人的时候却怎么也匹配不到。何解呢。。。?

整个正则表达式
<td>(\d+)</td>\s*<td>(\d+)</td>\s*<td\s+class="s"><a\s+href="/f\?kz=\d+"\s+target=_blank\s*>.{1,50}?</a>.*?<font\s+color='#000000'
...全文
66 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
king6o60 2009-07-09
  • 打赏
  • 举报
回复

data="""
<tr >
<td>131</td>
<td>8</td>
<td class="s"><a href="/f?kz=601470589" target=_blank > 本吧强烈不欢迎以学黑客技术为目的的访问者 </a>[<font class="red">置顶</font>] </td>
<td><a href="http://passport.baidu.com/?detail&aid=6&default_tab=1&un=andelf" target=_blank><font color='#000000'>andelf</font></a></td>
<td>7-8  <a href="http://passport.baidu.com/?detail&aid=6&default_tab=1&un=FE%D0%C7%BA%D3" target=_blank><font color='#000000'> FE星河</font></a></td>
</tr>
"""
re_m = """<td>(\d+)</td>\s*<td>(\d+)</td>\s*<td\s+class="s"><a\s+href="/f\?kz=\d+"\s+target=_blank\s*>.{1,50}?</a>.*?<font\s+color='#000000'"""

lovetysx 2009-07-09
  • 打赏
  • 举报
回复
这是你追加的:
.*? <font\s+color='#000000'

其中的?<是不是被当作后向预查,需要转义?
雪夜之狼 2009-07-09
  • 打赏
  • 举报
回复
分分~
lioujian47 2009-07-09
  • 打赏
  • 举报
回复
接分
king6o60 2009-07-09
  • 打赏
  • 举报
回复
随便来个人给分
结贴吧。。
我自己弄错了。。。不能这么浮躁。

37,721

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧