如何解决python正则匹配的懒惰性问题

zhonghuayindi 2011-05-02 02:07:47

import re
cn=lambda x:x.decode("u8")
a=re.findall("\(.*\)",cn("5不去(jmj),了(j大家m你)不"))
for i in a:
print i
运行结果:(jmj),了(j大家m你)
我知道这是正则匹配的懒惰性造成的，那么该怎么修改来避免这一点
从而得到如下的运行结果：
(jmj)
(j大家m你)

...全文

151 5 打赏收藏转发到动态举报

写回复

5 条回复

切换为时间正序

请发表友善的回复…

发表回复

iambic 2011-05-02

打赏
举报

回复

r'\([^)]*\)'

luotuo512 2011-05-02

打赏
举报

回复

*?, +?, ??
The "*", "+", and "?" qualifiers are all greedy; they match as much text as possible. Sometimes this behaviour isn't desired; if the RE <.*> is matched against '<H1>title</H1>', it will match the entire string, and not just '<H1>'. Adding "?" after the qualifier makes it perform the match in non-greedy or minimal fashion; as few characters as possible will be matched. Using .*? in the previous expression will match only '<H1>'.

奔跑哥 2011-05-02

打赏
举报

回复

a=re.findall("\(.*？\)",cn("5不去(jmj),了(j大家m你)不"))

zhonghuayindi 2011-05-02

打赏
举报

回复

晕，不会结帖给分…

zhonghuayindi 2011-05-02

打赏
举报

回复

谢谢三位高人！

主要介绍了python正则表达式的懒惰匹配和贪婪匹配说明，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

处理GBK和utf8之类的字符编码, 同时正则匹配Pattern中包含汉字,要汉字正常发挥作用,必须非常谨慎.推荐最好统一为utf8编码,如果不是这种最优情况,也有酌情处理. 往往一个具有普适性的正则表达式会简化程序和代码的...

听说，能手撸正则表达式的都不算坑，小菜加油ing~ 简述元字符前瞻与后顾主要函数具体实例校验email地址校验手机号码校验身份证号（校验日期格式）校验密码强度匹配空格前瞻与后顾贪婪与懒惰注意事项 ...

目录一、本文目标 3 二、如何使用本教程 3 三、正则表达式到底是...十七、贪婪与懒惰 16 十八、处理选项 17 十九、平衡组/递归匹配 18 二十、还有些什么东西没提到 20 二十一、网上的资源及本文参考文献 21

python正则表达式总结

37,721

社区成员

34,239

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

试试用AI创作助手写篇文章吧

+ 用AI写文章