正则表达式问题，python

Freezind 2009-07-07 04:41:29

s= "杰弗里斯家减肥了的。世界的了附件了？飞了数据分类就！发生了看见的了就。世界的了附件？发生空间邓丽君！"
用正则表达式把它分割成

"杰弗里斯家减肥了的"
"世界的了附件了"
"飞了数据分类就"
"发生了看见的了就"
"世界的了附件"
"发生空间邓丽君"

可以做到吗？
我想一次做到，但是不行。我是这样想的。

r = re.compile("？|！|。")
r.split(s)

程序报错。

...全文

279 5 打赏收藏转发到动态举报

写回复

用AI写文章

5 条回复

切换为时间正序

请发表友善的回复…

发表回复

Freezind 2009-07-07

打赏
举报

sorry。
各位抱歉了。我的输入是英文的问号，所以出错了。
谢谢大家了。

Freezind 2009-07-07

打赏
举报

真奇怪了，我把楼上的代码复制到我的机子上可以运行，但是我自己输入的就会报上面的错。

Freezind 2009-07-07

打赏
举报

>>> import re
>>> r = re.compile("?|!")
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "C:\Python25\lib\re.py", line 188, in compile
return _compile(pattern, flags)
File "C:\Python25\lib\re.py", line 241, in _compile
raise error, v # invalid expression
sre_constants.error: nothing to repeat

king6o60 2009-07-07

打赏
举报

经试验，无错啊。



>>> import re

>>> s= "杰弗里斯家减肥了的。世界的了附件了？飞了数据分类就！发生了看见的了就。世界的了附件？发生空间邓丽君！" 

>>> n = re.compile("？|！|。")

>>> n.split(s)

['\xe6\x9d\xb0\xe5\xbc\x97\xe9\x87\x8c\xe6\x96\xaf\xe5\xae\xb6\xe5\x87\x8f\xe8\x82\xa5\xe4\xba\x86\xe7\x9a\x84', '\xe4\xb8\x96\xe7\x95\x8c\xe7\x9a\x84\xe4\xba\x86\xe9\x99\x84\xe4\xbb\xb6\xe4\xba\x86', '\xe9\xa3\x9e\xe4\xba\x86\xe6\x95\xb0\xe6\x8d\xae\xe5\x88\x86\xe7\xb1\xbb\xe5\xb0\xb1', '\xe5\x8f\x91\xe7\x94\x9f\xe4\xba\x86\xe7\x9c\x8b\xe8\xa7\x81\xe7\x9a\x84\xe4\xba\x86\xe5\xb0\xb1', '\xe4\xb8\x96\xe7\x95\x8c\xe7\x9a\x84\xe4\xba\x86\xe9\x99\x84\xe4\xbb\xb6', '\xe5\x8f\x91\xe7\x94\x9f\xe7\xa9\xba\xe9\x97\xb4\xe9\x82\x93\xe4\xb8\xbd\xe5\x90\x9b', '']

>>> for i in n.split(s):

...     print i

... 

杰弗里斯家减肥了的

世界的了附件了

飞了数据分类就

发生了看见的了就

世界的了附件

发生空间邓丽君



>>>

多鱼的夏天 2009-07-07

打赏
举报

报错大概是因为没有import re



# -*- coding: utf-8 -*-

import re

s= u"杰弗里斯家减肥了的。世界的了附件了？飞了数据分类就！发生了看见的了就。世界的了附件？发生空间邓丽君！" 

r = re.compile(u"？|！|。")

for row in r.split(s) :

  print row.encode('gbk')