37,720
社区成员
发帖
与我相关
我的任务
分享
>>> import re
>>> s= "杰弗里斯家减肥了的。世界的了附件了?飞了数据分类就!发生了看见的了就。世界的了附件?发生空间邓丽君!"
>>> n = re.compile("?|!|。")
>>> n.split(s)
['\xe6\x9d\xb0\xe5\xbc\x97\xe9\x87\x8c\xe6\x96\xaf\xe5\xae\xb6\xe5\x87\x8f\xe8\x82\xa5\xe4\xba\x86\xe7\x9a\x84', '\xe4\xb8\x96\xe7\x95\x8c\xe7\x9a\x84\xe4\xba\x86\xe9\x99\x84\xe4\xbb\xb6\xe4\xba\x86', '\xe9\xa3\x9e\xe4\xba\x86\xe6\x95\xb0\xe6\x8d\xae\xe5\x88\x86\xe7\xb1\xbb\xe5\xb0\xb1', '\xe5\x8f\x91\xe7\x94\x9f\xe4\xba\x86\xe7\x9c\x8b\xe8\xa7\x81\xe7\x9a\x84\xe4\xba\x86\xe5\xb0\xb1', '\xe4\xb8\x96\xe7\x95\x8c\xe7\x9a\x84\xe4\xba\x86\xe9\x99\x84\xe4\xbb\xb6', '\xe5\x8f\x91\xe7\x94\x9f\xe7\xa9\xba\xe9\x97\xb4\xe9\x82\x93\xe4\xb8\xbd\xe5\x90\x9b', '']
>>> for i in n.split(s):
... print i
...
杰弗里斯家减肥了的
世界的了附件了
飞了数据分类就
发生了看见的了就
世界的了附件
发生空间邓丽君
>>>
# -*- coding: utf-8 -*-
import re
s= u"杰弗里斯家减肥了的。世界的了附件了?飞了数据分类就!发生了看见的了就。世界的了附件?发生空间邓丽君!"
r = re.compile(u"?|!|。")
for row in r.split(s) :
print row.encode('gbk')