用python正则表达式提取字符串中的中文

Etaozhang 2017-07-09 04:49:37
字符串line='\ufeffD0002044\x01大数据\x01数据分析\x01技术\x01工具\x01应用\n'
想提取出其中的“大数据”,“数据分析”,“技术”,“工具”,“应用”这些中文,用了正则表达式:
>>> pat2='\x01(.*?)'
>>> rs=re.compile(pat2).findall(line)
>>> print(rs)
['', '', '', '', '']
显示的结果是空,请问如何才能正确的提出中文部分。
...全文
864 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
Etaozhang 2017-07-09
  • 打赏
  • 举报
回复
谢谢!运行能得到想要的结果!
chuifengde 2017-07-09
  • 打赏
  • 举报
回复
import re 

line=r"\ufeffD0002044\x01大数据\x01数据分析\x01技术\x01工具\x01应用\n"
x=re.findall(r"(?<=\\x01)(.+?)(?=\\)",line)
print(x)

37,721

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧