用python正则表达式提取字符串中的中文

Etaozhang 2017-07-09 04:49:37

字符串line='\ufeffD0002044\x01大数据\x01数据分析\x01技术\x01工具\x01应用\n'
想提取出其中的“大数据”，“数据分析”，“技术”，“工具”，“应用”这些中文，用了正则表达式：
>>> pat2='\x01(.*?)'
>>> rs=re.compile(pat2).findall(line)
>>> print(rs)
['', '', '', '', '']
显示的结果是空，请问如何才能正确的提出中文部分。

...全文

864 2 打赏收藏转发到动态举报

写回复

用AI写文章

2 条回复

切换为时间正序

请发表友善的回复…

发表回复

Etaozhang 2017-07-09

打赏
举报

谢谢！运行能得到想要的结果！

chuifengde 2017-07-09

打赏
举报

import re 

line=r"\ufeffD0002044\x01大数据\x01数据分析\x01技术\x01工具\x01应用\n"
x=re.findall(r"(?<=\\x01)(.+?)(?=\\)",line)
print(x)

获取的功能是正则表达式来提取字符串中符合要求的文本；替换的功能是查找字符串中符合正则表达式的文本，并用相应的字符串替换；分割的功能是使用正则表达式对字符串进行分割。 正则表达式检索与替换正则...

主要介绍了python 正则表达式获取字符串中所有的日期和时间，本文给大家介绍的非常详细，具有一定的参考借鉴价值,需要的朋友可以参考下

主要介绍了Python使用中文正则表达式匹配指定中文字符串的方法,结合实例形式分析了Python正则匹配及字符编码相关操作技巧,需要的朋友可以参考下

主要介绍了python正则表达式从字符串中提取数字的思路详解,非常不错，具有一定的参考借鉴价值，需要的朋友可以参考下

什么是正则表达式 正则表达式，是简单地字符的序列，可指定特定的搜索模式。正则表达式已存在很长一段时间，并且它本身就是计算机科学的一个领域。...Python正则表达式使用模式字符串表示，模式字

脚本语言

37,721

社区成员

34,239

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

试试用AI创作助手写篇文章吧

+ 用AI写文章