python中字符串去重问题

Neptune236 2020-09-30 12:02:32
类似于这种字符串,如何去重
...全文
509 3 打赏 收藏 举报
写回复
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
Swing0_0 2020-10-18
可以考虑分词后去重,中文分词可以考虑用这个包 import jieba
  • 打赏
  • 举报
回复
chuifengde 2020-10-03
这个比较复杂,后面的"什么"也是算重复的,肯定不能去重。
  • 打赏
  • 举报
回复
rrrr336 2020-10-01
需要用到正则。 我刚写的,参考。
# -*- coding: utf-8 -*-
import re
s = '静夜思 床前明月光,疑是床前明月光,疑是地上霜。举头望明月,低头思望明月,低头思故乡'

pat = r'(.+)(\1)+'
for i in re.findall(pat, s):
    s = s.replace(i[0],'', 1)
print(s)
# 静夜思 床前明月光,疑是地上霜。举头望明月,低头思故乡
  • 打赏
  • 举报
回复
相关推荐
发帖
脚本语言
加入

3.7w+

社区成员

JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • ITBOB • 鲍勃
申请成为版主
帖子事件
创建了帖子
2020-09-30 12:02
社区公告

CSDN 脚本语言社区接受专栏投稿(专栏会在顶部创建专属你的栏目),投稿需满足以下要求:

  • 脚本语言技术相关;
  • 文章持续更新,保持活跃;
  • 内容清晰明了,干货为主;
  • 文章排版有序,有条有理。

本社区开通招聘专栏,发布招聘信息请联系版主,发布者需要保证招聘信息真实有效,CSDN 平台和版主不对招聘内容负责!

联系方式:私聊版主、发送邮件、QQ联系等均可: