python去重的问题

ganmu 2012-09-10 01:32:11
各位大侠,现在我有一些文本如下


1 xx 1.1.1.1 2012-09-10 08:22:03



我现在要把第二行和第三行是一样的数据去掉,请问python该如何写?
...全文
313 15 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
15 条回复
切换为时间正序
请发表友善的回复…
发表回复
ganmu 2012-09-16
  • 打赏
  • 举报
回复
[Quote=引用 12 楼 的回复:]

鄙视张口要代码不思考的人
[/Quote]

你怎么知道我没思考过?我觉得你不愿意回答就不要乱说.

有本事写个出来看看,只知道说别人不是,自己也写不出来,那也是废物。
ganmu 2012-09-16
  • 打赏
  • 举报
回复
你怎么知道我没思考过?我觉得你不愿意回答就不要乱说.
Gloveing 2012-09-10
  • 打赏
  • 举报
回复
[Quote=引用 12 楼 的回复:]
鄙视张口要代码不思考的人
[/Quote]
++
先对字符串根据空格split -》 使用一个列表记录已经出现过的字符串 -》for循环,已经在列表中的不加入列表,不输出;不在列表中的则加入列表,输出
luotuo512 2012-09-10
  • 打赏
  • 举报
回复
鄙视张口要代码不思考的人
zengna_com 2012-09-10
  • 打赏
  • 举报
回复
你这个序号删掉后要连续吗
  • 打赏
  • 举报
回复
按行存到列表里(或字典,考虑到还要打印,存字典有点罗嗦,如果没效率要求用列表就好了),存的时候和列表内的值比较一次,是否有重复的,有重复就不用添加了,最后再依次打印列表中的数据就可以了
ganmu 2012-09-10
  • 打赏
  • 举报
回复
第二列和第三列都和下面的行相同则去重
bugs2k 2012-09-10
  • 打赏
  • 举报
回复
是第2列和第3列?还是
第2行和第3行?
qq120848369 2012-09-10
  • 打赏
  • 举报
回复
[liangdong@bb-browser-test00.vm.baidu.com py_project]$ python3 main.py 
[['2', 'xssx121', '2.1.1.1', '2012-09-10', '08:22:03'], ['3', 'x1sx2', '3.1.1.1', '2012-09-10', '08:22:03'], ['4', 'xx', '1.1.1.1', '2012-09-10', '08:22:03']]
[liangdong@bb-browser-test00.vm.baidu.com py_project]$ cat main.py
# python version:3.2
# -*- coding:utf-8 -*-

result = {}

with open('xxx.data', 'r') as stream:
for line in stream:
fields = line.split()
key = fields[1:3]
result["__UGLY_TOKEN__".join(key)] = fields

print(list(iter(result.values())))
[liangdong@bb-browser-test00.vm.baidu.com py_project]$ cat xxx.data
1 xx 1.1.1.1 2012-09-10 08:22:03
2 xssx121 2.1.1.1 2012-09-10 08:22:03
3 x1sx2 3.1.1.1 2012-09-10 08:22:03
4 xx 1.1.1.1 2012-09-10 08:22:03
[liangdong@bb-browser-test00.vm.baidu.com py_project]$ cat main.py
# python version:3.2
# -*- coding:utf-8 -*-

result = {}

with open('xxx.data', 'r') as stream:
for line in stream:
fields = line.split()
key = fields[1:3]
result["__UGLY_TOKEN__".join(key)] = fields

print(list(iter(result.values())))


这个意思?
angel_su 2012-09-10
  • 打赏
  • 举报
回复
一般把特征数据段放进字典或集合里,进行查询比较....
ganmu 2012-09-10
  • 打赏
  • 举报
回复
数据格式是

1 xx 1.1.1.1 2012-09-10 08:22:03
2 xssx121 2.1.1.1 2012-09-10 08:22:03
3 x1sx2 3.1.1.1 2012-09-10 08:22:03
4 xx 1.1.1.1 2012-09-10 08:22:03

就是文本的,以空格为分隔符,空格可能不标准。也有\t之类的。
bugs2k 2012-09-10
  • 打赏
  • 举报
回复
不太明白意思?数据格式如何
ganmu 2012-09-10
  • 打赏
  • 举报
回复
python模块的人这么少啊。
ganmu 2012-09-10
  • 打赏
  • 举报
回复
求大神们指教啊。
ganmu 2012-09-10
  • 打赏
  • 举报
回复
注意下的是中间的空格并不标准,有可能是2个空格,也有可能是三个

37,743

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • WuKongSecurity@BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧