求快速查找重复行算法

yuanyuanmmm 2010-01-08 02:32:11
15万行的数据 查找是否有重复行,数据是要存入数据库的DBF文件,请问谁有好的算法?
...全文
219 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
yuanyuanmmm 2010-01-13
  • 打赏
  • 举报
回复
问题解决了 用的5楼的办法
notax 2010-01-09
  • 打赏
  • 举报
回复
15万行的数据, 不算多,python 顶的住

如果象是apache log 的话,用sort,uniq, awk 也很方便
thy38 2010-01-09
  • 打赏
  • 举报
回复
既然存入数据库,那就直接用SQL好了。要是不用SQL,也就只有排序或者HASH了。
angel_su 2010-01-09
  • 打赏
  • 举报
回复
自己处理就用hash吧,查找时间复杂度趋近O(1)应该是最快的...
jiuchang 2010-01-08
  • 打赏
  • 举报
回复
linux下有一个命令sort -u filename可以把一个文件排序并去重
然后可以和原来的文件行数做较就知道有没有重复的行了

这个方法不用自己写代码,应该最简单,15万行一会就跑完了
CDSoftwareWj 2010-01-08
  • 打赏
  • 举报
回复
select DISTINCT xxx from xxx

Orz

37,719

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧