社区
脚本语言
帖子详情
求快速查找重复行算法
yuanyuanmmm
2010-01-08 02:32:11
15万行的数据 查找是否有重复行,数据是要存入数据库的DBF文件,请问谁有好的算法?
...全文
219
6
打赏
收藏
求快速查找重复行算法
15万行的数据 查找是否有重复行,数据是要存入数据库的DBF文件,请问谁有好的算法?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
6 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
yuanyuanmmm
2010-01-13
打赏
举报
回复
问题解决了 用的5楼的办法
notax
2010-01-09
打赏
举报
回复
15万行的数据, 不算多,python 顶的住
如果象是apache log 的话,用sort,uniq, awk 也很方便
thy38
2010-01-09
打赏
举报
回复
既然存入数据库,那就直接用SQL好了。要是不用SQL,也就只有排序或者HASH了。
angel_su
2010-01-09
打赏
举报
回复
自己处理就用hash吧,查找时间复杂度趋近O(1)应该是最快的...
jiuchang
2010-01-08
打赏
举报
回复
linux下有一个命令sort -u filename可以把一个文件排序并去重
然后可以和原来的文件行数做较就知道有没有重复的行了
这个方法不用自己写代码,应该最简单,15万行一会就跑完了
CDSoftwareWj
2010-01-08
打赏
举报
回复
select DISTINCT xxx from xxx
Orz
图解Java数据结构和
算法
稀疏数组、单向队列、环形队列、单向链表、双向链表、环形链表、约瑟夫问题、栈、前缀、中缀、后缀表达式、中缀表达式转换为后缀表达式、递归与回溯、迷宫问题、八皇后问题、
算法
的时间复杂度、冒泡排序、选择排序、...
七大
查找
算法
查找
就是在一个数据集合里
查找
到你需要的数据,
查找
算法
就是在
查找
过程中使用的
算法
常用
算法
——
查找
算法
常用
查找
算法
大致可分为七大
查找
算法
:顺序
查找
、二分
查找
、插值
查找
、Fibonacci
查找
、分块
查找
、树表
查找
和HashTable
查找
。本篇详细介绍其中的顺序
查找
、二分
查找
、插值
查找
、Fibonacci(斐波那契)
查找
四种
查找
算法
...
【数据结构】八个常用
查找
算法
最基础的遍历无序列表的
查找
算法
顺序
查找
又称为线性
查找
,是一种最简单的
查找
方法。适用于线性表的顺序存储结构和链式存储结构。该
算法
的时间复杂度为O(n)二分
查找
(Binary Search),是一种在有序数组中
查找
某一...
Python(14)
查找
算法
查找
算法
是在程序设计中最常用到的
算法
。假定要从n个元素中
查找
x的值是否存在,从头到尾逐个
查找
,这种方法称为顺序
查找
法。 顺序
查找
法有三种情况可能发生:在最好的情况下,第一项就是要找的数据结构,只有一次...
脚本语言
37,719
社区成员
34,238
社区内容
发帖
与我相关
我的任务
脚本语言
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
复制链接
扫一扫
分享
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
试试用AI创作助手写篇文章吧
+ 用AI写文章