社区
Java SE
帖子详情
大数据量查找
密码测试
2010-07-18 10:02:51
在2千万左右个乱序正整数中快速查找一个指定正整数是否存在?怎样做性能最好?
...全文
201
15
打赏
收藏
大数据量查找
在2千万左右个乱序正整数中快速查找一个指定正整数是否存在?怎样做性能最好?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
15 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
michaellufhl
2010-07-23
打赏
举报
回复
看场合:
是不是有预留时间把文件上的数据
预处理
一下,譬如放DB和排序。
璇之星
2010-07-23
打赏
举报
回复
飘过``````````
sky123123
2010-07-23
打赏
举报
回复
关注》。》
NewMoons
2010-07-23
打赏
举报
回复
在文件中去查找没有索引的大量数据,这在设计上就是有问题的,几乎无解。
要想解决必须排序后加索引。
yfxucn
2010-07-22
打赏
举报
回复
飘过``````````
closewbq
2010-07-22
打赏
举报
回复
写在文件中,我觉得没有什么好的办法。
还是BufferedReader读就是了。两千万数据也就是80M多应该。
密码测试
2010-07-22
打赏
举报
回复
[Quote=引用 6 楼 amdgaming 的回复:]
好题目啊, 关键还是 需要 先 用到 外排序啊
[/Quote]
具体怎么实现,能说详细一点么?
dinglimin2009
2010-07-18
打赏
举报
回复
[Quote=引用 3 楼 tangqang19880405 的回复:]
先用快速排序法,或堆排序法对这些数进行排序,排序好了后就把他保存下来,再在这个基础上建立一个索引,这样就很方便以后进行查找了。只要一次排序,以后进行就不用了。如果要添加新的数据,进行有序插入即可.
[/Quote]期待贴出代码 学习一下
密码测试
2010-07-18
打赏
举报
回复
可能问题描述的不是很清楚,数据放在一个大文件中,每行一个,大约2千万左右条记录。
3楼说的排序肯定是要的,但数据量太大,直接排序估计不行。而且也要考虑性能问题。
RainRainbow
2010-07-18
打赏
举报
回复
mark
tangqang19880405
2010-07-18
打赏
举报
回复
先用快速排序法,或堆排序法对这些数进行排序,排序好了后就把他保存下来,再在这个基础上建立一个索引,这样就很方便以后进行查找了。只要一次排序,以后进行就不用了。如果要添加新的数据,进行有序插入即可.
Ade子夜
2010-07-18
打赏
举报
回复
[Quote=引用 1 楼 hudie1234567 的回复:]
先排序,然后用二分法查找!当然,你得找个效率较高的排序方法!
[/Quote]
我期待啊!!
茫茫大海
2010-07-18
打赏
举报
回复
先排序,然后用二分法查找!当然,你得找个效率较高的排序方法!
huntor
2010-07-18
打赏
举报
回复
hashing
amdgaming
2010-07-18
打赏
举报
回复
好题目啊, 关键还是 需要 先 用到 外排序啊
【李宁】深度解析Python数据分析(大
量
实战案例)
本课程包含Python数据分析的基础知识,如Pandas、MatlabliNumpy等,还包含Python数据分析的核心知识以及大
量
案例,如、数据质
量
分析、数据特征分析、数据预处理、挖掘建模、财政收入影响因素分析及预测、航空公司客户价值分析、电子商务网站用户行为分析与服务推荐等。
查找
算法以及大
量
数据
查找
问题
1、顺序
查找
:从数据结构线形表的一端开始,顺序扫描,依次将扫描到的结点关键字与给定值k相比较,若相等则表示
查找
成功;若扫描结束仍没有找到关键字等于k的结点,表示
查找
失败。O(n)int SequenceSearch(int a[], int value, int n) { int i; for(i=0; i<n; i++) if(a[i]==value) ...
数据结构--七大
查找
算法总结
查找
是在大
量
的信息中寻找一个特定的信息元素,在计算机应用中,
查找
是常用的基本运算,例如编译程序中符号表的
查找
。本文简单概括性的介绍了常见的七种
查找
算法,说是七种,其实二分
查找
、插值
查找
以及斐波那契
查找
都可以归为一类——插值
查找
。插值
查找
和斐波那契
查找
是在二分
查找
的基础上的优化
查找
算法。树表
查找
和哈希
查找
会在后续的博文中进行详细介绍。
查找
定义:根据给定的某个值,在
查找
表中确定一个其关键字...
如何处理海
量
数据文件以及大文件数据
查找
同样,一个数据只会映射一个比特位,在两个位图中会映射同样的比特位,这两个比特位正好可以用于记录数据出现的次数。数据第一次映射时置为0 1,第二次为1 0,第三次为1 1。如果是40亿个数据,最多就需要40亿个比特位,即476MB。当找寻数据时,只需要在位图中找到该数据对应的比特位,如果为1说明有,0说明没有。当然,前提是数据进文件时就已经建立位图了,否则
查找
时再建立位图还是要遍历数据。这时一个位图已经无法满足需求,因为一个位图只能通过0和1判断数据是否存在。不管是哪种,面对40亿个数据其效率都不会太高。
数据结构-
查找
数据结构-
查找
查找
基本概念 1.
查找
:在数据集合中寻找满足要求的的数据元素成为
查找
,
查找
有两种结果1.
查找
成功,找到目标元素;2.
查找
失败,遍历完集合仍未找到目标元素。 2.
查找
表:用于
查找
的数据集合叫做
查找
表,由同一类型的数据元素组成。对
查找
表的操作一般有四种1.
查找
某个元素是否在
查找
表中 2.访问目标元素 3.向
查找
表中插入元素 4.从
查找
表中删除元素。
查找
的类别 顺序
查找
顺序
查找
又叫线性
查找
,从线性表的一端顺序
查找
到另一端。顺序
查找
既可用于顺序表,也适用于链表。当被
查找
的线性表有序时,则不必一一
Java SE
62,614
社区成员
307,327
社区内容
发帖
与我相关
我的任务
Java SE
Java 2 Standard Edition
复制链接
扫一扫
分享
社区描述
Java 2 Standard Edition
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章