一堆大数据中找到相同的数

avcodec-decoder 2014-03-14 09:22:56
一堆大数据由点组成,很大,不能排序,怎样找到相同的数据?最好节省内存。
...全文
447 9 打赏 收藏 转发到动态 举报
写回复
用AI写文章
9 条回复
切换为时间正序
请发表友善的回复…
发表回复
sanguomi 2014-03-20
  • 打赏
  • 举报
回复
没看清楚, 是点。。 点有(X, Y) 一堆点数据大文件, 按点的X坐标HASH 然后分成很多个小文件, 小文件是可以读进内存的 相同X坐标的点肯定在一个小文件,然后做排序就可以了, X优先, Y后比较, 然后得到一个有序的点集合, 再比较就可以输出了
SmallzeCode 2014-03-19
  • 打赏
  • 举报
回复
遍历然后判断。。
avcodec-decoder 2014-03-19
  • 打赏
  • 举报
回复
引用 6 楼 sanguomi 的回复:
这都是大公司笔试题。
这是实际问题!还有就是数据不是数字,是两个点,没办法用编程珠玑上面的那个bitmap
sanguomi 2014-03-15
  • 打赏
  • 举报
回复
这都是大公司笔试题。
sanguomi 2014-03-15
  • 打赏
  • 举报
回复
bitmap就可以。
worldy 2014-03-14
  • 打赏
  • 举报
回复
使用KMP搜索
oyljerry 2014-03-14
  • 打赏
  • 举报
回复
Hash,然后就是遍历一遍
__cc__ 2014-03-14
  • 打赏
  • 举报
回复
引用 楼主 zhouhangjay 的回复:
一堆大数据由点组成,很大,不能排序,怎样找到相同的数据?最好节省内存。
我说下我的观点啊,时间和内存是矛盾的,如果时间是重要的,譬如要是最快速度整理,那肯定要用很多内存来缓存,一次遍历完成了,甚至采用分布式完成整理。 如果你对时间要求不大,但是内存有限,可以多次遍历完成。
许文君 2014-03-14
  • 打赏
  • 举报
回复
可以参考金山游侠搜索的实现机制。

16,472

社区成员

发帖
与我相关
我的任务
社区描述
VC/MFC相关问题讨论
社区管理员
  • 基础类社区
  • Web++
  • encoderlee
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

        VC/MFC社区版块或许是CSDN最“古老”的版块了,记忆之中,与CSDN的年龄几乎差不多。随着时间的推移,MFC技术渐渐的偏离了开发主流,若干年之后的今天,当我们面对着微软的这个经典之笔,内心充满着敬意,那些曾经的记忆,可以说代表着二十年前曾经的辉煌……
        向经典致敬,或许是老一代程序员内心里面难以释怀的感受。互联网大行其道的今天,我们期待着MFC技术能够恢复其曾经的辉煌,或许这个期待会永远成为一种“梦想”,或许一切皆有可能……
        我们希望这个版块可以很好的适配Web时代,期待更好的互联网技术能够使得MFC技术框架得以重现活力,……

试试用AI创作助手写篇文章吧