高分探讨:如何判断大量的数据是否重复呢?

No9 2002-03-01 04:04:05
各位高手朋友,我想请问一个问题:
就是对于一些大量的数据如何判断其重复性呢?比如现在对于系统的所有驱动器进行检查,查找重复的文件。
各位有没有什么行之有效的方法呢?
...全文
142 12 打赏 收藏 转发到动态 举报
写回复
用AI写文章
12 条回复
切换为时间正序
请发表友善的回复…
发表回复
Rodgu 2002-07-30
  • 打赏
  • 举报
回复
还是建议存入数据库,用SQL的group by列重复文件。

这是很耗时的工作
No9 2002-07-30
  • 打赏
  • 举报
回复
开始加分了,就大致按照平均的原则加分吧!
No9 2002-07-30
  • 打赏
  • 举报
回复
这个帖子好久了!
看来没有什么新的观点!
难道都没有什么创新的意识吗?
仅仅知道书上是怎么说就怎么办吗???

嘿!我无话可说了!!!
Brierbird 2002-05-11
  • 打赏
  • 举报
回复
关注!
kyocn 2002-03-12
  • 打赏
  • 举报
回复
对数椐进行统计!!
600000 2002-03-11
  • 打赏
  • 举报
回复
关注!
No9 2002-03-05
  • 打赏
  • 举报
回复
怎么没有人愿意进行讨论了吗?
是没有什么新观点,新方法了,还是其它的什么呀?

不是嫌分数太少了吧?如果有什么新的创新方法可以再加分吗!
No9 2002-03-02
  • 打赏
  • 举报
回复
To dct1999:
是的,数据结构类的书应该是有的!

但我现在是想讨论一下具体的方法,而不是去说一下不切实际的算法,因为一些算法可能连编写书的人都搞不明白,只不过是在其它的地方抄的而已——甚至可能抄都抄错了!并且一部分内容已经是很陈旧的了,可能已经不适合现在的具体情况了!

还是让大家尤其此道高手一起研究一下,不是更好吗?
No9 2002-03-02
  • 打赏
  • 举报
回复
写到数据库中?
一定要这样吗?

先不说写入数据库需要运行时间,如果数据量很大呢?现代的硬盘的容量是很大的,如果全部写入数据库中,需要大量的时间和空间,这样程序岂不是需要占用大量的时间和资源吗?
dct1999 2002-03-01
  • 打赏
  • 举报
回复
这些好像应该在数据结构的书里有介绍一些比较好的算法吧
objectman 2002-03-01
  • 打赏
  • 举报
回复
没错,建议先写到数据库中,这样比较快
Jeffrey712 2002-03-01
  • 打赏
  • 举报
回复
先对数据进行关键字排序,然后进行有序插入

16,471

社区成员

发帖
与我相关
我的任务
社区描述
VC/MFC相关问题讨论
社区管理员
  • 基础类社区
  • Web++
  • encoderlee
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

        VC/MFC社区版块或许是CSDN最“古老”的版块了,记忆之中,与CSDN的年龄几乎差不多。随着时间的推移,MFC技术渐渐的偏离了开发主流,若干年之后的今天,当我们面对着微软的这个经典之笔,内心充满着敬意,那些曾经的记忆,可以说代表着二十年前曾经的辉煌……
        向经典致敬,或许是老一代程序员内心里面难以释怀的感受。互联网大行其道的今天,我们期待着MFC技术能够恢复其曾经的辉煌,或许这个期待会永远成为一种“梦想”,或许一切皆有可能……
        我们希望这个版块可以很好的适配Web时代,期待更好的互联网技术能够使得MFC技术框架得以重现活力,……

试试用AI创作助手写篇文章吧