hash表的容量与算法问题

chichenzhe 2013-10-21 03:05:24

hash表如果以 hash.get(hashcode) 方式从一个数组里直接定位元素的话(假设无哈希碰撞发生)

那么他这个数组该是多大呢???

我们知道 hash散列算出的正整数值是很恐怖的一个大数, 至少得long去装吧. 这么恐怖的数量级, 如果要实现数组的话, 最小值 --> 最大值相减所得到的跨度应该超过数百万是不稀奇的吧?

那么, 也就是说如果要实现一个仅有3个元素的hashtable, 你就得new一个几百万个元素的数组去装载这3个元素. 并且将来add之后还有可能扩大这个跨度.
-----

如果不用这个跨度全覆盖的数组去做的话, 也还有办法,就是二分查找. 折半方式去找. 但这势必不是多了运算量么. 所以, 我想知道这个东西到底是什么情况.

因为我想,为了实现高速索引(不冲突情况下一击即中) 是不可能用掉这么恐怖的内存资源的. 但是详细的技术细节是什么呢, 往高手告知.

...全文

168 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

gomoku 2013-10-21

打赏
举报

回复

通用的，完全不碰撞的hash表是不存在的。碰撞的处理是hash表的基本功。由于hash码的限制，即使出现碰撞，实际使用搜索量也可以大幅度将减少。这就像使用宿舍号码来作为学生的hash码，几个学生可以住同一个宿舍（hash碰撞），但用宿舍号来找人，已经极大地减少了搜索量。

十一、从头到尾彻底解析Hash 表算法作者：July、wuliming、pkuoliver 出处：http://blog.csdn.net/v_JULY_v。说明：本文分为三部分内容，第一部分为一道百度面试题Top K算法的详解；第二部分为关于Hash表算法的详细阐述；第三部分为打造一个最快的Hash表算法。------------------------------------ 第

Hash表中的一些原理/概念，及根据这些原理/概念: 一. Hash表概念二. Hash构造函数的方法，及适用范围三. Hash处理冲突方法，各自特征四. Hash查找过程五. 实现一个使用Hash存数据的场景-------Hash查找算法，插入算法六. JDK中HashMap的实

哈希算法（Hash Algorithm）是一种将任意长度的输入（称为预映射或消息）转换成固定长度输出（称为哈希值或散列值）的函数。哈希值通常是一个较短的、固定长度的数字串，它几乎唯一地对应于原始数据。

　Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入（又叫做预映射， pre-image），通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，而不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。　　哈希表是根据设定...

转载自：https://blog.csdn.net/lucky_greenegg/article/details/51897647HASH 算法是一种消息摘要算法，不是一种加密算法，但由于其单向运算，具有一定的不可逆性，成为加密算法中的一个构成部分，完整的加密机制不能仅依赖 HASH 算法。哈希算法是将目标文本转换成具有相同长度的、不可逆的杂凑字符串（或叫做消息摘要），而加密（Encrypt）是将...

111,130

社区成员

642,542

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧

+ 用AI写文章