关于hashMap数据结构

Never妥协 2020-08-26 10:19:29

刚才我在看hashmap数组结构的时候，看到这张图，，然后有点疑惑？

我看这幅图理解的是，数组table[]存的是key，，链表用来存对应的value，一般情况下不是一个key对应一个value嘛，那如果一个key对应一个链表的话，value对应的是不是就是一个arrayList之类的数据结构，然后当arrayList存储的长度大于8以后，链表这个数据结构重组为红黑树？
不知道我的这个理解对不对？如果有问题，麻烦帮我指点一下，有点迷。。

...全文

8954 20 打赏收藏转发到动态举报

写回复

用AI写文章

20 条回复

切换为时间正序

请发表友善的回复…

发表回复

Woo_home 2020-09-19

打赏
举报

可以看下这篇文章 https://blog.csdn.net/Woo_home/article/details/103146845

西瓜芒果柚子橘子橙子草莓提子葡萄 2020-09-09

打赏
举报

引用 14 楼 qq_39936465 的回复:

[quote=引用 13 楼葡萄柚子芒果橘子龙眼的回复:]大概就是这样子的，至于更深入的了解，一起学习哈

哈值不可能小到只有1-4，这个是哈值相对数组长度取余的结果，所以不只是哈值相等才会编入一组，取余相等也会编入一组。[/quote]嗯嗯，假设一下

baoger1314 2020-09-08

打赏
举报

我对key ,value的理解是这样的, key 只是用来通过计算hashcode,来找对应的entry数组下标的, 然后再将value值插进去,一个节点除了头(尾)指针外,数据域只存的value, 所以,他的hashmap的遍历方式才会有通过entry去找key,和value的方式; 而且一个key 对应一个链表的说法,不准确 , 不同key通过与运算也有可能插入同一个桶中(hash碰撞);而且它对应的不是arraylist , 应该是单链表吧, 也不是其中一个桶链表长度大于8时候就得转 ,好像还有个条件, 忘了 = =

松鼠不是鼠 2020-09-07

打赏
举报

说一下我的理解，首先你图中的情况我一般是在存储对象的时候出现，在存储的时候会首先进行hash值计算，通过hash来定位（图中第一排的位置），但是hash不一定每一次都生成唯一的，因为容器对象是有限的，所以在hash值计算一样的时候就会出现在同一位置，这个时候通过equals来比较这个位置是否已经存在，不存在的时候就会生成一个链表，但是链表都知道，遍历是需要从头到尾进行遍历查找的，所以在一定长度就进行转换红黑树，用红黑树的计算方式进行快速定位。所以，这就是为什么我们在存储对象的时候要重写hashcode和equals方法，因为不重写equals方法的话，在通过hash进行定位到同一位置，equals进行判断是否存在对象的时候，默认调用object的equals，判断是的是对象地址。希望可以帮到你

qq_39936465 2020-09-07

打赏
举报

所以当数组扩容后，会重新排列，原来在一组的数据，扩容后可能不在同一组。

qq_39936465 2020-09-07

打赏
举报

引用 13 楼葡萄柚子芒果橘子龙眼的回复:

大概就是这样子的，至于更深入的了解，一起学习哈

哈值不可能小到只有1-4，这个是哈值相对数组长度取余的结果，所以不只是哈值相等才会编入一组，取余相等也会编入一组。

冰思雨 2020-09-07

打赏
举报

楼主啊，理解的好像有点问题。链表里面有表头的概念，还记得吗？表头一般不存放数据，只是表示链表的开始（双向链表还表示结束）。使用表头，可以化简链表增删时的操作代码，使得代码简洁，更容易被理解。 HashMap里面，数组里面存放的就是表头，它的意思是，我有一个数组的表头，也就是数组的每一个元素，都将会是一个链表。那么，问题来了，我要是有一个键值对，想保存到 HashMap 中，怎么放呢？首先，计算 Key 对象的 hashCode 值，然后，将这个值对数组的size取余，得到的就是数组的下角标，或者说，链表的编号（如果从0开始编号的话）。能理解嘛？ Key 对象的 hashCode 值，就是为了找到链表的。然后，找到对应的链表之后，将键值对封装成 Entity 对象，放入链表中，记住啊，链表中存放的是键值对。经过多次的添加操作之后，由于存入的 key 值不同，key 对应的 hashCode 值也会不同，你会发现，这些键值对会被分配到不同的链表中进行保存。什么？可能有不同key的键值对，保存到了同一个链表里面？对啊，链表可以存放多个对象（键值对），而且，可以很灵活的存放多个对象。问题的关键不是链表保存了多个对象，而是，数组中的链表，保存对象的个数不太平均，这样的话，会影响查找的速度的。怎样通过 Key 的值，得到 Value 值？首先，计算 Key 对象的 hashCode 值，然后，将 hashCode 对数组的 size 取余，得到数组的下角标，也就是链表的表头。然后，顺着链表调用 Key 对象 equals 方法，比较和 Key 相同的键值对，找到之后，将 Value 取出即可。如果链表很长，查找速度就会降低。这就涉及到一个优化方式的问题。加载因子 loadFactor。（一般是 3/4 ）什么意思？就是 HashMap 最多能够存放数组长度的 3/4 个键值对，当然，浮点数要进行取整运算才行。明白了吗？为了提高HashMap 的查询性能，我们尽量让数组后面的链表长度等于一，这样的话，我们一下就可以找到了。根据经验而谈，3/4 是个不错的数字。当然啦，如果你的 HashMap 非常大的话，数组建的太大，也会浪费内存，那就需要你稍微调大一点加载因子，让它更趋近1一些。如果现在我们的 HashMap 数组只有16个的大小，那么，其实最多可以存放12个键值对。那么，超出12个怎么办？扩容呗，新生成一个表头数组（比如32个大小的数组），然后，把以前的老 HashMap 中的键值对都重新计算一遍，填入到新的表头数组中，生成新的 HashMap 。是对象内部的结构调整，对象本身并没有变动，只是容量变大了。明白了吗？ HashMap在自动扩容的时候，也是很费计算力的。所有，我们在编程的时候，如果已经知道未来 HashMap 要存放多少个键值对了，那么，在 new HashMap 的时候，可以指定 HashMap 的容量，当然，我们还要除以3/4 。

qq_39936465 2020-09-04

打赏
举报

所以不同的k值也会再同一个table下标中存储，但是相同的key值肯定会被新的替换，所以不可能再次得到张三的值、

qq_39936465 2020-09-04

打赏
举报

引用 4 楼 Never妥协的回复:

[quote=引用 2 楼蹭蹭一笑的回复:]我的理解是table[]存储的是<key,value>，链表应该是个linkList，主要是用来解决hash冲突的，在JDK1.8之后链表才会因为长度的原因重组成红黑树，因为链表查询效率太慢了，如果链表足够长的话很影响效率


        Map<String,String> map=new HashMap<>();
        map.put("姓名","张三");
        map.put("姓名","李四");
        System.out.println(map.get("姓名"));

按照您的意思，这种情况下是不是为了解决hash冲突，然后张三，李四都存储在了这个linkList中了呢，如果是，那要怎么得到张三呢？[/quote] 比如说 table[] 表长为8， table的下标就是 0-7 ，具体map存在哪个table的下标中，是先求得该map值的hash值，然后通过该hash值对8求余数，余数会得到0-7 ，8个结果。余数相同的就依次存入对应的table下标的Linklist中。

西瓜芒果柚子橘子橙子草莓提子葡萄 2020-09-04

打赏
举报

大概就是这样子的，至于更深入的了解，一起学习哈

KeepSayingNo 2020-09-03

打赏
举报

table里存的时hash值，也就是插入一个<k, v>，先对k进行取hash，找到在table的位置，然后再看这个位置下的链表有没有同样key的数据，有就覆盖，没有就插入链表

lgxysl 2020-08-27

打赏
举报

我的理解是这样，不知对不对? 当我们put(key,value)时，key会经过哈希运算映射到一个数，这个数就是数组的id，比如put("姓名","李四")时，假设"姓名"的哈希值是1001，那么put("姓名","李四")就相当于table[1001]=new Object[3]；table[1001][0][0]="姓名"；table[1001][0][1]="李四"，table[1001][0][2]=null。当我们name=get("姓名")，直接就相当于name=table[1001][0][1]，所以是不用查找而直接取得数据的，故这时时间复杂度便是O(1)。而当我们再次put("姓名","王五")时，这时id=1001这个单元已经被开辟了，而且有table[1001][0][0]=="姓名"，故这时便是table[1001][0][1]="王五"，“李四”这个值已经被覆盖掉了。假如我们put("车名","宝马")，而我们再假设"车名"这个key的哈希值也是1001，因为id=1001这个单元已经被开辟了，而table[1001][0][0]！="车名"，于是这种情形就是发生了哈希碰撞了，而这时我们总不能table[1001][0][0]="车名"，table[1001][0][1]="宝马"吧，那么怎么办呢？那就是要建链表了，即执行table[1001][0][2]=new Object[3]，table[1001][0][2][0]="车名"，table[1001][0][2][1]="宝马",table[1001][0][2][2]=null，依此类推。当这个链表太长时，就把链表转成红黑树。

Never妥协 2020-08-26

打赏
举报

引用 3 楼水边2 的回复:

楼上说的不错， hash在给定的key足够多的情况下，碰撞概率还是比较高的。在key的hash值相同时，value就放在数组里。一般的小规模应用场景，数据量不会太大，碰撞概率几乎可以忽略。所以很多文章都介绍说 HashMap的时间复杂度近似于O(1)

在key的hash值相同时，value就放在数组里。你这一句说的我更懵了。。。

Never妥协 2020-08-26

打赏
举报

引用 2 楼蹭蹭一笑的回复:

我的理解是table[]存储的是<key,value>，链表应该是个linkList，主要是用来解决hash冲突的，在JDK1.8之后链表才会因为长度的原因重组成红黑树，因为链表查询效率太慢了，如果链表足够长的话很影响效率


        Map<String,String> map=new HashMap<>();
        map.put("姓名","张三");
        map.put("姓名","李四");
        System.out.println(map.get("姓名"));

按照您的意思，这种情况下是不是为了解决hash冲突，然后张三，李四都存储在了这个linkList中了呢，如果是，那要怎么得到张三呢？

游北亮 2020-08-26

打赏
举报

楼上说的不错， hash在给定的key足够多的情况下，碰撞概率还是比较高的。在key的hash值相同时，value就放在数组里。一般的小规模应用场景，数据量不会太大，碰撞概率几乎可以忽略。所以很多文章都介绍说 HashMap的时间复杂度近似于O(1)

蹭蹭一笑 2020-08-26

打赏
举报

我的理解是table[]存储的是<key,value>，链表应该是个linkList，主要是用来解决hash冲突的，在JDK1.8之后链表才会因为长度的原因重组成红黑树，因为链表查询效率太慢了，如果链表足够长的话很影响效率

伱給的囘憶 2020-08-26

打赏
举报

数组table[]里存的是key经过hash计算后得到的值(街道)，链表里存的是对应的key-value这种键值对(门牌号-人)，但是有可能多个不同的key经过hash计算后得到的值相同（不同的人可能会住同一个街道，但是门牌号不一样），这样我们找数据的时候(找人)，先找key经过hash计算后得到的值(找到街道)，然后用equals()找到对应的key（门牌号），最后就找到了相应的数据（人）

2的32次方 2020-08-26

打赏
举报

不要只看图，建议调试一下下面的代码结合源码学习，下面的代码就是哈希冲突的示例


        HashMap<String,Integer> map=new HashMap<>();
        // 以下这些key的哈希值全部都相同，也就是所谓的哈希碰撞的情况
        String[] keys = {"AaAaAaAa", "AaAaBBBB", "AaAaAaBB", "AaAaBBAa",
                "BBBBAaAa", "BBBBBBBB", "BBBBAaBB", "BBBBBBAa",
                "AaBBAaAa", "AaBBBBBB", "AaBBAaBB", "AaBBBBAa",
                "BBAaAaAa", "BBAaBBBB", "BBAaAaBB", "BBAaBBAa",};
        for(int i=0;i<keys.length;i++){
            String key = keys[i];
            System.out.println(key+":"+key.hashCode());
            map.put(key,i);
        }
        System.out.println(map);

一个帅逼 2020-08-26

打赏
举报

1，像hashMap这种java经典的数据结构最好是自己去看看源码，table[]数组存的不是key，而是Node（jdk1.7以前叫entry），node是链表结构，也就是table[]存的是链表，node主要有三个属性，key，value和hash 2，并不是链表长度到8就一定会树化，还有一个条件是数组长度必须大于等于64，树化是为了增加查询效率，在链表长度到达8，但是数组长度小于64时，hashMap会进行扩容操作，因为扩容可以减少hash冲突，一样能提高查询效率

游北亮 2020-08-26

打赏
举报

引用 4 楼 Never妥协的回复:

[quote=引用 2 楼蹭蹭一笑的回复:]我的理解是table[]存储的是<key,value>，链表应该是个linkList，主要是用来解决hash冲突的，在JDK1.8之后链表才会因为长度的原因重组成红黑树，因为链表查询效率太慢了，如果链表足够长的话很影响效率


        Map<String,String> map=new HashMap<>();
        map.put("姓名","张三");
        map.put("姓名","李四");
        System.out.println(map.get("姓名"));

按照您的意思，这种情况下是不是为了解决hash冲突，然后张三，李四都存储在了这个linkList中了呢，如果是，那要怎么得到张三呢？[/quote] 完全不对，你还是没理解HashMap，在执行 map.put("姓名","李四"); 之后，张三已经被抛弃了，数组里已经没有张三了。 HashMap,会先计算“姓名”.hashCode，然后去Map里找数组，找到数组后，遍历数组，找“姓名”，如果存在，就覆盖，不存在，就在数组的最后一个位置插入“姓名：张三”

只用20分钟时间，手把手用java手写实现基本的HashMap的核心功能，包括： Map主结构 get方法 put方法优化过的哈希算法自动扩容迭代器Iterator 等等通过手写深度理解原理

HashMap在JDK1.8以前数据结构和存储原理【链表散列】首先我们要知道什么是链表散列？通过数组和链表结合在一起使用，就叫做链表散列。这其实就是 hashmap存储的原理图。【HashMap的数据结构和存储原理】 HashMap...

一HashMap的数据结构 jdk1.8以前是数组+链表 jdk1.8以后是数组+链表+红黑色二数据结构的物理结构是指数据的逻辑结构在计算机中的存储形式数据元素的存储结构形式有如下两种：顺序存储结构：是把数据元素...

写在前面：小伙伴儿们，大家好！今天来学习HashMap相关内容，作为面试必问的知识点，来深入了解一波！...JDK1.8之前的HashMap由数组+链表组成的，数组是HashMap的主体，链表则是主要为了节解决哈希碰