关于hashMap数据结构

Never妥协 2020-08-26 10:19:29

刚才我在看hashmap数组结构的时候,看到这张图,,然后有点疑惑?

我看这幅图理解的是,数组table[]存的是key,,链表用来存对应的value,一般情况下不是一个key对应一个value嘛,那如果一个key对应一个链表的话,value对应的是不是就是一个arrayList之类的数据结构,然后当arrayList存储的长度大于8以后,链表这个数据结构重组为红黑树?
不知道我的这个理解对不对?如果有问题,麻烦帮我指点一下,有点迷。。
...全文
8954 20 打赏 收藏 转发到动态 举报
写回复
用AI写文章
20 条回复
切换为时间正序
请发表友善的回复…
发表回复
Woo_home 2020-09-19
  • 打赏
  • 举报
回复
可以看下这篇文章 https://blog.csdn.net/Woo_home/article/details/103146845
  • 打赏
  • 举报
回复
引用 14 楼 qq_39936465 的回复:
[quote=引用 13 楼 葡萄柚子芒果橘子龙眼 的回复:]大概就是这样子的,至于更深入的了解,一起学习哈
哈值不可能小到只有1-4,这个是哈值相对数组长度取余的结果,所以不只是哈值相等才会编入一组,取余相等也会编入一组。[/quote]嗯嗯,假设一下
baoger1314 2020-09-08
  • 打赏
  • 举报
回复
我对key ,value的理解是这样的, key 只是用来通过计算hashcode,来找对应的entry数组下标的, 然后再将value值插进去,一个节点除了头(尾)指针外,数据域只存的value, 所以,他的hashmap的遍历方式才会有通过entry去找key,和value的方式; 而且一个key 对应一个链表的说法,不准确 , 不同key通过与运算也有可能插入同一个桶中(hash碰撞);而且它对应的不是arraylist , 应该是单链表吧, 也不是其中一个桶链表长度大于8时候就得转 ,好像还有个条件, 忘了 = =
松鼠不是鼠 2020-09-07
  • 打赏
  • 举报
回复
说一下我的理解,首先你图中的情况我一般是在存储对象的时候出现,在存储的时候会首先进行hash值计算,通过hash来定位(图中第一排的位置),但是hash不一定每一次都生成唯一的,因为容器对象是有限的,所以在hash值计算一样的时候就会出现在同一位置,这个时候通过equals来比较这个位置是否已经存在,不存在的时候就会生成一个链表,但是链表都知道,遍历是需要从头到尾进行遍历查找的,所以在一定长度就进行转换红黑树,用红黑树的计算方式进行快速定位。 所以,这就是为什么我们在存储对象的时候要重写hashcode和equals方法,因为不重写equals方法的话,在通过hash进行定位到同一位置,equals进行判断是否存在对象的时候,默认调用object的equals,判断是的是对象地址。 希望可以帮到你
qq_39936465 2020-09-07
  • 打赏
  • 举报
回复
所以当数组扩容后,会重新排列,原来在一组的数据,扩容后可能不在同一组。
qq_39936465 2020-09-07
  • 打赏
  • 举报
回复
引用 13 楼 葡萄柚子芒果橘子龙眼 的回复:
大概就是这样子的,至于更深入的了解,一起学习哈
哈值不可能小到只有1-4,这个是哈值相对数组长度取余的结果,所以不只是哈值相等才会编入一组,取余相等也会编入一组。
冰思雨 2020-09-07
  • 打赏
  • 举报
回复
楼主啊,理解的好像有点问题。 链表里面有表头的概念,还记得吗? 表头一般不存放数据,只是表示链表的开始(双向链表还表示结束)。使用表头,可以化简链表增删时的操作代码,使得代码简洁,更容易被理解。 HashMap里面,数组里面存放的就是表头,它的意思是,我有一个数组的表头,也就是数组的每一个元素,都将会是一个链表。 那么,问题来了,我要是有一个键值对,想保存到 HashMap 中,怎么放呢? 首先,计算 Key 对象的 hashCode 值,然后,将这个值对数组的size取余,得到的就是数组的下角标,或者说,链表的编号(如果从0开始编号的话)。 能理解嘛? Key 对象的 hashCode 值,就是为了找到链表的。 然后,找到对应的链表之后,将 键值对 封装成 Entity 对象,放入链表中,记住啊,链表中存放的是键值对。 经过多次的添加操作之后,由于存入的 key 值不同,key 对应的 hashCode 值也会不同,你会发现,这些键值对会被分配到不同的链表中进行保存。 什么?可能有不同key的键值对,保存到了同一个链表里面?对啊,链表可以存放多个对象(键值对),而且,可以很灵活的存放多个对象。 问题的关键不是链表保存了多个对象,而是,数组中的链表,保存对象的个数不太平均,这样的话,会影响查找的速度的。 怎样通过 Key 的值,得到 Value 值? 首先,计算 Key 对象的 hashCode 值,然后,将 hashCode 对 数组的 size 取余,得到数组的下角标,也就是链表的表头。 然后,顺着 链表 调用 Key 对象 equals 方法,比较 和 Key 相同的键值对,找到之后,将 Value 取出即可。 如果链表很长,查找速度就会降低。这就涉及到一个优化方式的问题。 加载因子 loadFactor。(一般是 3/4 ) 什么意思? 就是 HashMap 最多能够存放数组长度的 3/4 个键值对,当然,浮点数要进行取整运算才行。 明白了吗? 为了提高HashMap 的查询性能,我们尽量让数组后面的链表长度等于一,这样的话,我们一下就可以找到了。 根据经验而谈,3/4 是个不错的数字。 当然啦,如果你的 HashMap 非常大的话,数组建的太大,也会浪费内存,那就需要你稍微调大一点 加载因子,让它更趋近1一些。 如果现在我们的 HashMap 数组只有16个的大小,那么,其实最多可以存放12个键值对。 那么,超出12个怎么办? 扩容呗, 新生成一个表头数组(比如32个大小的数组),然后,把以前的老 HashMap 中的 键值对 都重新计算一遍,填入到新的 表头数组中,生成新的 HashMap 。 是对象内部的结构调整,对象本身并没有变动,只是容量变大了。 明白了吗? HashMap在自动扩容的时候,也是很费计算力的。所有,我们在编程的时候,如果已经知道未来 HashMap 要存放多少个 键值对了,那么,在 new HashMap 的时候,可以指定 HashMap 的容量,当然,我们还要除以3/4 。
qq_39936465 2020-09-04
  • 打赏
  • 举报
回复
所以不同的k值也会再同一个table下标中存储,但是相同的key值肯定会被新的替换,所以不可能再次得到张三的值、
qq_39936465 2020-09-04
  • 打赏
  • 举报
回复
引用 4 楼 Never妥协 的回复:
[quote=引用 2 楼 蹭蹭一笑 的回复:]我的理解是table[]存储的是<key,value>,链表应该是个linkList,主要是用来解决hash冲突的,在JDK1.8之后链表才会因为长度的原因重组成红黑树,因为链表查询效率太慢了,如果链表足够长的话 很影响效率

        Map<String,String> map=new HashMap<>();
        map.put("姓名","张三");
        map.put("姓名","李四");
        System.out.println(map.get("姓名"));
按照您的意思,这种情况下是不是为了解决hash冲突,然后张三,李四都存储在了这个linkList中了呢,如果是,那要怎么得到张三呢?[/quote] 比如说 table[] 表长为8, table的下标就是 0-7 , 具体map存在哪个table的下标中,是先求得该map值的hash值,然后通过该hash值对8求余数, 余数会得到0-7 ,8个结果。余数相同的就依次存入对应的table下标的Linklist中。
  • 打赏
  • 举报
回复
大概就是这样子的,至于更深入的了解,一起学习哈
KeepSayingNo 2020-09-03
  • 打赏
  • 举报
回复
table里存的时hash值,也就是插入一个<k, v>,先对k进行取hash,找到在table的位置,然后再看这个位置下的链表有没有同样key的数据,有就覆盖,没有就插入链表
lgxysl 2020-08-27
  • 打赏
  • 举报
回复
我的理解是这样,不知对不对? 当我们put(key,value)时,key会经过哈希运算映射到一个数,这个数就是数组的id,比如put("姓名","李四")时,假设"姓名"的哈希值是1001,那么put("姓名","李四")就相当于table[1001]=new Object[3];table[1001][0][0]="姓名";table[1001][0][1]="李四",table[1001][0][2]=null。当我们name=get("姓名"),直接就相当于name=table[1001][0][1],所以是不用查找而直接取得数据的,故这时时间复杂度便是O(1)。而当我们再次put("姓名","王五")时,这时id=1001这个单元已经被开辟了,而且有table[1001][0][0]=="姓名",故这时便是table[1001][0][1]="王五",“李四”这个值已经被覆盖掉了。假如我们put("车名","宝马"),而我们再假设"车名"这个key的哈希值也是1001,因为id=1001这个单元已经被开辟了,而table[1001][0][0]!="车名",于是这种情形就是发生了哈希碰撞了,而这时我们总不能table[1001][0][0]="车名",table[1001][0][1]="宝马"吧,那么怎么办呢?那就是要建链表了,即执行table[1001][0][2]=new Object[3],table[1001][0][2][0]="车名",table[1001][0][2][1]="宝马",table[1001][0][2][2]=null,依此类推。当这个链表太长时,就把链表转成红黑树。
Never妥协 2020-08-26
  • 打赏
  • 举报
回复
引用 3 楼 水边2 的回复:
楼上说的不错, hash在给定的key足够多的情况下,碰撞概率还是比较高的。 在key的hash值相同时,value就放在数组里。 一般的小规模应用场景,数据量不会太大,碰撞概率几乎可以忽略。 所以很多文章都介绍说 HashMap的时间复杂度近似于O(1)
在key的hash值相同时,value就放在数组里。 你这一句说的我更懵了。。。
Never妥协 2020-08-26
  • 打赏
  • 举报
回复
引用 2 楼 蹭蹭一笑 的回复:
我的理解是table[]存储的是<key,value>,链表应该是个linkList,主要是用来解决hash冲突的,在JDK1.8之后链表才会因为长度的原因重组成红黑树,因为链表查询效率太慢了,如果链表足够长的话 很影响效率

        Map<String,String> map=new HashMap<>();
        map.put("姓名","张三");
        map.put("姓名","李四");
        System.out.println(map.get("姓名"));
按照您的意思,这种情况下是不是为了解决hash冲突,然后张三,李四都存储在了这个linkList中了呢,如果是,那要怎么得到张三呢?
游北亮 2020-08-26
  • 打赏
  • 举报
回复
楼上说的不错, hash在给定的key足够多的情况下,碰撞概率还是比较高的。 在key的hash值相同时,value就放在数组里。 一般的小规模应用场景,数据量不会太大,碰撞概率几乎可以忽略。 所以很多文章都介绍说 HashMap的时间复杂度近似于O(1)
蹭蹭一笑 2020-08-26
  • 打赏
  • 举报
回复
我的理解是table[]存储的是<key,value>,链表应该是个linkList,主要是用来解决hash冲突的,在JDK1.8之后链表才会因为长度的原因重组成红黑树,因为链表查询效率太慢了,如果链表足够长的话 很影响效率
伱給的囘憶 2020-08-26
  • 打赏
  • 举报
回复
数组table[]里存的是key经过hash计算后得到的值(街道),链表里存的是对应的key-value这种键值对(门牌号-人),但是有可能多个不同的key经过hash计算后得到的值相同(不同的人可能会住同一个街道,但是门牌号不一样),这样我们找数据的时候(找人),先找key经过hash计算后得到的值(找到街道),然后用equals()找到对应的key(门牌号),最后就找到了相应的数据(人)
2的32次方 2020-08-26
  • 打赏
  • 举报
回复
不要只看图,建议调试一下下面的代码结合源码学习,下面的代码就是哈希冲突的示例

        HashMap<String,Integer> map=new HashMap<>();
        // 以下这些key的哈希值全部都相同,也就是所谓的哈希碰撞的情况
        String[] keys = {"AaAaAaAa", "AaAaBBBB", "AaAaAaBB", "AaAaBBAa",
                "BBBBAaAa", "BBBBBBBB", "BBBBAaBB", "BBBBBBAa",
                "AaBBAaAa", "AaBBBBBB", "AaBBAaBB", "AaBBBBAa",
                "BBAaAaAa", "BBAaBBBB", "BBAaAaBB", "BBAaBBAa",};
        for(int i=0;i<keys.length;i++){
            String key = keys[i];
            System.out.println(key+":"+key.hashCode());
            map.put(key,i);
        }
        System.out.println(map);
一个帅逼 2020-08-26
  • 打赏
  • 举报
回复
1,像hashMap这种java经典的数据结构最好是自己去看看源码,table[]数组存的不是key,而是Node(jdk1.7以前叫entry),node是链表结构,也就是table[]存的是链表,node主要有三个属性,key,value和hash 2,并不是链表长度到8就一定会树化,还有一个条件是数组长度必须大于等于64,树化是为了增加查询效率,在链表长度到达8,但是数组长度小于64时,hashMap会进行扩容操作,因为扩容可以减少hash冲突,一样能提高查询效率
游北亮 2020-08-26
  • 打赏
  • 举报
回复
引用 4 楼 Never妥协 的回复:
[quote=引用 2 楼 蹭蹭一笑 的回复:]我的理解是table[]存储的是<key,value>,链表应该是个linkList,主要是用来解决hash冲突的,在JDK1.8之后链表才会因为长度的原因重组成红黑树,因为链表查询效率太慢了,如果链表足够长的话 很影响效率

        Map<String,String> map=new HashMap<>();
        map.put("姓名","张三");
        map.put("姓名","李四");
        System.out.println(map.get("姓名"));
按照您的意思,这种情况下是不是为了解决hash冲突,然后张三,李四都存储在了这个linkList中了呢,如果是,那要怎么得到张三呢?[/quote] 完全不对,你还是没理解HashMap,在执行 map.put("姓名","李四"); 之后,张三已经被抛弃了,数组里已经没有张三了。 HashMap,会先计算“姓名”.hashCode,然后去Map里找数组,找到数组后,遍历数组,找“姓名”,如果存在,就覆盖,不存在,就在数组的最后一个位置插入“姓名:张三”

62,614

社区成员

发帖
与我相关
我的任务
社区描述
Java 2 Standard Edition
社区管理员
  • Java SE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧