登录
首页 >  文章 >  java教程

HashSet底层原理及实现解析

时间:2026-01-19 12:21:36 403浏览 收藏

一分耕耘,一分收获!既然打开了这篇文章《HashSet底层实现原理详解》,就坚持看下去吧!文中内容包含等等知识点...希望你能在阅读本文后,能真真实实学到知识或者帮你解决心中的疑惑,也欢迎大佬或者新人朋友们多留言评论,多给建议!谢谢!

HashSet底层基于HashMap实现,元素作为key存储,value统一为PRESENT对象;依赖HashMap的key唯一性保证元素不重复,需重写equals和hashCode;非线程安全,支持初始容量和加载因子配置,默认16容量、0.75加载因子;不保证插入顺序,有序需求用LinkedHashSet,排序需求用TreeSet。

在Java中HashSet是如何实现的_JavaHashSet底层结构说明

HashSet 在 Java 中底层是基于 HashMap 实现的,它本身不存储元素,而是把所有添加的元素作为 HashMap 的 key 来保存,value 则统一使用一个固定的 Object 对象(PRESENT)。

核心结构:用 HashMap 托管元素

HashSet 并没有自己独立的哈希表结构,它的所有操作(add、remove、contains)都委托给内部封装的一个 HashMap 实例。这个 HashMap 的键类型就是 HashSet 的泛型类型,值类型固定为 java.util.HashMap.Node 中的 value 字段,实际只存一个共享的静态对象:private static final Object PRESENT = new Object();。所以每个元素在 HashSet 中只占 HashMap 的一个 key 位置,value 毫无业务意义,纯粹是为了复用 HashMap 的哈希逻辑和冲突处理机制。

为什么能保证元素唯一?

  • HashMap 的 key 不允许重复——当 put 相同 key 时,新 value 会覆盖旧 value,但 key 对应的桶位置不变;
  • HashSet 的 add() 方法本质是调用 map.put(e, PRESENT),返回 null 表示首次插入(key 不存在),否则表示已存在;
  • 判断“是否重复”完全依赖 key 的 equals()hashCode() 方法,因此自定义类放入 HashSet 前必须正确重写这两个方法。

线程不安全与初始容量细节

HashSet 是非线程安全的,多线程并发写入可能引发数据错乱或死循环(尤其在扩容时)。它支持传入初始容量和加载因子来构造,例如:new HashSet(16, 0.75f),这些参数会直接传递给底层 HashMap。默认初始容量为 16,加载因子为 0.75,意味着当元素数量超过 16 × 0.75 = 12 时触发扩容(翻倍并重新哈希)。

不支持有序和索引访问

由于底层是 HashMap,而 HashMap 的遍历顺序不保证与插入顺序一致(JDK 8 后链表+红黑树混合结构,但依然不维护插入序),所以 HashSet 也不保证迭代顺序。如果需要有序,应选用 LinkedHashSet(底层用 LinkedHashMap);如果需要排序,应选 TreeSet(基于 TreeMap,红黑树实现)。

终于介绍完啦!小伙伴们,这篇关于《HashSet底层原理及实现解析》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布文章相关知识,快来关注吧!

前往漫画官网入口并下载 ➜
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>