首页 > 文章 > java教程

HashSet原理：基于HashMap实现高效去重

时间：2026-05-11 22:18:54 424浏览收藏

HashSet 的去重能力并非源自自身逻辑，而是完全依赖其内部封装的 HashMap——它通过将元素作为 key、统一占位符 PRESENT 作为 value 来实现高效存储与判重；所有操作（add、remove、contains 等）均直接代理给 HashMap，真正的去重判断由 hashCode 和 equals 协同完成，因此自定义类必须正确重写这两个方法才能保证集合行为符合预期；这种精巧的组合设计让 HashSet 轻量透明、零冗余，却继承了 HashMap 全部的高性能与成熟机制。

HashSet 组合模式：分析其内部通过封装 HashMap 变量实现去重的逻辑

HashSet 本身不维护任何元素集合或比较逻辑，它只是把所有操作都委托给内部持有的 HashMap 实例——这是一种典型的组合模式（Composition），而非继承。

内部变量封装：一个 map 字段承载全部职责

HashSet 类中声明了一个私有字段：

private transient HashMap map; —— 这是它唯一的存储载体
private static final Object PRESENT = new Object(); —— 所有元素共用的 value 占位符，不参与去重判断

当你 new HashSet() 时，实际是在初始化这个 map；后续所有 add、remove、contains 操作，都直接调用 map 对应的方法。

add() 的本质：map.put(e, PRESENT) 的返回值语义

HashSet.add(E e) 方法体只有一行：

return map.put(e, PRESENT) == null;
HashMap.put() 在 key 已存在时返回旧 value（即 PRESENT），否则返回 null
所以 add 返回 true，仅当该元素此前未作为 key 出现在 map 中

整个“是否重复”的判定，完全由 HashMap 的哈希定位 + equals 比较完成，HashSet 不插手也不干预。

去重生效的前提：hashCode 和 equals 必须协同一致

HashMap 判断两个 key 是否相等，分两步：

先比 hashCode()：决定进哪个桶；若 hash 值不同，连桶都不进，直接算“不重复”
再比 equals()：同一桶内逐个比较；若 equals 返回 false，仍视为新 key

因此，自定义类放入 HashSet 前，必须同时重写这两个方法，并确保：

相等的对象（业务上逻辑相同）必须返回相同 hashCode
equals 实现要满足自反性、对称性、传递性、一致性
推荐使用 Objects.equals() 和 Objects.hash() 避免空指针和手写错误

其他操作也全是代理：无一例外

HashSet 的行为透明且统一：

contains(Object o) → 直接调用 map.containsKey(o)
remove(Object o) → 直接调用 map.remove(o)
size() → 返回 map.size()
iterator() → 遍历的是 map.keySet().iterator()

它没有自己的数组、链表或红黑树，也没有独立的扩容机制——所有底层细节，包括桶数组、链表转红黑树阈值、负载因子触发扩容，全都来自 HashMap。

文中关于的知识介绍，希望对你的学习有所帮助！若是受益匪浅，那就动动鼠标收藏这篇《HashSet原理：基于HashMap实现高效去重》文章吧，也可关注golang学习网公众号了解相关技术文章。

最新阅读

更多>

文章 · java教程 | 19小时前 | Java · HTTP · ndjson · httpclient · 性能实践 · 流式读取背压 Java HttpClient NDJSON BodyHandlers.ofLines

Java HttpClient 流式读取 NDJSON：ofLines、背压与连接关闭

309 收藏
文章 · java教程 | 2天前 | 并发 · Java · CompletableFuture · Java CompletableFuture 任务取消 orTimeout completeOnTimeout

Java CompletableFuture 超时怎么处理：orTimeout、completeOnTimeout 与取消边界实战

152 收藏
文章 · java教程 | 3天前 | 限流 · 架构设计 · Java教程 · 任务队列 · 多租户 · java 多租户批量任务队列分片并发配额回压

Java 批量任务平台怎么做多租户隔离：队列分片、并发配额与回压策略

300 收藏
文章 · java教程 | 3天前 | 事务 · spring · aop · Java教程 · Transactional · 排错 · java Spring 事务失效 @Transactional AOP代理同类方法调用订单创建

Spring 同类方法调用导致事务不生效？从代理边界到拆分服务的排查

406 收藏
文章 · java教程 | 3天前 | 数据库 · 性能优化 · Java教程 · Optional · orElseGet · java 数据库查询懒加载 optional supplier orElse orElseGet

订单缓存命中仍查库？Java Optional orElse 与 orElseGet 的取舍

238 收藏
文章 · java教程 | 3天前 | 数据库 · 性能优化 · Java教程 · Optional · orElseGet · java 数据库查询懒加载 optional supplier orElse orElseGet

Java Optional 的 orElse 为什么会提前查数据库？懒加载兜底这样写

186 收藏
文章 · java教程 | 5天前 | Record · Java教程 · 防御式拷贝 · List.copyOf · Arrays.copyOf · 不可变性 · arrays.copyof 可变集合 Java record List.copyOf 防御式拷贝数组克隆

Java record 怎么防止可变集合从外部改进来：List.copyOf、数组克隆和构造器核对

247 收藏
文章 · java教程 | 5天前 | Java · 后端开发 · 批处理 · Stream API · JDK 24 · Gatherers · 分组 Java 24 Stream Gatherers windowFixed Stream.gather 批量接口

Java 24 Stream Gatherers 怎么给批量接口分组：windowFixed、尾批和版本边界

411 收藏
文章 · java教程 | 5天前 | Java · 文件上传 · spring · nio · 后端开发 · java 文件上传临时文件数据清理 MultipartFile Files.move

Java MultipartFile 怎么落盘：临时文件、校验和清理的数据流

314 收藏
文章 · java教程 | 5天前 | [] · []

Java JTable 双击怎么拿到正确行：MouseAdapter、排序转换和空白行判断

135 收藏
文章 · java教程 | 6天前 | map · Java · 后端开发 · Collectors · Stream API · java Stream Collectors toMap 重复key Map合并

Java Stream 的 toMap 遇到重复 key 怎么写：合并策略和分组边界

159 收藏
文章 · java教程 | 6天前 | 调试 · 异常处理 · Java教程 · try-with-resources · AutoCloseable · 文件关闭 AutoCloseable Java教程 Java try-with-resources suppressed exceptions

Java 文件关闭失败怎么排查？try-with-resources 与 suppressed exceptions 清单

327 收藏

课程推荐

更多>

前端进阶之JavaScript设计模式

设计模式是开发人员在软件开发过程中面临一般问题时的解决方案，代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景，打造一站式知识长龙服务，适合有JS基础的同学学习。

立即学习 543次学习
GO语言核心编程课程

本课程采用真实案例，全面具体可落地，从理论到实践，一步一步将GO核心编程技术、编程思想、底层实现融会贯通，使学习者贴近时代脉搏，做IT互联网时代的弄潮儿。

立即学习 516次学习
简单聊聊mysql8与网络通信

如有问题加微信：Le-studyg；在课程中，我们将首先介绍MySQL8的新特性，包括性能优化、安全增强、新数据类型等，帮助学生快速熟悉MySQL8的最新功能。接着，我们将深入解析MySQL的网络通信机制，包括协议、连接管理、数据传输等，让

立即学习 500次学习
JavaScript正则表达式基础与实战

在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。

立即学习 487次学习
从零制作响应式网站—Grid布局

本系列教程将展示从零制作一个假想的网络科技公司官网，分为导航，轮播，关于我们，成功案例，服务流程，团队介绍，数据部分，公司动态，底部信息等内容区块。网站整体采用CSSGrid布局，支持响应式，有流畅过渡和展现动画。

立即学习 485次学习