JavaSet集合操作技巧详解
时间:2026-03-24 17:18:44 301浏览 收藏
本文深入解析Java中Set集合交集、并集与差集的核心操作技巧,强调retainAll、addAll和removeAll等方法的破坏性本质及常见陷阱——如不可变Set调用retainAll会抛异常、addAll返回布尔值而非新集合、removeAll的方向性易错等,并给出安全复制、封装工具方法等实用解决方案;同时指出Stream方式虽函数式但性能较差,仅适用于复合过滤场景,最后提醒自定义对象必须正确实现equals和hashCode才能保证集合运算结果准确,帮助开发者写出高效、健壮且可维护的集合操作代码。

Java中用 retainAll 求交集,但别直接在原Set上操作
交集不是“算出来一个新Set”,而是让调用方Set只保留和另一个Set共有的元素。所以 retainAll 是破坏性操作——它会修改原Set。
常见错误是:把不可变Set(比如 Set.of() 或 Collections.unmodifiableSet())传给 retainAll,立刻抛 UnsupportedOperationException。
- 正确做法:先复制一份可变副本,再调用
retainAll - 示例:
Set<String> a = new HashSet<>(Arrays.asList("a", "b", "c")); Set<String> b = Set.of("b", "c", "d"); Set<String> intersection = new HashSet<>(a); // 复制 intersection.retainAll(b); // 现在 intersection 是 ["b", "c"] - 注意:如果a本身是不可变的,
new HashSet<>(a)这一步就必不可少
并集用 addAll 最简单,但要注意返回值不是新Set
addAll 只是把另一个Set所有元素加进当前Set,不返回新对象,也不去重(HashSet自己保证)。
容易踩的坑是误以为它像Stream那样“链式返回”——它返回的是 boolean(是否发生了新增),不是Set本身。
- 想保留原Set不变?必须手动复制:
Set<String> union = new HashSet<>(a); union.addAll(b);
- 如果a是TreeSet,
addAll后仍保持排序;如果是LinkedHashSet,插入顺序也保留 - 性能上,
addAll对于大Set比循环加单个元素快得多(批量优化)
差集用 removeAll,但“谁减谁”必须看清楚
a.removeAll(b) 的意思是“从a里删掉所有在b里出现的元素”,结果是 a − b(a对b的差集),不是对称差。
这个方向性非常容易搞反,尤其当变量名不够直观时(比如叫 set1、set2)。
- 典型错误现象:执行后得到空Set,其实只是把本该保留的元素全删了
- 安全写法:明确注释或封装成方法,例如
static <T> Set<T> difference(Set<T> from, Set<T> to) { Set<T> result = new HashSet<>(from); result.removeAll(to); return result; } - 注意:如果to里有null,而from不允许null(如TreeSet且没指定Comparator),会抛
NullPointerException
Stream方式更函数式,但别为了“看起来高级”牺牲可读和性能
Java 8+ 可以用 stream().filter().collect() 实现三类运算,但它不是银弹。
实际项目里,用Stream求交集/差集往往比原生集合操作慢2–5倍(尤其小集合),而且代码更长、调试更难。
- 仅当已有Stream流水线、或需要复合条件过滤时,才考虑Stream方式
- 例如差集带额外判断:
a.stream().filter(x -> !b.contains(x) && x.length() > 2).collect(Collectors.toSet())
- 不要用
Collectors.toSet()得到的Set做后续修改——它是未指定实现类,可能不可变
equals 和 hashCode 行为。如果元素是自定义对象,没重写这两个方法,交并差的结果几乎一定不对。今天关于《JavaSet集合操作技巧详解》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!
相关阅读
更多>
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
最新阅读
更多>
-
265 收藏
-
465 收藏
-
156 收藏
-
270 收藏
-
181 收藏
-
358 收藏
-
204 收藏
-
399 收藏
-
239 收藏
-
276 收藏
-
273 收藏
-
451 收藏
课程推荐
更多>
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习