登录
首页 >  文章 >  java教程

JavaList分组技巧:groupingBy使用详解

时间:2026-05-02 08:57:36 120浏览 收藏

Java中使用Collectors.groupingBy进行List分组看似简单,实则暗藏多重陷阱:单属性分组时方法引用(如Person::getCity)最简洁,但null值会被悄悄归入null键桶,极易导致数据“消失”;多属性分组绝不能字符串拼接,应借助record或SimpleEntry保障语义准确与null安全;而并发场景下默认groupingBy非线程安全,必须改用groupingByConcurrent或toConcurrentMap,否则可能静默丢数据或崩溃——这三个关键细节,恰恰是线上问题难定位、调试耗时长的根源。

如何在Java中根据属性对对象List进行分组_Collectors.groupingBy的经典用法

Collectors.groupingBy 按单个属性分组最简写法

直接传入方法引用,groupingBy 会自动调用该 getter 并以返回值为 key 分组。注意:必须确保属性 getter 非空,否则 NullPointerException 会发生在分组过程中,而不是你预期的“数据为空”位置。

  • Map> peopleByCity = list.stream().collect(Collectors.groupingBy(Person::getCity));
  • 如果 getCity() 返回 null,对应对象会被归入 key 为 null 的 bucket —— 这常被忽略,但线上查不到某批数据时,往往就是 null key 桶里塞了几十条
  • 不推荐用 person -> person.getCity() 匿名函数代替方法引用,编译器优化和可读性都更差

分组后要统计数量?别用 groupingBycounting() 写法

虽然 groupingBy(Person::getCity, counting()) 能跑通,但返回的是 Map,丢失了原始对象信息。真要数量,优先考虑 toMap + merge 或直接用 groupingBy 后对 value 调 size() —— 更直观、调试时一眼看出每组有哪些元素。

  • 要数量且保留明细:先 groupingBy 得到 Map>,再遍历 entry,entry.getValue().size()
  • 纯计数且性能敏感(比如百万级 list):用 toMap + Integer::sum 合并,避免构造中间 List
  • groupingBy 的下游收集器(如 counting())一旦指定,就无法再访问原对象,这点在需要“分组 + 取每组最大年龄”时特别容易踩坑

按多个属性分组得自己造 key,别拼字符串

Person::getCity + "_" + Person::getDepartment 拼 key 看似简单,但遇到 city 为 "Shang_hai" 就和 "Shang"+"hai" 冲突;更糟的是 null 安全和可读性全无。

  • 正确做法:定义一个轻量 record 或匿名对象,比如 Map, List>,key 用 new AbstractMap.SimpleEntry(p.getCity(), p.getDept())
  • Java 14+ 推荐用 record:record CityDept(String city, String dept) {},然后 groupingBy(p -> new CityDept(p.getCity(), p.getDept()))
  • 别忘了重写 equals/hashCode —— 如果手写类而非 record,漏掉任一方法会导致分组错乱,且极难定位

groupingBy 的并发安全陷阱

默认 groupingBy 返回的是普通 HashMap,即使上游是 parallelStream(),也**不保证线程安全**。多线程写入同一 map 会导致数据丢失或 ConcurrentModificationException

  • 并发场景唯一可靠写法:groupingBy(Person::getCity, Collectors.toConcurrentMap(...)),但注意 toConcurrentMap 不接受 List 作为 value 类型,得配合 computingIfAbsent 手动维护 list
  • 更稳妥的替代:用 Collectors.groupingByConcurrent()(Java 8u60+),它返回 ConcurrentMap,内部用分段锁,性能比手动同步好
  • 别依赖“我只读不写”——stream 的 terminal 操作本身可能触发多次中间操作,尤其 with flatMap 或自定义 collector 时

分组逻辑看着简单,但 key 的 null 处理、多属性组合的语义一致性、并发下的 map 实现选择,这三个地方出问题,日志里基本不报错,只默默丢数据。

好了,本文到此结束,带大家了解了《JavaList分组技巧:groupingBy使用详解》,希望本文对你有所帮助!关注golang学习网公众号,给大家分享更多文章知识!

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>