登录
首页 >  文章 >  java教程

LongAdder与AtomicLong性能对比测试

时间:2026-05-31 09:08:37 112浏览 收藏

本文深入剖析了LongAdder与AtomicLong在高并发统计场景下的性能差异与适用边界:LongAdder通过分段累加(Striped64)显著降低多线程竞争下的CAS自旋开销,真正优势在于“高竞争下不卡住、不耗尽CPU”,而非绝对更快;但在低竞争或需强一致性、条件更新(如compareAndSet)、实时精确读取的场景中,AtomicLong反而更可靠。文章不仅揭示了性能差异的本质原因,还提供了科学的压测方法(多线程+百万级操作+精准计时+预热控制)、常见误用陷阱(sum()非原子快照、伪共享影响、JDK版本差异),并给出清晰的选型指南——让开发者不再盲目追新,而是根据写读比、一致性要求和业务语义做出务实选择。

如何在Java中实现高性能的并发累加统计_LongAdder对比AtomicLong在不同竞争程度下的测试

LongAdder 比 AtomicLong 快在哪?先看竞争场景

关键不在“快”,而在“高竞争下不卡住”。AtomicLong 用 CAS 自旋更新,一旦多个线程反复抢同一个值,失败重试会吃掉大量 CPU;LongAdder 把累加拆到多个 Cell 上,线程各自找空闲槽位写,冲突概率大幅下降。但低竞争时它反而略慢——多了分发、定位、合并的开销。

怎么测出真实差异?别只跑 for 循环

常见错误是用单线程或固定线程数 + 短时间循环,结果看不出差别。必须模拟真实争抢:启动 8–16 个线程,每个线程执行 100 万次 increment(),用 System.nanoTime() 测总耗时。注意关闭 JVM 预热干扰(先预跑几轮再计时),并重复 5 次取中位数。

  • 测试前调用 ForkJoinPool.commonPool().awaitQuiescence(1, TimeUnit.SECONDS) 清理可能残留的异步任务
  • 避免在 main 线程里直接 new Thread(),改用 ExecutorService 统一管理生命周期
  • 别用 System.currentTimeMillis(),精度不够,误差可达 10ms+

为什么有时 LongAdder 结果不准?检查 sum() 调用时机

LongAdder.sum() 不是原子快照,而是遍历所有 Cell 并累加当前值,过程中其他线程仍可修改。如果边累加边调用 sum(),结果可能漏掉部分增量。典型误用场景:在统计线程还在运行时,就从监控线程频繁调用 sum() 获取中间值。

  • 生产环境若需准确实时值,应控制统计周期(例如每秒调用一次 sum(),且累加线程该秒内暂停写入)
  • 更稳妥的做法是让累加线程自己定期把 sumThenReset() 结果推到外部队列,避免读写竞争
  • sum() 返回的是 long,但内部 Cell 数组长度受 CPU 核心数影响,极端高并发下扩容有延迟,刚扩容完的 slot 可能为空

选 AtomicLong 还是 LongAdder?看你的写读比和一致性要求

不是“越新越好”。如果业务是单线程高频更新(如定时器计数器)、或必须强一致读(如金融对账),AtomicLong 更合适;而日志行数统计、API 调用量聚合、限流器窗口计数这类“写多读少+允许微小延迟”的场景,LongAdder 才真正发挥价值。JDK 9 后 Striped64 底层优化了 false sharing,但老版本(如 JDK 8u202 之前)要注意 Cell 未填充 padding 导致缓存行伪共享,此时性能提升可能打折扣。

最容易被忽略的一点:LongAdder 没有 compareAndSet(),没法做条件更新。真需要“等于某值才加”,只能回退到 AtomicLong 或自己封装逻辑。

终于介绍完啦!小伙伴们,这篇关于《LongAdder与AtomicLong性能对比测试》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布文章相关知识,快来关注吧!

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>