伪共享是什么?缓存行填充与@Contended详解
时间:2026-03-13 10:31:33 309浏览 收藏
伪共享是一种隐蔽却致命的并发性能陷阱——它并非源于代码逻辑错误,而是CPU缓存行(64字节)这一底层硬件机制,将本应独立访问的不同变量“强行捆绑”,导致线程间无意义的缓存失效与重加载,引发吞吐量不升反降、IPC骤降等典型症状;要真正破解,既需正确启用@Contended注解(配合JVM参数、限定实例字段、善用争用组),也需理解手动填充的本质是精准内存对齐而非盲目加字段,关键在于识别高频更新的核心状态变量并隔离之,否则用错地方反而会把性能问题转化为内存与GC负担。

伪共享到底在“假”什么?
伪共享不是代码写错了,而是多个线程在“合法地、互不干扰地”改不同变量,却因为 CPU 缓存行(Cache Line)这个硬件机制被强行绑在一起——只要两个 long 字段在内存里挨得太近(比如相距不到 64 字节),它们就极可能落在同一个缓存行里。一个线程改 a,另一个线程读/写 b,就会触发 MESI 协议下的缓存失效与重加载,白白消耗上百个 CPU 周期。
典型症状是:线程数翻倍,吞吐量不升反降;热点方法 CPU 使用率高但 IPC(每周期指令数)很低;用 perf stat -e cache-misses,cache-references 或 Intel VTune 能看到异常高的缓存未命中率。
@Contended 注解怎么填才真正生效?
加了 @Contended 不等于就解决了伪共享——它默认是“哑”的,JVM 根本不认。必须同时满足三个条件:
- 使用
jdk.internal.vm.annotation.Contended(Java 8+,注意不是过时的sun.misc.Contended) - 启动时加上 JVM 参数:
-XX:+UnlockExperimentalVMOptions -XX:+EnableContended(-XX:-RestrictContended在较新 JDK 中已废弃,以EnableContended为准) - 字段需是实例字段(
static字段不支持)
示例:
import jdk.internal.vm.annotation.Contended;
public class Metrics {
@Contended private long successCount;
@Contended private long failCount;
}
这样编译后,JVM 会在每个字段前后插入填充字节,确保它们各自独占一个 64 字节缓存行。
字段级 vs 类级 @Contended,别乱套用
类级标注(@Contended 加在 class 上)会让整个对象实例字段区两端都填充,相当于给整块字段内存“包边”,开销大且不精准;字段级才是日常该用的方式。
还有一个少有人知但实用的技巧:@Contended("group1") 可以把多个字段归入同一争用组,它们在内存中连续排列,但与其他字段隔离——适合一组强关联、又需避免跨核竞争的计数器,比如 readCount 和 writeCount。
容易踩的坑:
- 误用
static字段 +@Contended→ 完全无效,JVM 忽略 - 忘了加 JVM 参数 → 编译通过、运行无报错、但填充不发生,伪共享照旧
- 在非底层框架(如业务 DTO)滥用 → 每个字段多占 64 字节,对象膨胀严重,GC 压力上升
不用 @Contended 怎么办?手动填充也得讲逻辑
如果不能用内部 API(比如受限于 JDK 版本或合规要求),就得手动填充。核心原则不是“随便加几个 long”,而是确保目标字段的起始地址对齐到 64 字节边界。
例如,想让 value 独占缓存行:
public class PaddedCounter {
// 7 个 long = 56 字节前置填充
private long p1, p2, p3, p4, p5, p6, p7;
private volatile long value;
// 7 个 long = 56 字节后置填充(可选,防后续字段挤进来)
private long q1, q2, q3, q4, q5, q6, q7;
}
注意:字段顺序影响内存布局,JVM 默认按声明顺序分配;若开启 -XX:+UseCompressedOops(默认开启),对象头是 12 字节,填充计算要从偏移 12 开始算。
更稳妥的做法是用 -XX:+PrintFieldLayout 查看实际布局,而不是靠经验猜。
真正难的不是填多少字节,而是判断“谁该被隔离”——高频更新的计数器、RingBuffer 的生产者/消费者指针、Disruptor 中的序列号字段……这些才是填充的优先级目标。盲目给所有字段加 padding,只会让问题从性能变成内存。
终于介绍完啦!小伙伴们,这篇关于《伪共享是什么?缓存行填充与@Contended详解》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布文章相关知识,快来关注吧!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
364 收藏
-
319 收藏
-
380 收藏
-
412 收藏
-
367 收藏
-
492 收藏
-
264 收藏
-
326 收藏
-
436 收藏
-
350 收藏
-
304 收藏
-
354 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习