Java高性能本地缓存Caffeine并发设计解析
时间:2026-04-05 18:02:13 331浏览 收藏
Caffeine 作为 Java 领先的高性能本地缓存库,其设计深度兼顾并发安全、内存效率与语义严谨性:它默认采用非阻塞的同步加载机制(导致高并发下重复计算风险),淘汰策略独创性地使用 W-TinyLFU 而非传统 LRU,实现更高命中率与吞吐稳定性;maximumSize 与 maximumWeight 严格互斥,需根据数据特征(固定结构 or 大小悬殊)审慎选择,且 weigher 必须是无副作用的纯函数;asMap() 仅提供线程安全视图,不支持原子复合操作,误用将破坏缓存一致性与性能优化;而真正规避缓存击穿、实现“一次加载、多线程等待”,需转向 AsyncLoadingCache 或显式配置 Spring 的 sync 模式——这些精妙但易踩坑的设计细节,恰恰是线上高并发场景下稳定与崩溃的分水岭。

为什么 Caffeine 的 get 方法默认不阻塞写入
因为 Caffeine 把“缓存未命中 + 异步加载”和“同步计算 + 阻塞等待”做了明确分离。它默认走的是 get(key, mappingFunction) 这条路径,而这个方法在 key 不存在时,会用你传的 mappingFunction 同步计算值并写入,**期间其他线程对同一 key 的 get 调用会各自触发计算,不共享 loading 过程**——也就是常说的“缓存击穿”风险点。
常见错误现象:get(key, () -> heavyIoCall()) 在高并发下导致后端被压垮,日志里看到几十次重复的 heavyIoCall 执行。
- 真正想做“只加载一次、其余线程等待”的行为,得显式启用
refreshAfterWrite或配合asMap().computeIfAbsent+ 手动锁,但后者破坏了缓存语义 build().get(key, ...)是无状态的,不维护 loading 中的状态;AsyncLoadingCache才提供真正的异步 load + 共享CompletableFuture- 如果你依赖 Spring 的
@Cacheable,底层用 Caffeine 时默认仍是同步加载,需配sync = true(Spring Boot 2.7+)才启用轻量级本地锁
maximumSize 和 maximumWeight 别混用
二者不可共存,Caffeine 构建时会直接抛 IllegalStateException: maximumSize and maximumWeight cannot both be set。选哪个取决于你关心的是“条目数量上限”还是“内存权重上限”。
使用场景:API 响应体大小差异极大,比如有的返回 1KB JSON,有的返回 5MB 图片 base64,这时用 maximumWeight 更合理;若缓存都是固定结构的 DTO,且数量可控,maximumSize 更直观。
weigher函数必须是纯函数,不能有副作用,也不能依赖外部状态(比如调用System.currentTimeMillis())- 权重不是字节数,而是你定义的抽象单位;Caffeine 不做内存测量,只累加你返回的 long 值
- 设置
maximumWeight=10000但所有 entry weigher 都返回 0 → 缓存永不淘汰,容易 OOM
淘汰策略不是 LRU,而是 W-TinyLFU
Caffeine 默认不用传统 LRU,而是基于概率统计的 W-TinyLFU(Window Tiny Least Frequently Used),它用布隆过滤器 + 频率 sketch 做热点识别,在吞吐和命中率上比 LRU 更稳。但这意味着:你不能靠“最近访问”来预测淘汰顺序,尤其在冷热数据混合场景下。
常见错误现象:手动调用 cache.invalidateAll() 后,观察到部分刚 put 的 key 立即被踢出,以为是 bug,其实是 W-TinyLFU 的准入机制在起作用——新 key 需先通过 window cache 的热度验证,否则直接淘汰。
- 不支持切换回纯 LRU;想模拟 LRU 行为,只能设极小
recordStats()+ 自己统计访问时间,再手动清理 evictionListener触发时机是“确定淘汰前”,但 listener 内不能阻塞或耗时,否则拖慢整个 eviction 流程- 压力测试时如果只压单个 key,W-TinyLFU 可能误判为“非热点”,导致命中率反低于预期
并发更新下 asMap() 的行为边界
cache.asMap() 返回的是一个线程安全的 ConcurrentMap 视图,但它**不保证原子复合操作**。比如 asMap().computeIfAbsent(key, k -> load(k)) 看似能防击穿,实际仍可能多次执行 load(k) —— 因为 computeIfAbsent 底层没用 Caffeine 的 loading 机制,只是普通 ConcurrentHashMap 的语义。
性能影响:频繁调用 asMap().get(key) 比原生 cache.get(key, ...) 慢 10%~20%,因为绕过了 Caffeine 内部的 fast-path 优化(如避免包装 Optional)。
- 不要用
asMap().put(key, value)替代cache.put(key, value),前者不触发removalListener,也不参与权重/大小统计 asMap().replace(key, oldValue, newValue)是原子的,但 oldValue 必须严格等于当前值(引用相等 or equals),注意装箱类型陷阱- 如果业务逻辑强依赖 Map 接口,建议封装一层适配器,把
cache.get(key, f)包装成类似 computeIfAbsent 的语义,而不是裸用 asMap
W-TinyLFU 的窗口期、weigher 的实现精度、以及 loading 过程是否可取消——这三个地方一旦配置不当,问题往往在线上压测时才暴露,而且很难复现。
以上就是本文的全部内容了,是否有顺利帮助你解决问题?若是能给你带来学习上的帮助,请大家多多支持golang学习网!更多关于文章的相关知识,也可关注golang学习网公众号。
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
403 收藏
-
197 收藏
-
454 收藏
-
202 收藏
-
280 收藏
-
386 收藏
-
146 收藏
-
407 收藏
-
424 收藏
-
291 收藏
-
455 收藏
-
336 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习