首页 > 文章 > 前端

Node.js 多核负载均衡技巧

时间：2026-05-20 13:39:25 466浏览收藏

Node.js 的 cluster 模块虽是官方推荐的多核利用方案，却远非“开箱即用”的负载均衡器——它仅在 TCP 连接建立时分发流量，且默认策略在 macOS/Windows 下因采用 SCHED_NONE 而导致请求严重倾斜至首个 worker；真正均衡需显式启用 SCHED_RR。更关键的是，cluster 完全不介入 HTTP 层，无法按 URL、Header 或用户做路由，细粒度分发必须依赖反向代理或外部 LB；worker 间内存隔离，状态共享只能靠消息通信或 Redis 等外部服务；而优雅重启更是一道隐形门槛：需手动监听信号、关闭服务器、等待连接释放再退出，稍有不慎就会引发请求丢失或服务抖动——多核能力的背后，是连接生命周期管理、进程协同与状态一致性的深度挑战。

如何利用 cluster 模块实现 Node.js 服务在多核 CPU 上的负载均衡

Node.js 单进程默认只跑在一个 CPU 核心上，cluster 模块是官方提供的、最轻量且可靠的方式，让服务真正吃满多核 CPU —— 但它不是开箱即用的“自动负载均衡器”，核心在于主进程（master）分发连接，而非请求。

为什么 `cluster.fork()` 后请求没均匀打到各 worker？

常见现象：启动 4 个 worker，但 curl 连续压测时，只有 1–2 个 worker 的 console.log 有输出，CPU 使用率也明显不均。这是因为默认的 cluster.schedulingPolicy 在不同系统行为不一致：

Linux 默认是 cluster.SCHED_RR（Round-Robin），按连接轮询分发，表现接近均衡
macOS 和 Windows 默认是 cluster.SCHED_NONE，由内核决定，实际常导致连接全落在第一个 worker 上

解决方法很简单，在 cluster.isMaster 分支中显式设置：

if (cluster.isMaster) {
  cluster.schedulingPolicy = cluster.SCHED_RR;
  for (let i = 0; i 

<h3><code>cluster</code> 能否对 HTTP 请求做细粒度负载（比如按 URL 路由）？</h3>
<p>不能。这是关键认知边界：<code>cluster</code> 只在 TCP 连接建立阶段做分发，一旦连接建立（尤其是 keep-alive 场景），后续所有请求都复用该 socket，必然落到同一个 worker。它不解析 HTTP 头，也不介入应用层路由。</p>
<p>如果你需要按路径、Header 或用户 ID 做分发，必须自己实现反向代理层（如用 <code>http-proxy</code> + <code>express</code>），或改用外部负载均衡器（Nginx、Traefik）。试图在 master 进程里拦截并重写 HTTP 流量，会严重破坏性能和稳定性。</p>

<h3>worker 之间如何共享状态或通信？</h3>
<p>worker 是独立进程，内存不共享。跨 worker 通信只能靠：</p>