首页 > 文章 > 前端

Node.js三种子进程创建方法详解

时间：2025-09-20 14:47:35 144浏览收藏

推广推荐

支持 PC / 移动端，安全直达

哈喽！大家好，很高兴又见面了，我是golang学习网的一名作者，今天由我给大家带来一篇《Node.js创建子进程的三种方法》，本文主要会讲到等等知识点，希望大家一起学习进步，也欢迎大家关注、点赞、收藏、转发! 下面就一起来看看吧！

Node.js子进程创建方式有四种：spawn用于流式处理和长时间运行任务；exec通过shell执行简单命令并缓冲输出；execFile直接执行可执行文件更安全高效；fork专用于Node.js进程间通信，支持IPC消息传递。

Node.js中如何创建子进程？

在Node.js中创建子进程，核心在于利用内置的child_process模块。这个模块提供了一系列方法，让我们能够从Node.js环境中启动并管理外部程序或脚本，从而扩展Node.js的能力边界，处理CPU密集型任务，或者简单地执行系统命令。

Node.js提供spawn、exec、execFile和fork等方法来创建子进程。选择哪种方式，往往取决于你想要执行什么、如何处理输入输出，以及是否需要进程间通信。

Node.js子进程的几种创建方式及其适用场景是什么？

谈到Node.js创建子进程，我个人觉得这就像是打开了一个工具箱，里面有各种锤子、螺丝刀，每种工具都有其最趁手的活儿。理解它们之间的差异，是高效利用Node.js处理外部任务的关键。

1. child_process.spawn(command[, args][, options])

这是最基础、也是最底层的子进程创建方式。spawn会直接启动一个新进程，不创建shell，并返回一个ChildProcess实例。它的输入输出是流式的，这意味着你可以实时地读取子进程的stdout和stderr，或者向其stdin写入数据。

适用场景：
- 长时间运行的进程： 比如启动一个后台服务、持续的数据流处理（如视频转码、日志分析）。
- 我个人觉得，当你需要对子进程的输入输出有精细控制，或者处理大量数据时，spawn是首选。它避免了exec那种一次性缓冲所有输出可能带来的内存压力。
- 对安全性要求较高： 不通过shell执行命令，可以有效避免shell注入的风险。
- 自定义环境变量和工作目录： options参数提供了丰富的配置项。

示例：

const { spawn } = require('child_process');

const ls = spawn('ls', ['-lh', '/usr']);

ls.stdout.on('data', (data) => {
  console.log(`stdout: ${data}`);
});

ls.stderr.on('data', (data) => {
  console.error(`stderr: ${data}`);
});

ls.on('close', (code) => {
  console.log(`子进程退出，退出码 ${code}`);
});

ls.on('error', (err) => {
  console.error('启动子进程失败:', err);
});

2. child_process.exec(command[, options][, callback])

exec方法会启动一个shell来执行命令，然后将子进程的stdout和stderr输出全部缓存起来，并在子进程结束后通过回调函数一次性返回。这使得它在执行一些简单的shell命令时非常方便。

适用场景：
- 执行简单命令： 比如ls -al、git status等，这些命令通常输出量不大，且执行时间较短。
- 需要shell特性： 如果你的命令依赖于shell的管道、重定向、通配符等特性，exec会是更方便的选择。
- 说实话，我有时候为了图方便，处理一些简单的系统命令时，会直接用exec。但心里也清楚，它在处理大输出时可能会有问题，而且默认的shell执行也带来了一定的安全考量。

示例：

const { exec } = require('child_process');

exec('find . -type f | wc -l', (error, stdout, stderr) => {
  if (error) {
    console.error(`exec error: ${error}`);
    return;
  }
  console.log(`文件数量: ${stdout.trim()}`);
  if (stderr) {
    console.error(`stderr: ${stderr}`);
  }
});

3. child_process.execFile(file[, args][, options][, callback])

execFile与exec类似，但它直接执行指定的可执行文件，而不是通过shell。这使得它比exec更安全，也更高效，因为它省去了启动shell的开销。它也像exec一样，会缓冲所有的输出。

适用场景：
- 执行已知可执行文件： 当你知道要执行哪个程序，并且不需要shell的额外功能时。
- 提高安全性： 避免shell注入的风险，是比exec更推荐的选择。

示例：

const { execFile } = require('child_process');

execFile('node', ['-v'], (error, stdout, stderr) => {
  if (error) {
    console.error(`execFile error: ${error}`);
    return;
  }
  console.log(`Node.js 版本: ${stdout.trim()}`);
});

4. child_process.fork(modulePath[, args][, options])

fork是spawn的一个特例，专门用于创建Node.js子进程。它会自动在子进程中重新运行Node.js解释器，并允许父子进程之间通过一个内置的IPC（Inter-Process Communication）通道进行通信。

适用场景：
- 多核CPU利用： 将CPU密集型任务分发给多个Node.js进程处理，充分利用多核资源，避免阻塞主事件循环。
- 进程间通信： 需要父子Node.js进程之间传递消息或数据时。
- 对我来说，fork是Node.js实现并发和扩展性的利器。当你需要构建一个高性能、可伸缩的服务时，fork配合cluster模块，几乎是标配。

示例 (父进程):

// parent.js
const { fork } = require('child_process');

const child = fork('./child.js');

child.on('message', (msg) => {
  console.log('父进程收到消息:', msg);
});

child.send({ hello: '从父进程问候' });

child.on('close', (code) => {
  console.log(`子进程退出，退出码 ${code}`);
});

示例 (子进程):

// child.js
process.on('message', (msg) => {
  console.log('子进程收到消息:', msg);
  process.send({ hi: '从子进程问候' });
});

// 模拟一些工作
setTimeout(() => {
  console.log('子进程工作完成');
  // process.exit(); // 也可以选择在完成工作后退出
}, 2000);

如何处理Node.js子进程的输入、输出和错误流？

处理子进程的I/O流，是与外部程序交互的核心。这不仅仅是获取结果，更是理解程序运行状态、进行实时交互的关键。

对于spawn方法创建的子进程，它会返回一个ChildProcess实例，这个实例有stdout、stderr和stdin属性，它们都是Node.js的Stream对象。

标准输出 (stdout) 和标准错误 (stderr)：
- 这两个是ReadableStream。你可以监听它们的data事件来实时获取子进程的输出。当子进程产生大量输出时，这种流式处理方式能有效避免内存溢出。
- child.stdout.on('data', (chunk) => { /* 处理数据 */ });
- child.stderr.on('data', (chunk) => { /* 处理错误 */ });
- 你也可以使用pipe()方法将子进程的输出直接导向父进程的输出或文件，这在处理日志或将数据传递给下一个进程时非常方便。
```
const { spawn } = require('child_process');
const child = spawn('node', ['-e', 'console.log("hello"); console.error("error!");']);
child.stdout.pipe(process.stdout); // 将子进程标准输出导入父进程标准输出
child.stderr.pipe(process.stderr); // 将子进程标准错误导入父进程标准错误
```
标准输入 (stdin)：
- 这是一个WritableStream。你可以通过child.stdin.write()方法向子进程发送数据，或者使用pipe()方法将父进程的输入导入子进程。
- 在我看来，stdin的使用场景相对少一些，但当你需要与一个交互式命令行程序打交道时，比如密码输入、确认提示，它就显得非常重要了。
- ```
const { spawn } = require('child_process');
const grep = spawn('grep', ['hello']); // 启动一个grep进程
grep.stdin.write('hello world\n');
grep.stdin.write('goodbye world\n');
grep.stdin.end(); // 结束输入

grep.stdout.on('data', (data) => {
  console.log(`grep stdout: ${data}`);
});
```

对于exec和execFile，它们通过回调函数一次性返回stdout和stderr的全部内容。

exec('ls -l', (error, stdout, stderr) => {
  if (error) {
    console.error(`执行出错: ${stderr}`);
    return;
  }
  console.log(`输出: ${stdout}`);
});

这种方式简单直接，但正如之前所说，如果输出量巨大，可能会导致内存问题。因此，在选择方法时，务必考虑子进程的输出特性。

Node.js子进程间通信（IPC）有哪些方法，如何实现？

进程间通信（IPC）是多进程应用能够协同工作的基石。在Node.js中，当我们需要不同的进程交换数据、共享状态或协调任务时，IPC就变得至关重要。

1. 基于fork的IPC通道

这是Node.js最直接、最优雅的IPC方式，专为fork创建的Node.js子进程设计。当使用fork方法时，Node.js会在父子进程之间自动建立一个IPC通道。

实现方式：
- 父进程向子进程发送消息： 使用child.send(message[, sendHandle][, options][, callback])方法。message可以是任何JSON可序列化的对象。
- 子进程向父进程发送消息： 使用全局的process.send(message[, sendHandle][, options][, callback])方法。
- 接收消息： 父子进程都监听'message'事件。
```
// 父进程 (parent.js)
const { fork } = require('child_process');
const child = fork('./worker.js');

child.on('message', (msg) => {
  console.log('父进程收到:', msg); // { result: 42 }
});

child.send({ task: 'calculate', data: 21 }); // 发送任务给子进程
```
```
// 子进程 (worker.js)
process.on('message', (msg) => {
  console.log('子进程收到:', msg); // { task: 'calculate', data: 21 }
  if (msg.task === 'calculate') {
    const result = msg.data * 2;
    process.send({ result: result }); // 将结果发回父进程
  }
});
```
- 我发现这种IPC方式非常适合任务分发和结果汇总的场景，比如一个主进程负责接收请求，然后fork出多个工作进程去处理实际的计算，最后将结果传回主进程统一响应。

2. 标准输入/输出 (Standard I/O)

虽然不如fork的IPC通道那么结构化，但通过stdin和stdout也可以实现简单的进程间通信。一个进程可以将数据写入其标准输出，另一个进程则从其标准输入读取。这在shell脚本中很常见，Node.js也可以这样做。

实现方式：
- 父进程将数据写入子进程的stdin。
- 子进程从process.stdin读取数据，处理后写入process.stdout。
- 父进程从子进程的stdout读取数据。
- 这种方式通常用于传递文本数据或序列化的JSON字符串。

3. 文件系统

通过读写共享文件来传递数据，是最原始也最通用的IPC方式之一。

实现方式：
- 一个进程将数据写入文件。
- 另一个进程从该文件读取数据。
- 需要注意文件锁、并发写入等问题，以避免数据损坏或竞争条件。
- 坦白说，除了非常简单或对实时性要求不高的场景，我很少直接用文件系统做IPC。它引入了I/O开销，而且同步机制处理起来也比较麻烦。

4. 网络套接字 (Sockets)

父子进程可以像独立的应用程序一样，通过TCP或UDP套接字进行通信。一个进程作为服务器监听端口，另一个进程作为客户端连接。

实现方式：
- 使用Node.js的net或dgram模块创建服务器和客户端。
- 这提供了最大的灵活性，可以跨机器甚至跨网络进行通信。
- 当你需要构建一个更复杂的分布式系统，或者子进程并不一定是Node.js进程时，网络套接字是一个非常强大的选择。但它的配置和管理也相对复杂一些。

5. 共享内存 (Shared Memory) / 数据库

虽然Node.js本身没有直接的共享内存API，但可以通过一些外部模块或间接方式（如使用Redis、PostgreSQL等数据库）来实现进程间的数据共享。数据库本质上可以看作是一种高级的共享存储，提供了事务、持久化等特性。

选择哪种IPC方式，很大程度上取决于你的具体需求：是Node.js进程间的轻量级通信，还是需要跨语言、跨机器的复杂交互？理解这些选项，能帮助你更好地设计多进程应用。

到这里，我们也就讲完了《Node.js三种子进程创建方法详解》的内容了。个人认为，基础知识的学习和巩固，是为了更好的将其运用到项目中，欢迎关注golang学习网公众号，带你了解更多关于的知识点！