首页 > 文章 > php教程

PHParray_chunk按长度分组文本教程

时间：2026-01-27 23:57:35 155浏览收藏

本篇文章向大家介绍《PHP按长度分组文本，array_chunk使用教程》，主要包括，具有一定的参考价值，需要的朋友可以参考一下。

str_split()按字节切分，适合ASCII场景；含中文需用mb_substr()循环实现UTF-8安全分块，避免乱码。

php分割文本按长度分组_php分割后按段长array_chunk【步骤】

用 `str_split()` 直接按固定长度切分字符串

如果只是把一段纯文本（比如 Base64 字符串、十六进制串、日志行）按固定字节数切开，str_split() 是最轻量的选择。它原生支持指定长度，返回字符串数组，不涉及编码判断。

注意：它按字节切分，不是按 UTF-8 字符。中文等多字节字符会被截断，导致乱码 —— 所以只适合 ASCII 或已知单字节编码的场景。

str_split('abcdef', 2) → ['ab', 'cd', 'ef']
长度超出原字符串时，末尾自动截短，不会补空或报错
不支持回调处理，无法跳过空白或合并相邻段

用 `mb_substr()` + 循环实现安全的 UTF-8 分段

处理含中文、emoji 的文本时，必须用多字节函数。PHP 没有内置的「按字符数分块」函数，得手动循环调用 mb_substr()。

关键点是每次从偏移量 $i 取 $len 个字符，而不是字节；且需用 mb_strlen() 判定总长，避免 strlen() 误算。

示例逻辑：

$chunks = [];<br>$text = '你好world123';<br>$len = 4;<br>for ($i = 0; $i     $chunks[] = mb_substr($text, $i, $len, 'UTF-8');<br>}

结果是 ['你好wo', 'rld123']，每项字符数 ≤4，且无截断乱码
不能直接套 array_chunk() —— 它只对数组重分组，不处理字符串切分

为什么 `array_chunk()` 不适用于「文本按长度分组」

array_chunk() 的输入必须是数组，它只是把已有数组元素按数量打包，和「按文本长度切分」完全无关。常见误解是想先 str_split('abcde') 得到 ['a','b','c','d','e']，再 array_chunk($arr, 3) → [['a','b','c'], ['d','e']]，但这得到的是单字符数组分块，不是你想要的「每块 3 个字符组成的子串」。

错误写法：array_chunk(str_split('hello world'), 3) → 得到的是字符数组的分组，不是字符串分段
正确目标是 ['hel', 'lo ', 'wor', 'ld'] 这类结果，必须用 str_split() 或 mb_substr() 先生成子串数组
混淆根源：把「分块数量」和「每段字符长度」当成同一维度，其实它们作用对象不同