PHP字符串长度计算全攻略
时间:2026-03-20 08:54:30 247浏览 收藏
PHP中字符串长度计算的关键在于区分“字节数”与“字符数”:strlen()返回字节长度,对中文、emoji等UTF-8多字节字符会严重高估(如“你好”返回6);mb_strlen()才真正反映用户感知的字符数量(同例返回2),是表单校验、文本截断、数据库字段匹配等业务场景的唯一可靠选择——尤其当字符串来自用户输入、外部接口或数据库时,必须显式指定"UTF-8"编码并确保mbstring扩展已启用;仅在纯ASCII环境(如token、base64串)下可安全使用更快的strlen(),但混用二者极易引发隐蔽逻辑错误,真正的挑战从来不是性能,而是全链路统一编码意识。

strlen() 和 mb_strlen() 的区别到底在哪
PHP里算字符串长度,strlen() 和 mb_strlen() 经常混用,但结果可能差好几倍——尤其含中文、emoji 或特殊符号时。strlen() 数的是字节数,mb_strlen() 数的是字符数,底层逻辑完全不同。
比如 "你好":
strlen("你好") 返回 6(UTF-8 下每个汉字占 3 字节),
mb_strlen("你好", "UTF-8") 返回 2(两个字符)。
- 只要字符串含非 ASCII 字符(中文、日文、emoji、带重音的拉丁字母),必须用
mb_strlen() mb_strlen()第二个参数不写可能出错:默认编码取决于mb_internal_encoding(),而这个值未必是 UTF-8,建议显式传"UTF-8"mb_strlen()在未启用 mbstring 扩展时会报致命错误Fatal error: Uncaught Error: Call to undefined function mb_strlen(),上线前务必检查扩展是否开启
为什么 var_dump(strlen($str)) 看着对,但业务逻辑却错了
常见陷阱:用 strlen() 做表单校验(比如限制“用户名最多 10 个字符”),用户输 “张三” 就卡住——因为后端以为占了 6 字节,误判超长。这不是函数错了,是语义错配。
- 用户感知的“长度” = 字符个数,不是字节数,校验、截断、显示计数都该用
mb_strlen() - 数据库字段长度限制(如
VARCHAR(20))按字符算,和mb_strlen()对齐;但某些底层操作(如 socket 发送、加密输入)可能真需要字节数,这时才用strlen() - 别依赖 IDE 提示或本地测试环境的默认编码——Docker 容器、线上 PHP 版本、甚至
php.ini里的default_charset都可能影响mb_internal_encoding()结果
mb_strlen() 不生效?先查这三件事
写了 mb_strlen($str, "UTF-8") 还是返回异常值,大概率不是函数问题,而是输入本身已损坏或编码混乱。
- 确认字符串来源:从 POST、文件读取、数据库查出的字符串,是否在中途被错误转码过?比如用
iconv("GBK", "UTF-8", $str)失败后返回false,再传给mb_strlen()就变成算false的长度(即 1) - 检查是否被 trim() 或正则污染:
trim()默认只处理 ASCII 空白符,对全角空格、零宽空格(\u200b)无效,这些字符会被mb_strlen()算进去 - 用
mb_detect_encoding($str, ["UTF-8", "GB2312", "ISO-8859-1"], true)辅助判断真实编码,但注意它不可靠——返回false很常见,别当真理用
性能有差别吗?什么场景可以放心用 strlen()
纯英文、数字、ASCII 符号组成的字符串(比如 token、base64 编码串、URL path),strlen() 比 mb_strlen() 快 3–5 倍,因为后者要逐字节解析多字节序列。
- API 接口里校验
Authorizationheader 的 Bearer token 长度,用strlen()完全 OK - 生成固定长度随机字符串(如
bin2hex(random_bytes(16))),结果全是十六进制字符,也适用strlen() - 但只要字符串来自用户输入、外部 API、数据库或文件,一律默认走
mb_strlen()——省下的那点 CPU 时间,远不如一次中文截断错位带来的排查成本
最麻烦的不是选错函数,而是同一项目里一部分用 strlen()、一部分用 mb_strlen(),还共享同一个长度校验逻辑。编码意识得贯穿输入入口,而不是等出错再补。
今天带大家了解了的相关知识,希望对你有所帮助;关于文章的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~
相关阅读
更多>
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
最新阅读
更多>
-
252 收藏
-
254 收藏
-
260 收藏
-
121 收藏
-
363 收藏
-
106 收藏
-
320 收藏
-
179 收藏
-
248 收藏
-
258 收藏
-
233 收藏
-
454 收藏
课程推荐
更多>
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习