登录
首页 >  Golang >  Go教程

Go语言字符串长度获取方法

时间:2026-04-14 08:18:45 375浏览 收藏

Go语言中字符串长度的获取远比表面复杂:`len()`函数返回的是UTF-8编码后的字节数而非人眼可见的字符数,导致"你好"返回6、emoji甚至返回多位字节,极易在截取、分页或UI显示时引发乱码和逻辑错误;真正安全的做法是使用`utf8.RuneCountInString()`统计Unicode码点数量,或通过`[]rune`转换后操作——看似简单的长度计算,实则是Go处理Unicode时最隐蔽却高频踩坑的陷阱,稍不注意,上线后满屏就成常态。

Go语言怎么获取字符串长度_Go语言len函数用法教程【基础】

Go语言里用 len() 获取字符串长度,但结果可能不是你预期的“字符个数”——它返回的是字节长度,不是Unicode码点数量。

为什么 len("你好") 返回 6 而不是 2

Go 的字符串底层是只读的字节序列([]byte),len() 统计的是 UTF-8 编码后的字节数。中文字符在 UTF-8 中占 3 字节,所以 "你好" 是 2 个字符、6 个字节。

  • len("a") → 1(ASCII,1 字节)
  • len("?") → 4(emoji,UTF-8 四字节)
  • len("?‍?") → 11(带 ZWJ 连接符的组合 emoji,多个 UTF-8 码元)

想得到“人眼可见的字符数”,该用 utf8.RuneCountInString()

当你要做分页、截断、光标移动或 UI 显示计数时,得按 Unicode 码点(rune)算,而不是字节。

import "unicode/utf8"

s := "Hello 世界 ?"
fmt.Println(len(s))                    // 17(字节)
fmt.Println(utf8.RuneCountInString(s)) // 11(rune 数:5 ASCII + 2 中文 + 1 空格 + 3 emoji 相关码元)
  • 注意:utf8.RuneCountInString() 遍历整个字符串,时间复杂度 O(n),高频调用需留意
  • 如果已转成 []rune,直接用 len([]rune(s)) 更快,但会额外分配内存
  • 对纯 ASCII 字符串,两者结果一致,可省略转换

截取前 N 个字符?别直接用 s[:n]

按字节截断会导致 UTF-8 编码损坏,出现 替换符。

  • 错误写法:s[:3]"你好" 会切出非法字节序列
  • 正确做法:先转 []rune,再切,最后转回 string:string([]rune(s)[:2])
  • 若性能敏感且确定无多字节字符,可用 strings.Reader + ReadRune() 逐个读取控制边界

真正麻烦的不是记不住函数名,而是默认用 len() 得到“看似合理”的数字,上线后遇到 emoji 或生僻字才暴露问题——这时候日志里全是 ,而你还在查前端编码设置。

以上就是《Go语言字符串长度获取方法》的详细内容,更多关于的资料请关注golang学习网公众号!

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>