登录
首页 >  Golang >  Go教程

Go语言遍历字符串方法详解

时间:2026-04-07 11:12:22 190浏览 收藏

Go语言中遍历字符串必须使用for range,因为字符串底层是UTF-8字节序列,直接用len(str)配合str[i]按字节索引极易导致越界、乱码甚至panic——尤其在处理中文、emoji或带重音字符(如“café”)时;for range能自动按Unicode码点(rune)正确解码,安全获取字符及其起始字节位置,是唯一可靠且推荐的字符级遍历方式;若需修改字符串内容,则应先转为[]rune操作再转回,拼接类任务优先使用strings.Builder以避免性能损耗,而任何脱离rune意识的“字符位置”或“字符串长度”理解,本质上都只是危险的字节偏移。

Go语言怎么遍历字符串_Go语言字符串遍历方法教程【干货】

Go 语言遍历字符串,**必须用 for range,其他方式不是错就是坑**。直接用 len(str) 配合 str[i] 看似简单,但一碰到中文、emoji 或带重音的字母(比如 “café”),立马字节越界、乱码、甚至 panic。

为什么 for i := 0; i 会出问题

因为 string 在 Go 里是 UTF-8 字节序列,len(str) 返回的是字节数,不是字符数。一个中文字符占 3 个字节,str[0] 取到的只是它的第一个字节——单独解码无效,%c 打印出来就是 或问号。

  • str = "你好"len(str) == 6,但实际只有 2 个字符
  • str[0]0xe4(UTF-8 第一字节),不是 ‘你’
  • 循环到 i = 1 时,str[1]0xbd,根本不是合法 UTF-8 起始字节,fmt.Printf("%c", str[1]) 输出不可靠
  • 若后续做 str[i:i+1] 切片,可能切在 UTF-8 中间,产生非法字节序列

for range 是唯一推荐的字符级遍历方式

它内部自动按 Unicode 码点(rune)解码 UTF-8,每次迭代返回两个值:i 是该 rune 在原始字符串中的**起始字节位置**,rrune 类型的完整字符值。

  • for i, r := range "Go编程" 中,i 是 0、2、4、7(注意:英文占 1 字节,中文占 3 字节)
  • r 类型是 rune(即 int32),可安全用于 unicode.Is()、大小写转换等
  • 想获取“第几个字符”的序号?得自己计数:idx := 0; for _, r := range s { ...; idx++ },别依赖 i
  • 不能通过 str[i] = 'x' 修改字符串——string 不可变,编译直接报错

需要修改字符串时,怎么安全操作字符

如果目标是过滤、替换、转大小写等,必须先把 string 转成 []rune,操作完再转回 string;拼接类操作优先用 strings.Builder

  • 要逐字符编辑(如把所有汉字转为 [U+XXXX]):runes := []rune(s); for i := range runes { ... }; s = string(runes)
  • 要高效拼接(如日志组装、模板填充):var b strings.Builder; b.WriteString(...); b.WriteRune(...); result := b.String()
  • 避免 s += "part" —— 每次都新建底层数组,性能差
  • 真要按字节处理(比如解析二进制协议头)?用 utf8.DecodeRuneInString(s),它返回首个 rune 和占用字节数,可手动推进 s = s[n:],但千万别用 s[1:]

最常被忽略的一点:你以为的“字符位置”,其实是字节偏移;你以为的“字符串长度”,其实是字节数。只要没转 []rune 或没用 for range,就还没真正开始处理字符。

文中关于的知识介绍,希望对你的学习有所帮助!若是受益匪浅,那就动动鼠标收藏这篇《Go语言遍历字符串方法详解》文章吧,也可关注golang学习网公众号了解相关技术文章。

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>