登录
首页 >  Golang >  Go教程

Golang字符串操作技巧:获取字符与子串方法

时间:2026-03-19 18:09:34 163浏览 收藏

Go语言中字符串本质是UTF-8字节序列,这导致直接用`len()`获取长度或下标访问会误算字节数而非真实字符数,尤其在处理中文、emoji等多字节字符时极易出错;本文深入剖析了安全操作字符串的核心技巧:用`for range`遍历rune精准获取每个逻辑字符及其位置,通过`[]rune`切片实现按字符索引取子串,并明确区分了仅适用于ASCII场景的字节级切片操作——掌握这些差异,才能写出健壮、国际化友好的Go字符串处理代码。

如何在Golang中使用字符串长度和索引_获取字符和子串

在 Go 中,字符串是 UTF-8 编码的字节序列,不是 Unicode 码点数组。因此,直接用索引访问“字符”可能出错——尤其遇到中文、emoji 等多字节字符时,下标取到的是单个字节,而非完整字符。

字符串长度 ≠ 字符个数

Go 的 len(s) 返回字节数,不是 rune(Unicode 码点)个数。例如:

s := "你好"
len(s) → 6(每个中文占 3 字节)
utf8.RuneCountInString(s) → 2(真正有 2 个字符)

用 for range 安全遍历字符(rune)

这是获取每个“逻辑字符”的推荐方式,自动按 UTF-8 解码:

  • 每次迭代得到 index(字节偏移)和 rune(Unicode 码点)
  • 适合逐个处理字符、查找位置、统计字符数

s := "Go编程?"
for i, r := range s {
  fmt.Printf("位置 %d: %c (U+%04X)\n", i, r, r)
}

按字节索引取子串:仅限 ASCII 或明确字节边界场景

若确定字符串全是 ASCII(如英文、数字、符号),可安全用切片:

  • s[2:5] → 取第 2 到第 4 个字节(左闭右开)
  • s[0] → 第一个字节(对 ASCII 就是第一个字符)
  • ⚠️ 对中文或 emoji 直接用 s[1] 可能截断 UTF-8 编码,导致乱码或 panic

按字符位置获取子串:先转为 rune 切片

需要“第 n 个字符”或“从第 i 个字符起取 m 个字符”,必须先转成 []rune

  • runes := []rune(s) —— 将字符串解码为 Unicode 码点切片
  • runes[1] → 第二个字符(rune 类型)
  • string(runes[1:3]) → 从第 2 个字符起取 2 个字符组成的字符串

s := "Hello世界"
rs := []rune(s)
fmt.Println(string(rs[0:5])) // "Hello"
fmt.Println(string(rs[5:7])) // "世界"

本篇关于《Golang字符串操作技巧:获取字符与子串方法》的介绍就到此结束啦,但是学无止境,想要了解学习更多关于Golang的相关知识,请关注golang学习网公众号!

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>