首页 > Golang > Go教程

Golang字符串索引与截取技巧

时间：2026-01-02 16:51:40 344浏览收藏

从现在开始，努力学习吧！本文《Golang字符串索引与字符截取方法》主要讲解了等等相关知识点，我会在golang学习网中持续更新相关的系列文章，欢迎大家关注并积极留言建议。下面就先一起来看一下本篇正文内容吧，希望能帮到你！

Go中s[0]不能获取首字符，因string是UTF-8字节序列，需转为rune切片或用utf8.DecodeRuneInString按Unicode字符安全访问。

如何在Golang中使用字符串索引_Golang字符访问与截取方法

Go 语言里不能直接用 s[0] 拿到“第一个字符”，因为 string 底层是字节切片（[]byte），不是 Unicode 字符数组。想安全访问或截取中文、emoji 等多字节字符，必须按 rune 处理。

为什么 `s[i]` 可能出错或返回乱码

字符串字面量在 Go 中是 UTF-8 编码的只读字节序列。对中文或 emoji 执行 s[0] 返回的是首字节（比如 中 的 UTF-8 编码是 0xe4 0xb8 0xad，s[0] 就是 0xe4），不是完整字符，更不是 rune。

常见错误现象：

遍历 string 用 for i := 0; i + s[i] → 得到字节，不是字符，中文会显示为
用 s[0:2] 截取前两个字节 → 可能截断 UTF-8 编码，panic 或输出乱码
len(s) 返回字节数，不是字符数（len("你好") == 6，但字符数是 2）

正确获取第 N 个字符：转成 `[]rune` 再索引

这是最直观、适合中小长度字符串（len(s) ）的做法。Go 运行时会把 UTF-8 解码为 Unicode 码点序列。

func charAt(s string, i int) (rune, bool) {
	r := []rune(s)
	if i = len(r) {
		return 0, false
	}
	return r[i], true
}

s := "Hello世界?"
if c, ok := charAt(s, 5); ok {
	fmt.Printf("%c\n", c) // 输出：世
}

注意点：

每次调用 []rune(s) 都会分配新切片，频繁操作大字符串时有性能开销
索引越界不会 panic，但需手动检查 i
不适用于需要原地修改的场景（rune 切片和原 string 无关）

安全截取子串：用 `utf8.RuneCountInString` + `strings.IndexRune` 或循环解码

如果要取 “前 3 个字符” 或 “从第 2 个字符开始截 4 个”，不能用字节偏移 s[start:end]，得先算出对应字节位置。

推荐做法（兼顾清晰与可控）：

func substringByRune(s string, start, count int) string {
	if start = len(r) {
		return ""
	}
	end := start + count
	if end > len(r) {
		end = len(r)
	}
	return string(r[start:end])
}

s := "a你好b?c"
fmt.Println(substringByRune(s, 1, 3)) // 输出："你好b"

替代方案（零分配，适合超长文本或性能敏感场景）：

用 utf8.DecodeRuneInString 手动迭代，累计字节偏移
用 strings.IndexRune 定位某字符位置，再结合 utf8.RuneStart 判断是否在合法起始字节上
避免用 bytes.Index 或正则匹配 Unicode 字符边界

遍历字符别用 `for i := 0; i`

标准且安全的方式是用 range —— 它自动按 rune 迭代，并返回字节起始位置和 rune 值：

s := "αβγΔε"
for i, r := range s {
	fmt.Printf("pos %d: %c (U+%04X)\n", i, r, r)
}
// 输出：
// pos 0: α (U+03B1)
// pos 2: β (U+03B2)
// pos 4: γ (U+03B3)
// pos 6: Δ (U+0394)
// pos 8: ε (U+03B5)

关键点：