登录
首页 >  Golang >  Go教程

rune与byte区别:Unicode字符与字节数据详解

时间:2025-10-02 23:27:29 319浏览 收藏

一分耕耘,一分收获!既然都打开这篇《Golang中rune和byte类型的区别在于:rune用于表示Unicode字符,而byte用于表示字节数据。》,就坚持看下去,学下去吧!本文主要会给大家讲到等等知识点,如果大家对本文有好的建议或者看到有不足之处,非常欢迎大家积极提出!在后续文章我会继续更新Golang相关的内容,希望对大家都有所帮助!

rune是字符,byte是字节。Go中byte为uint8别名,用于处理ASCII和二进制数据;rune为int32别名,表示Unicode码点,用于正确处理中文、emoji等多字节字符。字符串以UTF-8存储,一个字符可能占多个字节。如"你好"占6字节但仅2字符。用len(str)得字节数,len([]rune(str))得字符数。文件操作用byte,文本处理用rune。

解释Golang的rune类型和byte类型有什么不同

在Go语言中,runebyte都是用于表示数据的基本类型,但它们的用途和底层含义有明显区别,主要体现在对字符和字符串的处理方式上。

byte 类型:表示一个字节

byteuint8 的别名,表示一个 8 位无符号整数,取值范围是 0 到 255。它通常用来处理原始的二进制数据或 ASCII 字符。

在字符串中,byte 对应的是字符串的每一个字节。由于 Go 中的字符串是以 UTF-8 编码存储的,一个字符可能占用多个字节,尤其是非 ASCII 字符(如中文、emoji)。

示例:

字符串 "hello" 有 5 个字符,每个字符是 ASCII,所以可以用 5 个 byte 表示。
字符串 "你好" 是 UTF-8 编码,每个汉字占 3 个字节,总共 6 个字节,但只有 2 个字符。

rune 类型:表示一个 Unicode 码点

runeint32 的别名,表示一个 Unicode 码点(code point),即一个完整的字符。它能正确处理包括中文、日文、emoji 等在内的所有 Unicode 字符。

当你需要遍历字符串中的“字符”而不是“字节”时,应该使用 rune。使用 range 遍历字符串时,Go 会自动将 UTF-8 编码的字节序列解码为 rune。

常见操作对比:

  • []byte(str) 可以把字符串转为字节切片,按字节访问
  • []rune(str) 可以把字符串转为 rune 切片,按字符访问

例子:

str := "你好, world!"
len(str) → 返回 13(字节数)
len([]rune(str)) → 返回 9(字符数)

使用建议

当你处理的是:

  • 文件读写、网络传输、二进制协议 → 用 byte
  • 文本处理、字符串遍历、国际化字符 → 用 rune

基本上就这些。简单说:byte 是字节,rune 是字符,特别是在 UTF-8 环境下,区分它们很重要。

今天带大家了解了的相关知识,希望对你有所帮助;关于Golang的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~

前往漫画官网入口并下载 ➜
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>