登录
首页 >  Golang >  Go问答

将 UTF-8 字节字符串的命令行输出转换为 Go 中的 Unicode 代码点

来源:stackoverflow

时间:2024-04-10 13:15:39 287浏览 收藏

欢迎各位小伙伴来到golang学习网,相聚于此都是缘哈哈哈!今天我给大家带来《将 UTF-8 字节字符串的命令行输出转换为 Go 中的 Unicode 代码点》,这篇文章主要讲到等等知识,如果你对Golang相关的知识非常感兴趣或者正在自学,都可以关注我,我会持续更新相关文章!当然,有什么建议也欢迎在评论留言提出!一起学习!

问题内容

我正在通过 os.Exec 从 Go 运行一个可执行文件,它给出以下输出:(\\xe2\\x96\\xb2)。输出包含一个 UTF-8 字节字符串,我想将其转换为相应的 Unicode 代码点 (U+25B2)。我期望看到或尝试转换为:“(▲)”。 我已经在 Go 博客 (https://blog.golang.org/strings) 中查看了此条目,但它以解释的字符串文字开头,而命令输出似乎是原始字符串文字。我尝试过 strconv.Quotestrconv.Unquote,但没有达到我想要的效果。


解决方案


您可以使用 strconv 包来解析包含转义序列的字符串文字。

快速但肮脏的方法是简单地添加缺少的引号并使用 strconv.Unquote 将其解释为带引号的字符串

s := `\xe2\x96\xb2`
s, err := strconv.unquote(`"` + s + `"`)

您还可以直接一次解析字符串一个字符(这是 unquote 内部所做的),使用 strconv.UnquoteChar

s := `\xe2\x96\xb2`
buf := make([]byte, 0, 3*len(s)/2)
for len(s) > 0 {
    c, _, ss, err := strconv.UnquoteChar(s, 0)
    if err != nil {
        log.Fatal(err)
    }
    s = ss
    buf = append(buf, byte(c))
}
s = string(buf)

https://play.golang.org/p/6SDij9d-aRr

到这里,我们也就讲完了《将 UTF-8 字节字符串的命令行输出转换为 Go 中的 Unicode 代码点》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于的知识点!

声明:本文转载于:stackoverflow 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>