登录
首页 >  Golang >  Go问答

golang中使用£字符引发的特殊字符

来源:stackoverflow

时间:2024-03-05 21:09:26 402浏览 收藏

从现在开始,我们要努力学习啦!今天我给大家带来《golang中使用£字符引发的特殊字符》,感兴趣的朋友请继续看下去吧!下文中的内容我们主要会涉及到等等知识点,如果在阅读本文过程中有遇到不清楚的地方,欢迎留言呀!我们一起讨论,一起学习!

问题内容

我有一个函数,可以从一串有效字符生成一个随机字符串。当它选择 £ 时,我偶尔会得到奇怪的结果

我已将其复制为以下最小示例:

func foo() string {
    validchars := "abcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyz0123456789~@:!£$%^&*"
    var result strings.builder

    for i := 0; i < len(validchars); i++ {

        currchar := validchars[i]
        result.writestring(string(currchar))
    }
    return result.string()
}

我希望它能返回

abcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyz0123456789~@:!£$%^&*

但事实并非如此,它会产生

abcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyz0123456789~@:!£$%^&*
                                                                  ^
                                             where did you come from ?

如果我从原始 validchars 字符串中去掉 £ 符号,那个奇怪的 a 就会消失。

func foo() string {
    validChars := "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789~@:!$%^&*"
    var result strings.Builder

    for i := 0; i < len(validChars); i++ {

        currChar := validChars[i]
        result.WriteString(string(currChar))
    }
    return result.String()
}

这会产生 abcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyz0123456789~@:!$%^&*


正确答案


string[]byte 的类型别名。您对 string 的心智模型可能是它由一片字符组成 - 或者,正如我们在 Go 中所说的那样:一片 rune

对于 validChars 字符串中的许多符文来说,这很好,因为它们是 ASCII 字符的一部分,因此可以用 UTF-8 中的单个字节表示。但是,£ 符文表示为 2 个字节。

现在,如果我们考虑一个字符串 £,它由 1 个符文但 2 个字节组成。正如我所提到的,字符串实际上只是一个 []byte。如果我们像您在示例中有效执行的那样获取第一个元素,我们将仅获得表示 £ 的两个字节中的第一个。当您将其转换回字符串时,它会给您一个意想不到的符文。

解决问题的方法是首先将字符串 validChars 转换为 []rune。然后,您可以通过索引访问其各个符文(而不是字节),并且 foo 将按预期工作。您可以在 this playground 中看到它的实际效果。

另请注意,len(validChars) 将为您提供字符串中的字节数。要获取符文数量,请改用 utf8.RuneCountInString

最后,here 是 Rob Pike 发表的一篇关于您可能感兴趣的主题的博客文章。

文中关于的知识介绍,希望对你的学习有所帮助!若是受益匪浅,那就动动鼠标收藏这篇《golang中使用£字符引发的特殊字符》文章吧,也可关注golang学习网公众号了解相关技术文章。

声明:本文转载于:stackoverflow 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>