登录
首页 >  Golang >  Go问答

我可以删除字节表示中的末尾零来比较字符串吗?

来源:stackoverflow

时间:2024-03-15 21:48:27 141浏览 收藏

Go 语言中,比较带重音的字符串(如 "café")与其非重音形式(如 "cafe")时,字符串转换后会在末尾添加额外的零字节。虽然这些零字节不会改变字符串的显示形式,但它们会影响字符串比较。通过使用 Transformer.Transform() 函数并存储返回的写入目标字节数,可以切片目标切片以仅包含有用的字节,从而删除尾随零。这样,带重音的字符串就可以正确地与非重音形式进行比较。

问题内容

我需要比较 go 中的字符串。 问题是:我想将重音单词(café)与其非重音形式(cafe)进行比较。 我做的第一件事是将带重音的 string 转换为非重音形式:

您可以在此处运行代码:https://play.golang.org/p/-eruqeujzet

但是每次我在字符串中进行这种转换时,它都会在最后添加更多的符文。上面的例子打印:

bytes: [99 97 102 101 0] string: cafe

由于我需要将从此过程返回的字符串与其不带“é”的对应字符串进行比较,因此我需要从 []byte 中删除最后一个 rune (0)。

运行一些测试后,我发现最后一个 0(有时会添加多个 0)不会改变字符串表示形式。

我错过了什么吗?我可以删除 []byte 末尾的所有零吗?

这是我删除 0 并比较字符串的代码:

https://play.golang.org/p/houeagi4uux

由于我们无法在这个领域单独工作,因此我阅读的文章是为了达到我现在的水平:

https://blog.golang.org/strings

https://blog.golang.org/normalization

https://unicode.org/reports/tr15/

https://www.joelonsoftware.com/2003/10/08/the-absolute-minimum-every-software-developer-absolutely-positively-must-know-about-unicode-and-character-sets-no -借口/


解决方案


这是您的自定义 transform() 函数:

func transform(s string) ([]byte, error) {
    var t transform.transformer
    t = transform.chain(norm.nfd, runes.remove(runes.in(unicode.mn)), norm.nfc)
    dst := make([]byte, len(s))
    _, _, err := t.transform(dst, []byte(s), true)
    if err != nil {
        return nil, err
    }
    return dst, nil
}

其中您使用的是 Transformer.Transform(),它还返回写入目标的字节数。但您不使用该返回值。

最简单的方法是存储 ndst 返回值,并对目标切片进行切片,因为这保存了其中“有用”字节的数量(超出 ndst 的字节将保留 0,如前面的 make() 调用传递给您的那样):

ndst, _, err := t.transform(dst, []byte(s), true)
if err != nil {
    return nil, err
}
return dst[:ndst], nil

通过此更改,返回的切片将仅包含有用的字节,而不包含尾随零。

输出将是(在 Go Playground 上尝试):

2009/11/10 23:00:00 bytes: [99 97 102 101] string: cafe

以上就是《我可以删除字节表示中的末尾零来比较字符串吗?》的详细内容,更多关于的资料请关注golang学习网公众号!

声明:本文转载于:stackoverflow 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>