登录
首页 >  Golang >  Go问答

为什么golang没有子字符串?

来源:stackoverflow

时间:2024-03-17 19:09:29 206浏览 收藏

Go语言中没有传统意义上的子字符串函数,因为其使用字节索引而不是字符或符文索引。但是,可以使用字符串切片或自定义函数来实现类似的功能。字符串切片基于字节索引,因此对于仅包含ASCII字符的字符串来说,它与基于字符或符文索引相同。对于包含多字节unicode字符的字符串,需要对字节进行解码,可以使用unicode/utf8软件包或使用for range循环。自定义函数substr()可以接受一个字符串和符文索引,并根据该索引返回一个子字符串。

问题内容

为什么 go 没有子字符串函数?

我可以做一些类似 javascript 原型设计的事情吗,这样我至少可以做一些类似的事情:

string.substring(0,7)

或者我被迫在这里使用我的功能?:

func substring(str string, start int, length int) string {
    return string([]rune(str)[start:length+start])
}

解决方案


子字符串在 go 中也是一个“东西”:对 string 进行切片会生成 string,它与原始 string 共享内存。

不同之处在于,go 中的索引是字节索引,而不是字符或符文索引。 go 将 utf-8 编码的文本字节序列存储在 string 中。

如果您的输入仅包含 ascii 字符(字节值小于 128),则使用字节索引与使用符文索引相同:

s := "abcdef"
fmt.println(s[1:3])

这将输出:

bc

如果您的输入可能包含多字节 unicode 字符,则必须对字符串的 (utf-8) 字节进行解码。为此,有标准的 unicode/utf8 软件包,或者您可以使用 for range 而不是 string 来执行相同的操作。

字符串上的 for range 对字节进行解码,每次迭代“产生”string 的一个 rune,并且还返回 rune 的起始字节位置。

这就是我们如何使用它来构造 substr() 函数:

func substr(s string, start, end int) string {
    counter, startidx := 0, 0
    for i := range s {
        if counter == start {
            startidx = i
        }
        if counter == end {
            return s[startidx:i]
        }
        counter++
    }
    return s[startidx:]
}

substr() 接受一个字符串和一个 start (包含)和 end (不包含)符文索引,并根据该索引返回一个子字符串。为了简洁起见,省略了检查(例如 start <= end)。

测试它:

s := "abcdef"
fmt.println(substr(s, 1, 3))

s = "世界世界世界"
fmt.println(substr(s, 1, 3))
fmt.println(substr(s, 1, 100))

输出(在 Go Playground 上尝试):

bc
界世
界世界世界

今天关于《为什么golang没有子字符串?》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!

声明:本文转载于:stackoverflow 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>