登录
首页 >  Golang >  Go问答

在Golang中按照字节数分割字符串

来源:stackoverflow

时间:2024-03-14 10:36:24 172浏览 收藏

Golang不知道大家是否熟悉?今天我将给大家介绍《在Golang中按照字节数分割字符串》,这篇文章主要会讲到等等知识点,如果你在看完本篇文章后,有更好的建议或者发现哪里有问题,希望大家都能积极评论指出,谢谢!希望我们能一起加油进步!

问题内容

http请求头有4k长度限制。 我想根据此限制拆分要包含在标头中的字符串。 我应该先使用 []byte(str) 进行分割,然后使用 string([]byte) 将每个分割部分转换回字符串吗? 有没有更简单的方法?


解决方案


在 go 中,字符串实际上只是一个字节序列,如 indexing a string produces bytes。因此,您可以通过将字符串切片为 4kb 子字符串,将其简单地拆分为子字符串。

但是,由于 utf-8 字符可以跨越多个字节,因此您有可能会在字符序列的中间进行拆分。如果在解码之前分割字符串总是在另一端以相同的顺序再次连接在一起,那么这不是问题,但如果您尝试单独解码每个字符串,则可能会得到无效的前导或尾随字节序列。如果您想防止这种情况,您可以使用 unicode/utf8 包来检查您是否在有效的前导字节上进行拆分,如下所示:

package httputil

import "unicode/utf8"

const maxLen = 4096

func SplitHeader(longString string) []string {
    splits := []string{}

    var l, r int
    for l, r = 0, maxLen; r < len(longString); l, r = r, r+maxLen {
        for !utf8.RuneStart(longString[r]) {
            r--
        }
        splits = append(splits, longString[l:r])
    }
    splits = append(splits, longString[l:])
    return splits
}

直接对字符串进行切片比转换为 []byte 并返回更有效,因为由于 string 是不可变的,而 []byte 不是,因此在转换时必须将数据复制到新内存,采用 o( n) 时间(双向!),而切片字符串只是返回一个新的字符串头,该新的字符串头由与原始字符串相同的数组支持(花费恒定时间)。

今天关于《在Golang中按照字节数分割字符串》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!

声明:本文转载于:stackoverflow 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>