登录
首页 >  Golang >  Go问答

仅编码无符号整数时的 Base64 字符串长度计算

来源:stackoverflow

时间:2024-04-15 20:36:33 300浏览 收藏

对于一个Golang开发者来说,牢固扎实的基础是十分重要的,golang学习网就来带大家一点点的掌握基础知识点。今天本篇文章带大家了解《仅编码无符号整数时的 Base64 字符串长度计算》,主要介绍了,希望对大家的知识积累有所帮助,快点收藏起来吧,否则需要时就找不到了!

问题内容

我正在尝试估计可以使用 5 个字符的 base64、6 个字符等编码多少个无符号整数。

通过编程方法,我发现我可以编码

2^28 - 1 = 268,435,455

有 6 个字符并且

2^35 - 1 = 34,359,738,368

有 7 个字符。

(-1,因为我从 uint 1 开始)

我正在努力概括这一点,因为我假设它从 2^8 = 256 开始,但我不明白我是如何以 2835 结束的。

这是我在 go 中的实现

func shorten(num uint64) string {
    buf := make([]byte, binary.maxvarintlen64)
    n := binary.putuvarint(buf, num)
    b := buf[:n]
    encoded := base64.urlencoding.encodetostring(b)
    return strings.replace(encoded, "=", "", -1)
}

还有

0 -> AA
128 -> gAE
16384 -> gIAB
2097152 -> gICAAQ
268435456 -> gICAgAE

所以看起来它以 7 个增量递增:2^7、2^14、2^21 等,但为什么是 7?


解决方案


一个字节是 8 位,因此有 256 个可能的值。 base 64 使用 64 个不同的字符进行编码,因此使用 6 位。那么 6 位可以容纳多少个 8 位对象呢?如果四舍五入,则为 0;如果不四舍五入,则为 3/4。然而,当您开始谈论编码整数时,您的数字似乎没有意义。你说的是用 ascii 写的整数吗?使用 6 个 base64 字符,您可以使用 36 位,因此,如果您正在谈论二进制 32 位无符号整数,您可以一次编码一个,但您可以对您想要的任何一个进行编码,以获得 2**32 种不同的可能性,然后4 个浪费位。使用 ascii 时,您将有 4 个字符,因此将有 10000 种不同的可能性(0 到 9999)。

您会得到意外的结果,因为您使用的 go varints 未编码为常规二进制整数。一些 ipython 输出给你:

in [22]: base64.b64encode((128).to_bytes(1,'little'))                                                                                          
out[22]: b'ga=='

因为 128 可以编码为单个 8 位字节,所以它只有 2 个字符,并带有一些填充。看看这个:

In [3]: base64.b64decode('gAE=')                                                                                                               
Out[3]: b'\x80\x01'

In [4]: int.from_bytes(_,'little')                                                                                                             
Out[4]: 384

因此,正如您所看到的,putuvarint 不仅仅是对可变长度的整数进行编码,它还对可变整数进行编码,即它的编码方式可以在不事先知道其大小的情况下进行解码。如果您查看 source code for the varint go module,它描述了此过程。 go 使用每个字节的 7 位来保存实际的整数二进制数据,最高有效位是一个标志,表明是否还有更多数据即将到来。 128 只是一个字节集的最高有效位。因此,基本上,您根据完成此任务的方式进行两次编码。如果您有一个给定的整数将其编码为 var int,则需要该整数使用 *8/7 来存储该值的字节数,然后对该结果进行 base64 编码,因此您需要该值 *8/6 来存储该值。根据您对 base64 所做的操作,您可能可以确定正在使用的字节数,而无需求助于 go varints,然后计算将只是 8/6 转换(即 4/3 我只是将其保留为位以便更紧密地匹配 varint 过程。)

以上就是《仅编码无符号整数时的 Base64 字符串长度计算》的详细内容,更多关于的资料请关注golang学习网公众号!

声明:本文转载于:stackoverflow 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>