登录
首页 >  Golang >  Go问答

Array vs Slice:访问速度

来源:Golang技术栈

时间:2023-04-11 15:56:31 205浏览 收藏

一分耕耘,一分收获!既然都打开这篇《Array vs Slice:访问速度》,就坚持看下去,学下去吧!本文主要会给大家讲到golang等等知识点,如果大家对本文有好的建议或者看到有不足之处,非常欢迎大家积极提出!在后续文章我会继续更新Golang相关的内容,希望对大家都有所帮助!

问题内容

这个问题是关于 访问数组和切片元素 的速度,而不是关于将它们作为参数传递给函数的效率。

在大多数情况下,我希望 数组切片 更快,因为切片是描述数组连续部分的数据结构,因此在访问切片的元素时可能会涉及额外的步骤(间接地访问其底层数组的元素) .

所以我写了一个小测试来对一批简单的操作进行基准测试。有 4 个基准函数,前 2 个测试 全局 切片和全局数组,另外 2 个测试 局部 切片和局部数组:

var gs = make([]byte, 1000) // Global slice
var ga [1000]byte           // Global array

func BenchmarkSliceGlobal(b *testing.B) {
    for i := 0; i 

我多次运行测试,这是典型的输出(go test -bench .*):

BenchmarkSliceGlobal      300000              4210 ns/op
BenchmarkArrayGlobal      300000              4123 ns/op
BenchmarkSliceLocal       500000              3090 ns/op
BenchmarkArrayLocal       500000              3768 ns/op

分析结果:

访问全局切片比访问全局数组稍慢,这与我预期的一样:
4210vs 4123ns/op

但是访问本地切片比访问本地数组要快得多:
3090vs 3768ns/op

我的问题是: 这是什么原因?

笔记

我尝试改变以下内容,但没有改变结果:

  • 数组/切片的大小(尝试 100、1000、10000)
  • 基准函数的顺序
  • 数组/切片的元素类型(尝试byteint

正确答案

比较两者的 amd64 程序集BenchmarkArrayLocalBenchmarkSliceLocal(太长,不适合这篇文章):

a数组版本多次从内存中加载地址,实际上是在每个数组访问操作中:

LEAQ    "".a+1000(SP),BX

而切片版本在从内存加载一次后仅在寄存器上计算:

LEAQ    (DX)(SI*1),BX

这不是决定性的,但可能是原因。原因是这两种方法实际上是相同的。另一个值得注意的细节是数组版本调用 into runtime.duffcopy,这是一个相当长的汇编例程,而切片版本没有。

好了,本文到此结束,带大家了解了《Array vs Slice:访问速度》,希望本文对你有所帮助!关注golang学习网公众号,给大家分享更多Golang知识!

声明:本文转载于:Golang技术栈 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>