Array vs Slice:访问速度
来源:Golang技术栈
时间:2023-04-11 15:56:31 205浏览 收藏
一分耕耘,一分收获!既然都打开这篇《Array vs Slice:访问速度》,就坚持看下去,学下去吧!本文主要会给大家讲到golang等等知识点,如果大家对本文有好的建议或者看到有不足之处,非常欢迎大家积极提出!在后续文章我会继续更新Golang相关的内容,希望对大家都有所帮助!
问题内容
这个问题是关于 访问数组和切片元素 的速度,而不是关于将它们作为参数传递给函数的效率。
在大多数情况下,我希望 数组 比 切片 更快,因为切片是描述数组连续部分的数据结构,因此在访问切片的元素时可能会涉及额外的步骤(间接地访问其底层数组的元素) .
所以我写了一个小测试来对一批简单的操作进行基准测试。有 4 个基准函数,前 2 个测试 全局 切片和全局数组,另外 2 个测试 局部 切片和局部数组:
var gs = make([]byte, 1000) // Global slice var ga [1000]byte // Global array func BenchmarkSliceGlobal(b *testing.B) { for i := 0; i我多次运行测试,这是典型的输出(
go test -bench .*
):BenchmarkSliceGlobal 300000 4210 ns/op BenchmarkArrayGlobal 300000 4123 ns/op BenchmarkSliceLocal 500000 3090 ns/op BenchmarkArrayLocal 500000 3768 ns/op分析结果:
访问全局切片比访问全局数组稍慢,这与我预期的一样:
4210
vs4123
ns/op但是访问本地切片比访问本地数组要快得多:
3090
vs3768
ns/op我的问题是: 这是什么原因?
笔记
我尝试改变以下内容,但没有改变结果:
- 数组/切片的大小(尝试 100、1000、10000)
- 基准函数的顺序
- 数组/切片的元素类型(尝试
byte
和int
)
正确答案
比较两者的 amd64
程序集BenchmarkArrayLocal
和BenchmarkSliceLocal
(太长,不适合这篇文章):
a
数组版本多次从内存中加载地址,实际上是在每个数组访问操作中:
LEAQ "".a+1000(SP),BX
而切片版本在从内存加载一次后仅在寄存器上计算:
LEAQ (DX)(SI*1),BX
这不是决定性的,但可能是原因。原因是这两种方法实际上是相同的。另一个值得注意的细节是数组版本调用 into
runtime.duffcopy
,这是一个相当长的汇编例程,而切片版本没有。
好了,本文到此结束,带大家了解了《Array vs Slice:访问速度》,希望本文对你有所帮助!关注golang学习网公众号,给大家分享更多Golang知识!
-
193 收藏
-
354 收藏
-
418 收藏
-
161 收藏
-
209 收藏
-
139 收藏
-
204 收藏
-
325 收藏
-
477 收藏
-
486 收藏
-
439 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 507次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习