orderBy 排序优化
来源:SegmentFault
时间:2023-02-17 18:55:45 154浏览 收藏
本篇文章主要是结合我之前面试的各种经历和实战开发中遇到的问题解决经验整理的,希望这篇《orderBy 排序优化》对你有很大帮助!欢迎收藏,分享给更多的需要的朋友学习~
在日常的业务开发中,order by 排序是少不了的。但要写出高效的排序SQL,需要先花点精力和时间来了解排序的底层原理,这样才能找到优化排序的好策略。
排序的方式
index(索引排序,性能最佳)
尽可能使用索引字段来排序
filesort(文件排序)
2.1 双路排序
MySQL4.1 之前的版本,通过两次扫描磁盘,最终得到数据 先从磁盘中读取行指针和 order by 列,并对它们进行排序,然后扫描已经排好序的列表,按照列表中的值重新从列表中读出(再一次从磁盘中读),要对磁盘进行两次扫描,I\O是很耗时的。
2.2 单路排序
MySQL4.1 之后,增加的更优排序算法 从磁盘读取查询需要的所有列,按照order by列在buffer(缓冲区)对它们进行排序,然后扫描排序后的列表进行输出 它的效率要更快一些,避免了第二次读取数据(从磁盘读)并且把随机I\O变成了顺序I\O 但是它会使用过多空间,因为它把每一行都保存在内存中了
不足: 在sort_buffer中,单路算法比双路算法要多占用很多空间 因为单路算法是把所有字段都取出,所以有可能取出的数据总大小超出了 sort_buffer(MySQL会给每个线程分配一块内存用于排序) 的容量,导致每次只能取 sort_buffer 容量大小的数据,进行排序(创建tmp文件,多路合并),排完再取出 sort_buffer容量太小,再排......从而多次I\O操作 本想着省一次I\O操作,反而导致了大量的I\O操作,反而得不偿失。
使用单路排序满足的条件: 1. 查询语句所取出的字段类型大小总和要小于 max_length_for_sort_data 2. 排序字段中不包含text和blob类型
优化策略
order by时,只query需要的字段
1. 当query的字段大小总和小于max_length_for_sort_data,而且排序字段不是TEXT|BLOB类型,会使用单路排序算法,否则使用多路排序算法 2. 两种算法的数据都有可能超出sort_buffer的容量,超出之后,创建tmp文件进行合并排序,导致多次的I\O,但是使用单路排序的风险更大,所以要提高sort_buffer_size
尝试提高sort_buffer_size
不管使用哪种算法,提高这个参数都会提高效率 要根据系统的自身能力去提高,因为这个参数是针对每个进程的
尝试提高max_length_for_sort_data
提高这个参数,会增加用改进算法的概率。 但如果设置得太高,数据总容量超出sort_buffer_size的概率会增大,明显症状是高的磁盘I\O活动和低的处理器使用率
实例
数据表
*************************** *************************** Table: user Create Table: CREATE TABLE `user` ( `id` int(10) unsigned NOT NULL AUTO_INCREMENT, `name` varchar(20) NOT NULL, `age` int(10) NOT NULL DEFAULT '0', `city` varchar(20) NOT NULL, `addr` varchar(50) DEFAULT NULL, PRIMARY KEY (`id`), KEY `idx_name_age_city` (`name`,`age`,`city`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci
order by能使用索引最左前缀
* select id,name,age,city from user order by name; * select id,name,age,city from user order by name,age,city; * explain select id,name,age,city from user order by name desc,age desc,city desc;
如果where使用索引的最左前缀定义为常量,则order by 能使用索引
* select * from user where name = 'zhangsan' order by age,city; * select * from user where name = 'zhangsan' and age = 20 order by city; * select * from user where name = 'zhangsan' and age > 20 order by age,city;
不能使用索引进行排序
select * from user order by name,age,city;//query*字段 select * from user order by addr;//非索引字段排序 select * from user order by name,addr;//含有非索引字段 select * from user where age = 20 order by city;//跳过了name字段,违反最左前缀法则 select * from user where name = 'zhangsan' order by city;//跳过了age字段,违反最左前缀法则 select * from user where name = 'zhangsan' order by age,addr;//含有非索引字段
以上就是《orderBy 排序优化》的详细内容,更多关于mysql的资料请关注golang学习网公众号!
声明:本文转载于:SegmentFault 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
-
499 收藏
-
244 收藏
-
235 收藏
-
157 收藏
-
101 收藏
最新阅读
更多>
-
194 收藏
-
273 收藏
-
216 收藏
-
485 收藏
-
113 收藏
-
293 收藏
课程推荐
更多>
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 507次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习