SQL 窗口函数
来源:SegmentFault
时间:2023-02-24 19:24:09 362浏览 收藏
本篇文章主要是结合我之前面试的各种经历和实战开发中遇到的问题解决经验整理的,希望这篇《SQL 窗口函数》对你有很大帮助!欢迎收藏,分享给更多的需要的朋友学习~
窗口函数形如:
表达式 OVER (PARTITION BY 分组字段 ORDER BY 排序字段)
有两个能力:
- 当表达式为
SELECT *, rank() over (PARTITION BY city ORDER BY people) FROM test
该 SQL 表示在 city 组内按照 people 进行排序。
其实 PARTITION BY 也是可选的,如果我们忽略它:
SELECT *, rank() over (ORDER BY people) FROM test
也是生效的,但该语句与普通 ORDER BY 等价,因此利用窗口函数进行分组排序时,一般都会使用 PARTITION BY。
各分组排序函数的差异
我们将
SELECT *, rank() over (PARTITION BY city ORDER BY people), dense_rank() over (PARTITION BY city ORDER BY people), row_number() over (PARTITION BY city ORDER BY people) FROM test
其实从结果就可以猜到,这三个函数在处理排序遇到相同值时,对排名统计逻辑有如下差异:
SELECT *, rank() over wd, dense_rank() over wd, row_number() over wd FROM test WINDOW wd as (PARTITION BY city ORDER BY people)
累计聚合
我们之前说过,凡事使用了聚合函数,都会让查询变成聚合模式。如果不用 GROUP BY,聚合后返回行数会压缩为一行,即使用了 GROUP BY,返回的行数一般也会大大减少,因为分组聚合了。
然而使用窗口函数的聚合却不会导致返回行数减少,那么这种聚合是怎么计算的呢?我们不如直接看下面的例子:
SELECT *, sum(people) over (PARTITION BY city ORDER BY people) FROM test
可以看到,在每个 city 分组内,按照 people 排序后进行了 累加(相同的值会合并在一起),这就是 BI 工具一般说的 RUNNGIN_SUM 的实现思路,当然一般我们排序规则使用绝对不会重复的日期,所以不会遇到第一个红框中合并计算的问题。
累计函数还有
avg()
min()
等等,这些都一样可以作用于窗口函数,其逻辑可以按照下图理解:你可能有疑问,直接
sum(上一行结果,下一行)
不是更方便吗?为了验证猜想,我们试试avg()
的结果:可见,如果直接利用上一行结果的缓存,那么 avg 结果必然是不准确的,所以窗口累计聚合是每行重新计算的。当然也不排除对于 sum、max、min 做额外性能优化的可能性,但 avg 只能每行重头计算。
与 GROUP BY 组合使用
窗口函数是可以与 GROUP BY 组合使用的,遵循的规则是,窗口范围对后面的查询结果生效,所以其实并不关心是否进行了 GROUP BY。我们看下面的例子:
按照地区分组后进行累加聚合,是对 GROUP BY 后的数据行粒度进行的,而不是之前的明细行。
总结
窗口函数在计算组内排序或累计 GVM 等场景非常有用,我们只要牢记两个知识点就行了:
- 分组排序要结合 PARTITION BY 才有意义。
- 累计聚合作用于查询结果行粒度,支持所有聚合函数。
讨论地址是:精读《SQL 窗口函数》· Issue #405 · ascoders/weekly
如果你想参与讨论,请 点击这里,每周都有新的主题,周末或周一发布。前端精读 - 帮你筛选靠谱的内容。
关注 前端精读微信公众号
版权声明:自由转载-非商用-非衍生-保持署名(创意共享 3.0 许可证)
本篇关于《SQL 窗口函数》的介绍就到此结束啦,但是学无止境,想要了解学习更多关于数据库的相关知识,请关注golang学习网公众号!
-
499 收藏
-
384 收藏
-
184 收藏
-
265 收藏
-
352 收藏
-
184 收藏
-
237 收藏
-
210 收藏
-
192 收藏
-
364 收藏
-
373 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 507次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习
-
- 如意的面包
- 这篇文章太及时了,细节满满,很棒,已收藏,关注博主了!希望博主能多写数据库相关的文章。
- 2023-05-22 18:26:35
-
- 难过的玉米
- 很棒,一直没懂这个问题,但其实工作中常常有遇到...不过今天到这,看完之后很有帮助,总算是懂了,感谢作者大大分享文章内容!
- 2023-04-21 22:25:33
-
- 儒雅的咖啡豆
- 这篇文章内容出现的刚刚好,细节满满,很棒,收藏了,关注楼主了!希望楼主能多写数据库相关的文章。
- 2023-03-31 17:30:38
-
- 落后的帆布鞋
- 真优秀,一直没懂这个问题,但其实工作中常常有遇到...不过今天到这,帮助很大,总算是懂了,感谢up主分享博文!
- 2023-02-28 10:55:57