推荐文章 Go 技术课程下载专题 AI

首页 > 数据库 > MySQL

【巨杉数据库Sequoiadb】用pg对500W数据进行group by操作，耗时过长（50秒）

来源：SegmentFault

时间：2023-01-25 10:17:33 165浏览收藏

你在学习数据库相关的知识吗？本文《【巨杉数据库Sequoiadb】用pg对500W数据进行group by操作，耗时过长（50秒）》，主要介绍的内容就涉及到MySQL，如果你想提升自己的开发能力，就不要错过这篇文章，大家要知道编程理论基础和实战操作都是不可或缺的哦！

【用户咨询】
用sequoiasql-postgresql创建一个关联表，存入500W数据。在创建索引的情况下，用pg进行简单的group by查询，平均耗时是50秒，是否可以进一步优化？
【问题描述】
1.集群部署情况
三台主机对应一个分区组，每台主机均部署有coord、cata、data节点。
2.表属性
一个500w数据的关联表b_qt_swdj和一个800w数据的pg原生表b_qt_swdj1，两个表结构相同，一共39个字段。
3.sample和语句
对关联表执行查询：
①SELECT sw_scjy_yb,count(se_scjy_yb) as count FROM b_qt_swdj group by sw_scjy_yb;
②SELECT count(1) from b_qt_swdj;
对原生表执行查询：
③SELECT sw_scjy_yb,count(se_scjy_yb) as count FROM b_qt_swdj1 group by sw_scjy_yb;
④SELECT count(1) from b_qt_swdj1;

用db内置sql执行①，耗时57秒。执行②，耗时33秒。 
用pg执行①，耗时50秒。执行②，耗时44秒。

用pg执行③，耗时8秒。执行④，耗时3秒。
4.网络带宽

传输数据时约为46MB/S。

5.有关截图见附件《截图三》

【解决办法】
SELECT sw_scjy_yb,count(se_scjy_yb) as count FROM b_qt_swdj1 group by sw_scjy_yb;在pg耗时和使用sdb内置sql耗时差不多，都是50S左右。跟pg关系不大。
从pg的访问计划（见截图三）来看，绝大部分耗时也是在select上。
建议一：应该考虑在sdb端对表做分区，提高数据抽取并发度去提高性能。
建议二：对于大表的统计推荐使用SparkSQL作为sql引擎。

以上就是《【巨杉数据库Sequoiadb】用pg对500W数据进行group by操作，耗时过长（50秒）》的详细内容，更多关于mysql的资料请关注golang学习网公众号！

mysql MySQL

声明：本文转载于：SegmentFault 如有侵犯，请联系study_golang@163.com删除

相关阅读

更多>

文章 · 常见问题 | 2星期前 | MySQL · 数据库 · 慢查询 · 索引优化 · FAQ · mysql 索引 explain 常见问题慢查询

MySQL 明明加了索引，为什么查询还是很慢？先查这 6 个点

374 收藏
Golang · Go教程 | 3年前 | MySQL · 表存储 · 获取表 · golang

golang MySQL实现对数据库表存储获取操作示例

499 收藏
Golang · Go教程 | 3年前 | MySQL · 分布式 · 读写锁 · golang

golang 基于 mysql 简单实现分布式读写锁

384 收藏
Golang · Go教程 | 3年前 | MySQL · gorm · golang

详解如何利用GORM实现MySQL事务

184 收藏
Golang · Go教程 | 3年前 | MySQL · 操作 · golang

Go语言实现操作MySQL的基础知识总结

265 收藏

最新阅读

更多>

数据库 · MySQL | 3天前 | MySQL · 慢查询 · explain · sql优化 · 索引优化 · mysql explain SQL优化隐式转换范围查询不走索引函数列

MySQL 查询为什么不走索引：函数列、隐式转换和范围条件怎么改

189 收藏
数据库 · MySQL | 4天前 | MySQL · 视图 · 后端安全 · 数据库权限 · 报表查询 · mysql 视图数据库安全 GRANT 最小权限只读账号报表查询

MySQL 报表只读账号怎么设计：用视图和最小权限隔离生产数据

412 收藏
数据库 · MySQL | 4天前 | MySQL · 慢查询 · 数据库优化 · 随机查询 · 事故复盘 · mysql 临时表慢查询 ORDER BY RAND() CPU飙升随机推荐

MySQL ORDER BY RAND() 为什么会拖垮接口：一次随机推荐慢查询复盘

378 收藏
数据库 · MySQL | 5天前 | MySQL · 读写分离 · 架构设计 · 主从复制 · 复制延迟 · 主从复制复制延迟 MySQL读写分离读己之写数据库架构

MySQL 读写分离什么时候该做：主从架构、复制延迟和回主策略

334 收藏
数据库 · MySQL | 1星期前 | MySQL · 分片 · 数据库架构 · 索引设计 · 多租户 · mysql 多租户订单表分片联合索引 tenant_id 架构演进

MySQL 多租户订单表架构演进：从 tenant_id 联合索引到租户分片

259 收藏
数据库 · MySQL | 1星期前 | MySQL · 索引 · 数据库 · 性能优化 · SQL · mysql explain 慢查询索引优化不可见索引 Invisible Index

MySQL 不可见索引怎么用：删索引前先做可逆验证

468 收藏
数据库 · MySQL | 1星期前 | MySQL · InnoDB · 性能排查 · 故障复盘 · 长事务 · mysql PURGE 长事务 Undo history list length 写入延迟

MySQL 写入突然变慢复盘：长事务拖住 purge 导致 undo 历史堆积

242 收藏
数据库 · MySQL | 1星期前 | MySQL · 触发器 · 数据库设计 · 小项目 · 审计日志 · mysql 触发器数据清理审计日志索引设计订单状态

MySQL 审计日志小项目：记录订单状态变更、查询和清理

486 收藏
数据库 · MySQL | 1星期前 | MySQL · 磁盘空间 · 故障复盘 · 临时表 · 报表优化 · mysql 临时表 Created_tmp_disk_tables 磁盘打满报表接口故障复盘

MySQL 临时表打满磁盘复盘：报表接口从超时到恢复

114 收藏
数据库 · MySQL | 1星期前 | MySQL · 数据库设计 · 消息系统 · 未读数 · 索引设计 · mysql 数据清理唯一索引站内信消息已读表未读数

MySQL 消息已读表怎么设计：从写入去重到未读数清理

243 收藏
数据库 · MySQL | 1星期前 | MySQL · 行锁 · 数据库架构 · 库存系统 · 并发优化 · mysql 库存扣减热点行行锁等待分桶库存架构演进

MySQL 热点库存行架构演进：从单行扣减到分桶库存

141 收藏
数据库 · MySQL | 2星期前 | MySQL · 数据库 · 索引优化 · SQL调优 · mysql explain 复合索引覆盖索引慢查询优化

MySQL 覆盖索引实验：从慢查询到 EXPLAIN 显示 Using index

276 收藏

课程推荐

更多>

前端进阶之JavaScript设计模式

设计模式是开发人员在软件开发过程中面临一般问题时的解决方案，代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景，打造一站式知识长龙服务，适合有JS基础的同学学习。

立即学习 543次学习
GO语言核心编程课程

本课程采用真实案例，全面具体可落地，从理论到实践，一步一步将GO核心编程技术、编程思想、底层实现融会贯通，使学习者贴近时代脉搏，做IT互联网时代的弄潮儿。

立即学习 516次学习
简单聊聊mysql8与网络通信

如有问题加微信：Le-studyg；在课程中，我们将首先介绍MySQL8的新特性，包括性能优化、安全增强、新数据类型等，帮助学生快速熟悉MySQL8的最新功能。接着，我们将深入解析MySQL的网络通信机制，包括协议、连接管理、数据传输等，让

立即学习 500次学习
JavaScript正则表达式基础与实战

在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。

立即学习 487次学习
从零制作响应式网站—Grid布局

本系列教程将展示从零制作一个假想的网络科技公司官网，分为导航，轮播，关于我们，成功案例，服务流程，团队介绍，数据部分，公司动态，底部信息等内容区块。网站整体采用CSSGrid布局，支持响应式，有流畅过渡和展现动画。

立即学习 485次学习