BigTable:一个复杂查询还是数个简单查询?
来源:stackoverflow
时间:2024-03-20 11:42:36 120浏览 收藏
在 Bigtable 中存储时间范围事件时,选择单个复杂查询还是多个简单查询对于性能至关重要。复杂查询效率更高,但并行执行多个简单查询在用户请求操作较少时可能带来更好的延迟。权衡两种方法的关键在于每个请求中操作的数量,对于大量操作,扫描可以提高吞吐量效率。折衷方案包括将扫描分成并行运行的分片,以在延迟和吞吐量之间取得平衡。
我将一系列 event
s 存储在 bigtable 中,格式为:
rowkey | col_1 | col_2 ----------------------|-------|------ uuid1!uuid2!timestamp | val1 | val2 ....
col_1
保存一个 float64
,col_2
保存一个 63 个字符长的字符串。
这一系列 event
中的特定范围被分组并与我们称为 operation
的对象松散关联:
{ "id": 123, "startDate": "2019-07-15T14:02:12.335+02:00", "endDate": "2019-07-15T14:02:16.335+02:00" }
所以你可能会说,操作
是event
s的时间窗口,并且可能与10-1000个event
s相关联。
当我想要向用户显示此数据时,我首先查询 operation
对象,然后对每个 operation
执行 bigtable 查询以查找它覆盖的 event
。
通过监控,我发现每个 bigtable(请注意,一个开发实例)查询可能需要 20 毫秒到 300 毫秒。
这让我想知道,考虑到 bigtable 的架构 - 执行小型的单独查询是否有意义?
执行一个涵盖我的 operation
s 范围的大型查询,然后将事件划分到我的应用程序中各自的 operation
s 是否更有意义?
解决方案
很可能是的,但细节很重要。
如果每个用户请求只有几个操作,那么并行发出小查询实际上可能会更好。这将为您带来每个请求的最佳延迟,但代价是集群会产生一些每个请求的 CPU 开销。您的应用程序代码也会更加复杂。
如果每个用户请求有大量操作,您肯定会希望通过扫描获得更高的吞吐量效率。
对于高级用例,您还可以在两者之间进行折衷,并将扫描分成并行运行的 N 个分片,其中 N << #operations。
您绝对不应该做的一件事是一次发送一个小请求,因为您只会产生一堆不必要的往返!
本篇关于《BigTable:一个复杂查询还是数个简单查询?》的介绍就到此结束啦,但是学无止境,想要了解学习更多关于Golang的相关知识,请关注golang学习网公众号!
-
502 收藏
-
502 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
139 收藏
-
204 收藏
-
325 收藏
-
477 收藏
-
486 收藏
-
439 收藏
-
357 收藏
-
352 收藏
-
101 收藏
-
440 收藏
-
212 收藏
-
143 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习