登录
首页 >  数据库 >  MySQL

Macat数据库中间件入门

来源:SegmentFault

时间:2023-01-16 20:16:50 390浏览 收藏

本篇文章主要是结合我之前面试的各种经历和实战开发中遇到的问题解决经验整理的,希望这篇《Macat数据库中间件入门》对你有很大帮助!欢迎收藏,分享给更多的需要的朋友学习~

一.什么是数据切分

指通过某种特定的条件,将我们存放在同一个数据库中的数据分散存
放到多个数据库(主机)上面,以达到分散单台设备负载的效果。

数据切分一般分为两种:垂直切分水平切分


二.垂直切分

按照应用程序功能模块来分多个数据库,就是垂直拆分。

image.png

优点
◆ 数据库的拆分简单明了,拆分规则明确;

◆ 应用程序模块清晰明确,较为简单,整合容易;

◆ 数据维护方便,容易定位


缺点
◆ 部分表关联无法在数据库级别完成,需要在程序中完成,存在跨库join的问题。对于这类的表,就需要去做取舍,是数据库让步业务,共用一个数据源,还是分成多个库,业务之间通过接口来做调用处理;初期数据量比较少,或者资源有限的情况下,会选择共用数据源,但是当数据发展到了一定的规模,负载很大的情况,就需要必须去做分割。

◆ 对于访问极其频繁且数据量超大的表仍然存在性能瓶颈,不一定能满足要求;

◆ 事务处理相对更为复杂;

◆ 切分达到一定程度之后,扩展性会遇到限制;

◆ 过多切分可能会带来系统过度复杂而维护困难。


三.水平拆分

为了解决垂直拆分带来的问题,(一般来说是基于解决超大表性能瓶颈问题,查询很慢,读写分离模式只有一台主机,若遇到高并发插入,一台主机承受不住压力),引入了水平拆分。

水平拆分不是将表做分类,而是按照某个字段的某种规则来分散到多个库之中,每个表中包含一部分数据。简单来说,数据的水平切分理解为是按照数据记录行来切分,将表中的某些行切分到一个数据库,而另外的某些行又切分到其他的数据库中,也就是俗称分库分表。

image.png

水平切分的优点

◆ 表关联基本能够在数据库端全部完成;----不需要通过应用程序来关联表查询合并

◆ 不会存在某些超大型数据量和高负载的表遇到瓶颈的问题;----分多库多表则不管是查询还是插入都不存在性能瓶颈问题

◆ 事务处理相对简单;

◆ 应用程序端整体架构改动相对较少;----对程序基本透明


水平切分的缺点

◆ 切分规则相对更为复杂,很难抽象出一个能够满足整个数据库的切分规则;

◆ 后期数据的维护难度有所增加,人为手工定位数据更困难;

◆ 应用系统各模块耦合度较高,可能会对后面数据的迁移拆分造成一定的困难。

◆ 跨节点合并排序分页问题

◆ 多数据源管理问题


四.Mycat简介

Mycat是一个数据库代理,MySQL、SQL Server、Oracle、DB2、PostgreSQL等主流数据库,也支持MongoDB这种新型NoSQL方式的存储

Mycat并不存储数据,只做数据路由,我们也可以简单认为Mycat就是数据库中间件。

image.png

它拦截了用户发送过来的SQL语句,首先对SQL语句做了一些特定的分析:如分片分析、路由分析、读写分离分析、缓存分析等,然后将此SQL发往后端的真实数据库,并将返回的结果做适当的处理,最终再返回给用户。


五.Mycat重要概念

逻辑库(schema):存在在mycat里面的虚拟库

逻辑表(table):存在在mycat里面的虚拟表

分片表:分片表,是指那些原有的很大数据的表,需要切分到多个数据库的表,这样,每个分片都有一部分数据,所有分片构成了完整的数据

非分片表:不需要进行数据切分的表

ER表:子表的记录与所关联的父表记录存放在同一个数据分片上,即子表依赖于父表,通过表分组(Table Group)保证数据Join不会跨库操作。

表分组(Table Group):是解决跨分片数据join的一种很好的思路,也是数据切分规划的重要一条规则

全局表:例如字典表,每一个数据分片节点上有保存了一份字典表数据
数据冗余是解决跨分片数据join的一种很好的思路,也是数据切分规划的另外一条重要规则

分片节点(dataNode):数据切分后,一个大表被分到不同的分片数据库上面,每个表分片所在的数据库就是分片节点

节点主机(dataHost):数据切分后,每个分片节点(dataNode)不一定都会独占一台机器,同一机器上面可以有多个分片数据库,这样一个或多个分片节点(dataNode)所在的机器就是节点主机(dataHost),为了规避单节点主机并发数限制,尽量将读写压力高的分片节点(dataNode)均衡的放在不同的节点主机(dataHost)

分片规则(rule):前面讲了数据切分,一个大表被分成若干个分片表,就需要一定的规则,这样按照某种业务规则把数据分到某个分片的规则就是分片规则,数据切分选择合适的分片规则非常重要,将极大的避免后续数据处理的难度。

全局序列号(sequence):数据切分后,原有的关系数据库中的主键约束在分布式条件下将无法使用,因此需要引入外部机制保证数据唯一性标识,这种保证全局性的数据唯一标识的机制就是全局序列号(sequence)。

上述基本概念后续再看案例介绍

以上就是本文的全部内容了,是否有顺利帮助你解决问题?若是能给你带来学习上的帮助,请大家多多支持golang学习网!更多关于数据库的相关知识,也可关注golang学习网公众号。

声明:本文转载于:SegmentFault 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>
评论列表