一、是什么
Mycat是一个数据库中间件。不仅仅可以用作读写分离、以及分库分表、容灾备份、容灾备份。而且可以用于多租户应用开发、云平台基础架构等。
二、Mycat原理
Mycat原理中最重要的一个动词是“拦截” ,它拦截了用户发送过来的SQL请求。首先对SQL做了一些特定的分析:比如分片分析、路由分析、读写分离分析、缓存分析等。然后将SQL发往后端的真实数据库,并将返回的结果做适当的处理,最终再返给用户。
上图中,Orders表被分为三个分片datanode(简称dn),这三个分片是分布在两台MySQL server上的(datahost),即datanode=database@datahost方式。因此,你可以用1台到N台服务器来分片,分片规则(sharding rule)为典型的字符串枚举分片规则,1个规则的定义是分片字段(sharding column)+分片函数(rule funcation)。这里的分片字段为prov,而分片函数为字符串枚举。
三、应用场景
Mycat发展到现在,适用的场景已经很丰富了。以下是几个典型的应用场景。
1、单纯的读写分离,此时配置最为简单,支持读写分离、主从切换。
2、分库分表,对于超过1000万的表进行分片,最大支持1000亿的单表分片
3、多租户应用,每个应用1个库,但应用程序只连接Mycat,从而不改造程序本身,实现多租户化。
4、报表系统,借助于Mycat的分表能力,处理大规模报表的统计。
5、替代Hbase,分析大数据。
6、作为海量数据实时查询的一种简单有效方案,比如10亿条频繁查询的记录需要在3s内查询出来结果。
四、Mycat中的概念
1、数据库中间件
就是介于数据库和与应用之间,进行数据处理与交互的中间服务。对数据进行切片之后,从原来的一个库,被切分为多个分片数据库,所有的分片数据库集群构成了整个完整的数据库存储。
如上图所示,数据被分到多个分片数据库后,应用如果需要读取数据库,就要处理多个数据源的数据。如果没有数据库中间件,那么应用将直接面对分片集群、数据源切换、事务处理、数据集合都需要应用直接处理。
原本该是专于业务的应用,将会花大量的工作来处理分片的问题。有了数据库中间件之后,应用只需要专注于业务处理,大量的数据聚合,事务,数据源切换都由中间件来处理。中间件的性能与处理能力决定应用的读写性能,所以一款好的数据库中间件很重要。
2、逻辑库(schema)
对于实际应用来说,并不需要知道中间件的存在。业务开发人员只需要知道数据库的概念,所以数据库中间件可以被看做是1个或多个数据库集群构成的逻辑库。
在云计算时代,数据库中间件可以以多租户的形式给一个或多个应用提供服务。每个应用访问的可能是1个独立或者共享的物理库。常见的如阿里云数据库RDS。
3、逻辑表(table)
4、分片节点(dataNode)
5、节点主机(dataHost)
6、分片规则(rule)
7、全局序列号(sequence)
8、多租户