分库分表ShardingSphere（分库分表sharding）

　　本篇文章为你整理了分库分表ShardingSphere（分库分表sharding）的详细内容，包含有分库分表sharding sphere 分库分表sharding 分库分表shardingjdbc默认分流策略分库分表sharding mybatis 分库分表ShardingSphere，希望能帮助你了解分库分表ShardingSphere。

　　连接数：连接数过多时，就会出现‘too many connections’的错误，访问量太大或者数据库设置的最大连接数太小的原因

　　
磁盘读写IO瓶颈，热点数据太多，尽管使用了数据库本身缓存，但是依旧有大量IO,导致sql执行速度慢

　　网络IO瓶颈，请求的数据太多，数据传输大，网络带宽不够，链路响应时间变长

　　CPU瓶颈，尤其在基础数据量大单机复杂SQL计算，SQL语句执行占用CPU使用率高，也有扫描行数大、锁冲突、锁等待等原因

　　可以通过 show processlist; 、show full processlist，发现 CPU 使用率比较高的SQL

　　常见的对于查询时间长，State 列值是 Sending data，Copying to tmp table，Copying to tmp table on disk，Sorting result，Using filesort 等都是可能有性能问题SQL，清楚相关影响问题的情况可以kill掉

　　也存在执行时间短，但是CPU占用率高的SQL，通过上面命令查询不到，这个时候最好通过执行计划分析explain进行分析

　　
好处: 避免IO时锁表的次数，分离热点字段和非热点字段，避免大字段IO导致性能下降

　　原则：业务经常组合查询的字段一个表；不常用字段一个表；text、blob类型字段作为附属表

　　
好处：避免表之间竞争同个物理机的资源，比如CPU/内存/硬盘/网络IO

　　原则：根据业务相关性进行划分，领域模型，微服务划分一般就是垂直分库

　　
水平分表：同个数据库内，把一个表的数据按照一定规则拆分到多个表中，对数据进行拆分，不影响表结构

　　单个表的数据量少了，业务SQL执行效率高，降低了系统的IO和CPU压力

　　选择合适的分片键和分片策略，和业务场景配合

　　避免数据热点和访问不均衡、避免二次扩容难度大

　　
拆分原则一般是表中的字段较多，将不常用的或者数据较大，长度较长的拆分到“扩展表如text类型字段

　　
访问频次低、字段大的商品描述信息单独存放在一张表中，访问频次较高的商品基本信息单独放在一张表中

　　
垂直分库针对的是一个系统中的不同业务进行拆分，数据库的连接资源比较宝贵且单机处理能力也有限

　　没拆分之前全部都是落到单一的库上的，单库处理能力成为瓶颈，还有磁盘空间，内存，tps等限制

　　拆分之后，避免不同库竞争同一个物理机的CPU、内存、网络IO、磁盘，所以在高并发场景下，垂直分库一定程度上能够突破IO、连接数及单机硬件资源的瓶颈

　　垂直分库可以更好解决业务层面的耦合，业务清晰，且方便管理和维护

　　一般从单体项目升级改造为微服务项目，就是垂直分库

　　2.3水平分表

　　
核心是把一个大表，分割N个小表，每个表的结构是一样的，数据不一样，全部表的数据合起来就是全部数据

　　
针对数据量巨大的单张表（比如订单表），按照某种规则（RANGE,HASH取模等），切分到多张表里面去

　　
但是这些表还是在同一个库中，所以单数据库操作还是有IO瓶颈，主要是解决单表数据量过大的问题

　　
减少锁表时间，没分表前，如果是DDL(create/alter/add等)语句，当需要添加一列的时候mysql会锁表，期间所有的读写操作只能等待

　　
把同个表的数据按照一定规则分到不同的数据库中，数据库在不同的服务器上

　　水平分库是把不同表拆到不同数据库中，它是对数据行的拆分，不影响表结构

　　每个库的结构都一样,但每个库的数据都不一样，没有交集，所有库的并集就是全量数据

　　水平分库的粒度，比水平分表更大

　　三、水平分库分表常见策略

　　3.1 Range

　　
大部分读和写都访会问新的数据，有IO瓶颈，整体资源利用率低

　　数据倾斜严重，热点数据过于集中，部分节点有瓶颈

　　
用户ID是整数型的，要分2库，每个库表数量4表，一共8张表

　　用户ID取模后，值是0到7的要平均分配到每张表

　　
支持任意实现 JDBC 规范的数据库，目前支持 MySQL，PostgreSQL，Oracle，SQLServer 以及任何可使用 JDBC 访问的数据库

　　
采用无中心化架构，与应用程序共享资源，适用于 Java 开发的高性能的轻量级 OLTP 应用

　　4.1常见概念术语讲解

　　数据节点Node

　　数据分片的最小单元，由数据源名称和数据表组成

　　比如：ds_0.product_order_0

　　
在分片的数据库中真实存在的物理表

　　比如订单表 product_order_0、product_order_1、product_order_2

　　
水平拆分的数据库（表）的相同逻辑和数据结构表的总称

　　比如订单表 product_order_0、product_order_1、product_order_2，逻辑表就是product_order

　　
指分片规则一致的主表和子表

　　比如product_order表和product_order_item表，均按照order_id分片，则此两张表互为绑定表关系

　　绑定表之间的多表关联查询不会出现笛卡尔积关联，关联查询效率将大大提升

　　
指所有的分片数据源中都存在的表，表结构和表中的数据在每个数据库中均完全一致

　　适用于数据量不大且需要与海量数据的表进行关联查询的场景

　　例如：字典表、配置表

　　
用于分片的数据库字段，是将数据库(表)水平拆分的关键字段

　　比如prouduct_order订单表，根据订单号 out_trade_no做哈希取模，则out_trade_no是分片键

　　除了对单分片字段的支持，ShardingSphere也支持根据多个字段进行分片

prouduct_order_$- {user_id % 8}` 表示订单表根据user_id模8，而分成8张表，表名称为`prouduct_order_0`到`prouduct_order_7

　　
只支持【单分片键】，提供PreciseShardingAlgorithm和RangeShardingAlgorithm两个分片算法

　　PreciseShardingAlgorithm 精准分片是必选的，用于处理=和IN的分片

　　RangeShardingAlgorithm 范围分配是可选的，用于处理BETWEEN AND分片

　　如果不配置RangeShardingAlgorithm，如果SQL中用了BETWEEN AND语法，则将按照全库路由处理，性能下降

　　
支持【多分片键】，多分片键之间的关系复杂，由开发者自己实现，提供最大的灵活度

　　提供对SQL语句中的=, IN和BETWEEN AND的分片操作支持

　　
这种分片策略无需配置分片健，分片健值也不再从 SQL中解析，外部手动指定分片健或分片库，让 SQL在指定的分库、分表中执行

　　
Hint策略会绕过SQL解析的，对于这些比较复杂的需要分片的查询，Hint分片策略性能可能会更好

　　
4.3执行流程原理

　　执行过程为：SQL解析 - SQL优化 - SQL路由 - SQL改写 - SQL执行 - 结果归并 - 返回结果

　　以上就是分库分表ShardingSphere（分库分表sharding）的详细内容，想要了解更多分库分表ShardingSphere的内容，请持续关注盛行IT软件开发工作室。

郑重声明：本文由网友发布，不代表盛行IT的观点，版权归原作者所有，仅为传播更多信息之目的，如有侵权请联系，我们将第一时间修改或删除，多谢。

相关文章阅读