本篇文章为你整理了咱们500万条数据测试一下,如何合理使用索引加速?(添加索引一定能加速性能)的详细内容,包含有索引不可以加速 添加索引一定能加速性能 索引可以加快查询速度吗 索引能加快数据的什么速度 咱们500万条数据测试一下,如何合理使用索引加速?,希望能帮助你了解 咱们500万条数据测试一下,如何合理使用索引加速?。
索引是数据库优化最常用也是最重要的手段之一, 通过索引通常可以帮助用户解决大多数的MySQL的性能优化问题。
5.1 验证索引提升查询效率
在我们准备的表结构product_list 中, 一共存储了 500多万记录;
mysql select count(1) from product_list;
+----------+
count(1)
+----------+
5072825
+----------+
1 row in set (1.71 sec)
mysql
1) 根据ID查询
SELECT * FROM product_list WHERE id = 121926;
查询速度很快, 接近0s , 主要的原因是因为id为主键, 有索引;
2). 根据store_name进行精确查询
执行用时4分钟
SELECT * FROM product_list WHERE store_name = 联想北达兴科专卖店;
查看SQL语句的执行计划 :
explain SELECT * FROM product_list WHERE store_name = 联想北达兴科专卖店;
处理方案 , 针对store_name字段, 创建索引 :
create index product_list_stname on product_list(store_name);
索引创建完成之后,再次进行查询 :
SELECT * FROM product_list WHERE store_name = 联想北达兴科专卖店;
通过explain , 查看执行计划,执行SQL时使用了刚才创建的索引
-- 查看SQL语句的执行计划
explain SELECT * FROM product_list WHERE store_name = 联想北达兴科专卖店;
5.2 索引的使用
5.2.1 准备环境
create table `tb_seller` (
`sellerid` varchar (100),
`name` varchar (100) not null,
`nickname` varchar (50),
`password` varchar (60),
`status` varchar (1) not null,
`address` varchar (100) not null,
`createtime` datetime,
primary key(`sellerid`)
)engine=innodb default charset=utf8;
insert into `tb_seller` (`sellerid`, `name`, `nickname`, `password`, `status`, `address`, `createtime`) values(alibaba,阿里巴巴,阿里小店,e10adc3949ba59abbe56e057f20f883e,1,北京市,2088-01-01 12:00:00);
insert into `tb_seller` (`sellerid`, `name`, `nickname`, `password`, `status`, `address`, `createtime`) values(baidu,百度科技有限公司,百度小店,e10adc3949ba59abbe56e057f20f883e,1,北京市,2088-01-01 12:00:00);
insert into `tb_seller` (`sellerid`, `name`, `nickname`, `password`, `status`, `address`, `createtime`) values(huawei,华为科技有限公司,华为小店,e10adc3949ba59abbe56e057f20f883e,0,北京市,2088-01-01 12:00:00);
insert into `tb_seller` (`sellerid`, `name`, `nickname`, `password`, `status`, `address`, `createtime`) values(itcast,传智播客教育科技有限公司,传智播客,e10adc3949ba59abbe56e057f20f883e,1,北京市,2088-01-01 12:00:00);
insert into `tb_seller` (`sellerid`, `name`, `nickname`, `password`, `status`, `address`, `createtime`) values(itheima,黑马程序员,黑马程序员,e10adc3949ba59abbe56e057f20f883e,0,北京市,2088-01-01 12:00:00);
insert into `tb_seller` (`sellerid`, `name`, `nickname`, `password`, `status`, `address`, `createtime`) values(luoji,罗技科技有限公司,罗技小店,e10adc3949ba59abbe56e057f20f883e,1,北京市,2088-01-01 12:00:00);
insert into `tb_seller` (`sellerid`, `name`, `nickname`, `password`, `status`, `address`, `createtime`) values(oppo,OPPO科技有限公司,OPPO官方旗舰店,e10adc3949ba59abbe56e057f20f883e,0,北京市,2088-01-01 12:00:00);
insert into `tb_seller` (`sellerid`, `name`, `nickname`, `password`, `status`, `address`, `createtime`) values(ourpalm,掌趣科技股份有限公司,掌趣小店,e10adc3949ba59abbe56e057f20f883e,1,北京市,2088-01-01 12:00:00);
insert into `tb_seller` (`sellerid`, `name`, `nickname`, `password`, `status`, `address`, `createtime`) values(qiandu,千度科技,千度小店,e10adc3949ba59abbe56e057f20f883e,2,北京市,2088-01-01 12:00:00);
insert into `tb_seller` (`sellerid`, `name`, `nickname`, `password`, `status`, `address`, `createtime`) values(sina,新浪科技有限公司,新浪官方旗舰店,e10adc3949ba59abbe56e057f20f883e,1,北京市,2088-01-01 12:00:00);
insert into `tb_seller` (`sellerid`, `name`, `nickname`, `password`, `status`, `address`, `createtime`) values(xiaomi,小米科技,小米官方旗舰店,e10adc3949ba59abbe56e057f20f883e,1,西安市,2088-01-01 12:00:00);
insert into `tb_seller` (`sellerid`, `name`, `nickname`, `password`, `status`, `address`, `createtime`) values(yijia,宜家家居,宜家家居旗舰店,e10adc3949ba59abbe56e057f20f883e,1,北京市,2088-01-01 12:00:00);
-- 全值匹配
explain select * from tb_seller where name=小米科技 and status=1 and address=北京市;
ken_len = 3 * N + 2;
-- name varchar(100) ==302
-- status varchar(1) ==5
-- address varchar(100) ==302
2) 最左前缀法则
如果索引了多列,要遵守最左前缀法则。指的是查询从索引的最左前列开始,并且不跳过索引中的列。
匹配最左前缀法则,走索引:
explain select * from tb_seller where name=小米科技;
违反最左前缀法则 , 索引失效:
explain select * from tb_seller where status=1;
explain select * from tb_seller where status=1 and address=北京市;
如果符合最左法则,但是出现跳跃某一列,只有最左列索引生效:
explain select * from tb_seller where name=小米科技 and address=北京市;
3) 范围查询右边的列
-- 使用范围查询的情况,右边的列失效
explain select * from tb_seller where name=小米科技 and status=1 and address=北京市;
explain select * from tb_seller where name=小米科技 and status 1 and address=北京市;
根据前面的两个字段name , status 查询是走索引的, 但是最后一个条件address 没有用到索引。
4) 禁止列运算
-- 不要在索引列上进行运算操作, 索引将失效。
explain select * from tb_seller where substring(name,3,2) =科技;
5) 字符串不加单引号
造成索引失效。
-- 字符串不加单引号,造成索引失效。
explain select * from tb_seller where name=科技 and status=0;
explain select * from tb_seller where name=科技 and status=0;
由于,在查询时,没有对字符串加单引号,MySQL的查询优化器,会自动的进行类型转换,造成索引失效。
6) 尽量使用覆盖索引
避免select *
尽量使用覆盖索引(只访问索引的查询(索引列完全包含查询列)),减少select * 。
-- 尽量使用覆盖索引
explain select * from tb_seller where name=科技 and status=0 and address=西安市;
explain select name from tb_seller where name=科技 and status=0 and address=西安市;
explain select name ,status from tb_seller where name=科技 and status=0 and address=西安市;
explain select name ,status,address from tb_seller where name=科技 and status=0 and address=西安市;
如果查询列,超出索引列,也会降低性能。
explain select status,address ,password from tb_seller where name=科技 and status=0 and address=西安市;
TIP :
using index :使用覆盖索引的时候就会出现
using where:在查找使用索引的情况下,需要回表去查询所需的数据
using index condition:查找使用了索引,但是需要回表查询数据
using index ; using where:查找使用了索引,但是需要的数据都在索引列中能找到,所以不需要回表查询数据
7) 合理使用or条件
用or分割开的条件, 如果or前的条件中的列有索引,而后面的列中没有索引,那么涉及的索引都不会被用到。
示例,name字段是索引列 , 而createtime不是索引列,中间是or进行连接是不走索引的 :
explain select * from tb_seller where name=黑马程序员 or createtime = 2088-01-01 12:00:00;
8) 合理使用like查询
以%开头的Like模糊查询,索引失效。
-- 如果仅仅是尾部模糊匹配,索引不会失效。如果是头部模糊匹配,索引失效。
explain select * from tb_seller where name like 黑马程序员%;
explain select * from tb_seller where name like %黑马程序;
explain select * from tb_seller where name like %黑马程序员%;
解决方案 : 通过覆盖索引来解决
explain select sellerid from tb_seller where name like %科技%;
explain select sellerid,name from tb_seller where name like %科技%;
explain select sellerid,name,status,address from tb_seller where name like %科技%;
9) 合理评估索引执行
如果MySQL评估使用索引比全表更慢,则不使用索引。
-- 如果MySQL评估使用索引比全表更慢,则不使用索引。
create index idx_seller_addr on tb_seller(address);
explain select * from tb_seller where address=北京市;
explain select * from tb_seller where address=西安市;
10) is NULL和 is NOT NULL
有时索引失效。
-- is NULL和 is NOT NULL
explain select * from tb_seller where name is null;
explain select * from tb_seller where name is not null;
解决方案:把null值设置一个默认值
11) in和not in
in 走索引, not in 索引失效。
-- in 走索引, not in 索引失效。
explain select * from tb_seller where sellerid in(oppo,xiaomi,sina);
explain select * from tb_seller where sellerid not in (oppo,xiaomi,sina);
12) 单列索引和复合索引
尽量使用复合索引,而少使用单列索引 。
创建复合索引
create index idx_name_sta_address on tb_seller(name, status, address);
就相当于创建了三个索引 :
name
name + status
name + status + address
创建单列索引
create index idx_seller_name on tb_seller(name);
create index idx_seller_status on tb_seller(status);
create index idx_seller_address on tb_seller(address);
数据库会选择一个最优的索引(辨识度最高索引)来使用,并不会使用全部索引 。
5.3 查看索引使用情况
show status like Handler_read%;
show global status like Handler_read%;
mysql show status like Handler_read%;
+-----------------------+---------+
Variable_name Value
+-----------------------+---------+
Handler_read_first 18
Handler_read_key 19
Handler_read_last 0
Handler_read_next 5072825
Handler_read_prev 0
Handler_read_rnd 0
Handler_read_rnd_next 269
+-----------------------+---------+
7 rows in set (0.02 sec)
mysql
Handler_read_first:索引中第一条被读的次数。如果较高,表示服务器正执行大量全索引扫描(这个值越低越好)。
Handler_read_key:如果索引正在工作,这个值代表一个行被索引值读的次数,如果值越低,表示索引得到的性能改善不高,因为索引不经常使用(这个值越高越好)。
Handler_read_next :按照键顺序读下一行的请求数。如果你用范围约束或如果执行索引扫描来查询索引列,该值增加。
Handler_read_prev:按照键顺序读前一行的请求数。该读方法主要用于优化ORDER BY ... DESC。
Handler_read_rnd :根据固定位置读一行的请求数。如果你正执行大量查询并需要对结果进行排序该值较高。你可能使用了大量需要MySQL扫描整个表的查询或你的连接没有正确使用键。这个值较高,意味着运行效率低,应该建立索引来补救。
Handler_read_rnd_next:在数据文件中读下一行的请求数。如果你正进行大量的表扫描,该值较高。通常说明你的表索引不正确或写入的查询没有利用索引。
本文由传智教育博学谷 - 狂野架构师教研团队发布
如果本文对您有帮助,欢迎关注和点赞;如果您有任何建议也可留言评论或私信,您的支持是我坚持创作的动力
转载请注明出处!
以上就是咱们500万条数据测试一下,如何合理使用索引加速?(添加索引一定能加速性能)的详细内容,想要了解更多 咱们500万条数据测试一下,如何合理使用索引加速?的内容,请持续关注盛行IT软件开发工作室。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。