MySql基础知识总结（SQL优化篇）

本篇是MySQL知识体系总结系列的第二篇，该篇的主要内容是通过explain逐步分析sql，并通过修改sql语句与建立索引的方式对sql语句进行调优，也可以通过查看日志的方式，了解sql的执行情况，还介绍了MySQL数据库的行锁和表锁。

一、explain返回列简介

1、type常用关键字

system > const > eq_ref > ref > range > index > all。

system：表仅有一行，基本用不到；

const：表最多一行数据配合，主键查询时触发较多；

eq_ref：对于每个来自于前面的表的行组合，从该表中读取一行。这可能是最好的联接类型，除了const类型；

ref：对于每个来自于前面的表的行组合，所有有匹配索引值的行将从这张表中读取；

range：只检索给定范围的行，使用一个索引来选择行。当使用=、<>、>、>=、<、<=、IS NULL、<=>、BETWEEN或者IN操作符，用常量比较关键字列时，可以使用range；

index：该联接类型与ALL相同，除了只有索引树被扫描。这通常比ALL快，因为索引文件通常比数据文件小；

all：全表扫描；

实际sql优化中，最后达到ref或range级别。

2、Extra常用关键字

Using index：只从索引树中获取信息，而不需要回表查询；

Using where：WHERE子句用于限制哪一个行匹配下一个表或发送到客户。除非你专门从表中索取或检查所有行，如果Extra值不为Using where并且表联接类型为ALL或index，查询可能会有一些错误。需要回表查询。

Using temporary：mysql常建一个临时表来容纳结果，典型情况如查询包含可以按不同情况列出列的GROUP BY和ORDER BY子句时；

索引原理及explain用法请参照前一篇：MySQL索引原理，explain详解

二、触发索引代码实例

1、建表语句 + 联合索引

CREATE TABLE `student` (

`id` int(10) NOT NULL,

`name` varchar(20) NOT NULL,

`age` int(10) NOT NULL,

`sex` int(11) DEFAULT NULL,

`address` varchar(100) DEFAULT NULL,

`phone` varchar(100) DEFAULT NULL,

`create_time` timestamp NULL DEFAULT NULL,

`update_time` timestamp NULL DEFAULT NULL,

`deleted` int(11) DEFAULT NULL,

PRIMARY KEY (`id`),

KEY `student_union_index` (`name`,`age`,`sex`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

2、使用主键查询

3、使用联合索引查询

4、联合索引，但与索引顺序不一致

备注：因为mysql优化器的缘故，与索引顺序不一致，也会触发索引，但实际项目中尽量顺序一致。

5、联合索引，但其中一个条件是 >

6、联合索引，order by

where和order by一起使用时，不要跨索引列使用。

三、单表sql优化

1、删除student表中的联合索引。

2、添加索引

alter table student add index student_union_index(name,age,sex);

优化一点，但效果不是很好，因为type是index类型，extra中依然存在using where。

3、更改索引顺序

因为sql的编写过程

select distinct … from … join … on … where … group by … having … order by … limit …

解析过程

from … on … join … where … group by … having … select distinct … order by … limit …

因此我怀疑是联合索引建的顺序问题，导致触发索引的效果不好。are you sure？试一下就知道了。

alter table student add index student_union_index2(age,sex,name);

删除旧的不用的索引：

drop index student_union_index on student

索引改名

ALTER TABLE student RENAME INDEX student_union_index2 TO student_union_index

更改索引顺序之后，发现type级别发生了变化，由index变为了range。

range：只检索给定范围的行，使用一个索引来选择行。

备注：in会导致索引失效，所以触发using where，进而导致回表查询。

4、去掉in

ref：对于每个来自于前面的表的行组合，所有有匹配索引值的行将从这张表中读取；

index 提升为ref了，优化到此结束。

5、小结

保持索引的定义和使用顺序一致性；

索引需要逐步优化，不要总想着一口吃成胖子；

将含in的范围查询，放到where条件的最后，防止索引失效；

四、双表sql优化

1、建表语句

CREATE TABLE `student` (

`id` int(10) NOT NULL,

`name` varchar(20) NOT NULL,

`age` int(10) NOT NULL,

`sex` int(11) DEFAULT NULL,

`address` varchar(100) DEFAULT NULL,

`phone` varchar(100) DEFAULT NULL,

`create_time` timestamp NULL DEFAULT NULL,

`update_time` timestamp NULL DEFAULT NULL,

`deleted` int(11) DEFAULT NULL,

`teacher_id` int(11) DEFAULT NULL,

PRIMARY KEY (`id`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

CREATE TABLE `teacher` (

`id` int(11) DEFAULT NULL,

`name` varchar(100) DEFAULT NULL,

`course` varchar(100) DEFAULT NULL

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

2、左连接查询

explain select s.name,t.name from student s left join teacher t on s.teacher_id = t.id where t.course = '数学'

上一篇介绍过，联合查询时，小表驱动大表。小表也称为驱动表。其实就相当于双重for循环，小表就是外循环，第二张表（大表）就是内循环。

虽然最终的循环结果都是一样的，都是循环一样的次数，但是对于双重循环来说，一般建议将数据量小的循环放外层，数据量大的放内层，这是编程语言的优化原则。

再次代码测试：

student数据：四条

teacher数据：三条

按照理论分析，teacher应该为驱动表。

sql语句应该改为：

explain select teacher.name,student.name from teacher left join student on teacher.id = student.id where teacher.course = '数学'

优化一般是需要索引的，那么此时，索引应该怎么加呢？往哪个表上加索引？

索引的基本理念是：索引要建在经常使用的字段上。

由on teacher.id = student.id可知，teacher表的id字段使用较为频繁。

left join on，一般给左表加索引；因为是驱动表嘛。

alter table teacher add index teacher_index(id);
alter table teacher add index teacher_course(course);

备注：如果extra中出现using join buffer，表明mysql底层觉得sql写的太差了，mysql加了个缓存，进行优化了。

3、小结

小表驱动大表

索引建立在经常查询的字段上

sql优化，是一种概率层面的优化，是否实际使用了我们的优化，需要通过explain推测。

五、避免索引失效的一些原则

1、复合索引，不要跨列或无序使用（最佳左前缀）；

2、符合索引，尽量使用全索引匹配；

3、不要在索引上进行任何操作，例如对索引进行（计算、函数、类型转换），索引失效；

4、复合索引不能使用不等于（!=或<>）或 is null（is not null），否则索引失效；

5、尽量使用覆盖索引（using index）；

6、like尽量以常量开头，不要以%开头，否则索引失效；如果必须使用%name%进行查询，可以使用覆盖索引挽救，不用回表查询时可以触发索引；

7、尽量不要使用类型转换，否则索引失效；

8、尽量不要使用or，否则索引失效；

六、一些其他的优化方法

1、exist和in

select name,age from student exist/in (子查询);

如果主查询的数据集大，则使用in；

如果子查询的数据集大，则使用exist；

2、order by 优化

using filesort有两种算法：双路排序、双路排序（根据IO的次数）

MySQL4.1之前，默认使用双路排序；双路：扫描两次磁盘（①从磁盘读取排序字段，对排序字段进行排序；②获取其它字段）。

MySQL4.1之后，默认使用单路排序；单路：只读取一次（全部字段），在buffer中进行排序。但单路排序会有一定的隐患（不一定真的是只有一次IO，有可能多次IO）。

注意：单路排序会比双路排序占用更多的buffer。

单路排序时，如果数据量较大，可以调大buffer的容量大小。

set max_length_for_sort_data = 1024;单位是字节byte。

如果max_length_for_sort_data值太低，MySQL底层会自动将单路切换到双路。

太低指的是列的总大小超过了max_length_for_sort_data定义的字节数。

提高order by查询的策略：

选择使用单路或双路，调整buffer的容量大小；

避免select * from student;（① MySQL底层需要对*进行翻译，消耗性能；② *永远不会触发索引覆盖 using index）；

符合索引不要跨列使用，避免using filesort；

保证全部的排序字段，排序的一致性（都是升序或降序）；

七、sql顺序 -> 慢日志查询

慢查询日志就是MySQL提供的一种日志记录，用于记录MySQL响应时间超过阈值的SQL语句（long_query_time，默认10秒）；

慢日志默认是关闭的，开发调优时打开，最终部署时关闭。

1、慢查询日志

（1）检查是否开启了慢查询日志：

show variables like '%slow_query_log%'

（2）临时开启：

set global slow_query_log = 1;

（3）重启MySQL：

service mysql restart;

（4）永久开启：

/etc/my.cnf中追加配置：

放到[mysqld]下：

slow_query_log=1

slow_query_log_file=/var/lib/mysql/localhost-slow.log

2、阈值

（1）查看默认阈值：

show variables like '%long_query_time%'

（2）临时修改默认阈值：

set global long_query_time = 5;

（3）永久修改默认阈值：

/etc/my.cnf中追加配置：

放到[mysqld]下：

long_query_time = 5;

（4）MySQL中的sleep：

select sleep(5);

（5）查看执行时间超过阈值的sql：

show global status like '%slow_queries%';

八、慢查询日志 –> mysqldumpslow工具

1、mysqldumpslow工具

慢查询的sql被记录在日志中，可以通过日志查看具体的慢sql。

cat /var/lib/mysql/localhost-slow.log

通过mysqldumpslow工具查看慢sql，可以通过一些过滤条件，快速查出需要定位的慢sql。

mysqldumpslow –help

参数简要介绍：

s：排序方式

r：逆序

l：锁定时间

g：正则匹配模式

2、查询不同条件下的慢sql

（1）返回记录最多的3个SQL

mysqldumpslow -s r -t 3 /var/lib/mysql/localhost-slow.log

（2）获取访问次数最多的3个SQL

mysqldumpslow -s c -t 3 /var/lib/mysql/localhost-slow.log

（3）按时间排序，前10条包含left join查询语句的SQL

mysqldumpslow -s t -t 10 -g "left join" /var/lib/mysql/localhost-slow.log

九、分析海量数据

1、show profiles

打开此功能：set profiling = on;

show profiles会记录所有profileing打来之后，全部SQL查询语句所花费的时间。

缺点是不够精确，确定不了是执行哪部分所消耗的时间，比如CPU、IO。

2、精确分析，sql诊断

show profile all for query 上一步查询到的query_id。

3、全局查询日志

show variables like '%general_log%'

开启全局日志：

set global general_log = 1;

set global log_output = table;

十、锁机制详解

1、操作分类

读写：对同一个数据，多个读操作可以同时进行，互不干扰。

写锁：如果当前写操作没有完毕，则无法进行其它的读写操作。

2、操作范围

表锁：一次性对一张表整体加锁。

如MyISAM存储引擎使用表锁，开销小、加锁快、无死锁；但锁的范围大，容易发生冲突、并发度低。

行锁：一次性对一条数据加锁。

如InnoDB存储引擎使用的就是行锁，开销大、加锁慢、容易出现死锁；锁的范围较小，不易发生锁冲突，并发度高（很小概率发生高并发问题：脏读、幻读、不可重复读）

lock table 表1 read/write，表2 read/write，…

查看加锁的表：

show open tables;

3、加读锁，代码实例

会话0：

lock table student read;

select * from student; –查，可以

delete from student where id = 1;–增删改，不可以

select * from user; –查，不可以

delete from user where id = 1;–增删改，不可以

如果某一个会话对A表加了read锁，则该会话可以对A表进行读操作、不能进行写操作。即如果给A表加了读锁，则当前会话只能对A表进行读操作，其它表都不能操作

会话1：

select * from student; –查，可以

delete from student where id = 1;–增删改，会“等待”会话0将锁释放

会话1：

select * from user; –查，可以

delete from user where id = 1;–增删改，可以

会话0给A表加了锁，其它会话的操作①可以对其它表进行读写操作②对A表：读可以，写需要等待释放锁。

4、加写锁

会话0：

lock table student write;

当前会话可以对加了写锁的表，可以进行任何增删改查操作；但是不能操作其它表；

其它会话：

对会话0中对加写锁的表，可以进行增删改查的前提是：等待会话0释放写锁。

5、MyISAM表级锁的锁模式

MyISAM在执行查询语句前，会自动给涉及的所有表加读锁，在执行增删改前，会自动给涉及的表加写锁。

所以对MyISAM表进行操作，会有如下情况发生：

（1）对MyISAM表的读操作（加读锁），不会阻塞其它会话（进程）对同一表的读请求。但会阻塞对同一表的写操作。只有当读锁释放后，才会执行其它进程的写操作。

（2）对MyISAM表的写操作（加写锁），会阻塞其它会话（进程）对同一表的读和写操作，只有当写锁释放后，才会执行其它进程的读写操作。

6、MyISAM分析表锁定

查看哪些表加了锁：

show open tables;1代表被加了锁

分析表锁定的严重程度：

show status like 'table%';

Table_locks_immediate：可能获取到的锁数

Table_locks_waited：需要等待的表锁数（该值越大，说明存在越大的锁竞争）

一般建议：Table_locks_immediate/Table_locks_waited > 5000，建议采用InnoDB引擎，否则采用MyISAM引擎。

7、InnoDB分析表锁定

为了研究行锁，暂时将自动commit关闭，set autocommit = 0;

show status like '%innodb_row_lock%';

Innodb_row_lock_current_waits：当前正在等待锁的数量

Innodb_row_lock_time：等待总时长。从系统启动到现在一共等待的时间

Innodb_row_lock_time_avg：平均等待时长。从系统启动到现在一共等待的时间

Innodb_row_lock_time_max：最大等待时长。从系统启动到现在一共等待的时间

Innodb_row_lock_waits：等待次数。从系统启动到现在一共等待的时间

8、加行锁代码实例

（1）查询student

select id,name,age from student

（2）更新student

update student set age = 18 where id = 1

（3）加行锁

通过select id,name,age from student for update;给查询加行锁。

依旧修改成功，原因是MySQL默认是自动提交的，因此需要暂时将自动commit关闭

set autocommit = 0;

9、行锁的注意事项

（1）如果没有索引，行锁自动转为表锁。

（2）行锁只能通过事务解锁。

（3）InnoDB默认采用行锁

优点：并发能力强，性能高，效率高

缺点：比表锁性能损耗大

高并发用InnoDb，否则用MyISAM。

转自：https://blog.csdn.net/guorui_java/article/details/118633664

MySql基础知识总结（SQL优化篇）

3、使用联合索引查询

4、联合索引，但与索引顺序不一致

5、联合索引，但其中一个条件是 >

6、联合索引，order by

三、单表sql优化

1、删除student表中的联合索引。

2、添加索引

4、去掉in

相关文章

归档