mysql查询时offset过大影响性能的原因和优化详解-巨人网络通讯

mysql查询时offset过大影响性能的原因和优化详解

前言

mysql查询使用select命令，配合limit，offset参数可以读取指定范围的记录。本文将介绍mysql查询时，offset过大影响性能的原因及优化方法。

准备测试数据表及数据

1.创建表

CREATE TABLE `member` (
 `id` int(10) unsigned NOT NULL AUTO_INCREMENT,
 `name` varchar(10) NOT NULL COMMENT '姓名',
 `gender` tinyint(3) unsigned NOT NULL COMMENT '性别',
 PRIMARY KEY (`id`),
 KEY `gender` (`gender`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

2.插入1000000条记录

?php
$pdo = new PDO("mysql:host=localhost;dbname=user","root",'');

for($i=0; $i1000000; $i++){
 $name = substr(md5(time().mt_rand(000,999)),0,10);
 $gender = mt_rand(1,2);
 $sqlstr = "insert into member(name,gender) values('".$name."','".$gender."')";
 $stmt = $pdo->prepare($sqlstr);
 $stmt->execute();
}
?>

mysql> select count(*) from member;
+----------+
| count(*) |
+----------+
| 1000000 |
+----------+
1 row in set (0.23 sec)

3.当前数据库版本

mysql> select version();
+-----------+
| version() |
+-----------+
| 5.6.24 |
+-----------+
1 row in set (0.01 sec)

分析offset过大影响性能的原因

1.offset较小的情况

mysql> select * from member where gender=1 limit 10,1;
+----+------------+--------+
| id | name  | gender |
+----+------------+--------+
| 26 | 509e279687 |  1 |
+----+------------+--------+
1 row in set (0.00 sec)

mysql> select * from member where gender=1 limit 100,1;
+-----+------------+--------+
| id | name  | gender |
+-----+------------+--------+
| 211 | 07c4cbca3a |  1 |
+-----+------------+--------+
1 row in set (0.00 sec)

mysql> select * from member where gender=1 limit 1000,1;
+------+------------+--------+
| id | name  | gender |
+------+------------+--------+
| 1975 | e95b8b6ca1 |  1 |
+------+------------+--------+
1 row in set (0.00 sec)

当offset较小时，查询速度很快，效率较高。

2.offset较大的情况

mysql> select * from member where gender=1 limit 100000,1;
+--------+------------+--------+
| id  | name  | gender |
+--------+------------+--------+
| 199798 | 540db8c5bc |  1 |
+--------+------------+--------+
1 row in set (0.12 sec)

mysql> select * from member where gender=1 limit 200000,1;
+--------+------------+--------+
| id  | name  | gender |
+--------+------------+--------+
| 399649 | 0b21fec4c6 |  1 |
+--------+------------+--------+
1 row in set (0.23 sec)

mysql> select * from member where gender=1 limit 300000,1;
+--------+------------+--------+
| id  | name  | gender |
+--------+------------+--------+
| 599465 | f48375bdb8 |  1 |
+--------+------------+--------+
1 row in set (0.31 sec)

当offset很大时，会出现效率问题，随着offset的增大，执行效率下降。

分析影响性能原因

select * from member where gender=1 limit 300000,1;

因为数据表是InnoDB，根据InnoDB索引的结构，查询过程为：

通过二级索引查到主键值（找出所有gender=1的id)。
再根据查到的主键值通过主键索引找到相应的数据块（根据id找出对应的数据块内容）。
根据offset的值，查询300001次主键索引的数据，最后将之前的300000条丢弃，取出最后1条。

不过既然二级索引已经找到主键值，为什么还需要先用主键索引找到数据块，再根据offset的值做偏移处理呢？

如果在找到主键索引后，先执行offset偏移处理，跳过300000条，再通过第300001条记录的主键索引去读取数据块，这样就能提高效率了。

如果我们只查询出主键，看看有什么不同

mysql> select id from member where gender=1 limit 300000,1;
+--------+
| id  |
+--------+
| 599465 |
+--------+
1 row in set (0.09 sec)

很明显，如果只查询主键，执行效率对比查询全部字段，有很大的提升。

推测

只查询主键的情况

因为二级索引已经找到主键值，而查询只需要读取主键，因此mysql会先执行offset偏移操作，再根据后面的主键索引读取数据块。

需要查询所有字段的情况

因为二级索引只找到主键值，但其他字段的值需要读取数据块才能获取。因此mysql会先读出数据块内容，再执行offset偏移操作，最后丢弃前面需要跳过的数据，返回后面的数据。

证实

InnoDB中有buffer pool，存放最近访问过的数据页，包括数据页和索引页。

为了测试，先把mysql重启，重启后查看buffer pool的内容。

mysql> select index_name,count(*) from information_schema.INNODB_BUFFER_PAGE where INDEX_NAME in('primary','gender') and TABLE_NAME like '%member%' group by index_name;
Empty set (0.04 sec)

可以看到，重启后，没有访问过任何的数据页。

查询所有字段，再查看buffer pool的内容

mysql> select * from member where gender=1 limit 300000,1;
+--------+------------+--------+
| id  | name  | gender |
+--------+------------+--------+
| 599465 | f48375bdb8 |  1 |
+--------+------------+--------+
1 row in set (0.38 sec)

mysql> select index_name,count(*) from information_schema.INNODB_BUFFER_PAGE where INDEX_NAME in('primary','gender') and TABLE_NAME like '%member%' group by index_name;
+------------+----------+
| index_name | count(*) |
+------------+----------+
| gender  |  261 |
| PRIMARY |  1385 |
+------------+----------+
2 rows in set (0.06 sec)

可以看出，此时buffer pool中关于member表有1385个数据页，261个索引页。

重启mysql清空buffer pool，继续测试只查询主键

mysql> select id from member where gender=1 limit 300000,1;
+--------+
| id  |
+--------+
| 599465 |
+--------+
1 row in set (0.08 sec)

mysql> select index_name,count(*) from information_schema.INNODB_BUFFER_PAGE where INDEX_NAME in('primary','gender') and TABLE_NAME like '%member%' group by index_name;
+------------+----------+
| index_name | count(*) |
+------------+----------+
| gender  |  263 |
| PRIMARY |  13 |
+------------+----------+
2 rows in set (0.04 sec)

可以看出，此时buffer pool中关于member表只有13个数据页，263个索引页。因此减少了多次通过主键索引访问数据块的I/O操作，提高执行效率。

因此可以证实，mysql查询时，offset过大影响性能的原因是多次通过主键索引访问数据块的I/O操作。（注意，只有InnoDB有这个问题，而MYISAM索引结构与InnoDB不同，二级索引都是直接指向数据块的，因此没有此问题 ）。

InnoDB与MyISAM引擎索引结构对比图

这里写图片描述

优化方法

根据上面的分析，我们知道查询所有字段会导致主键索引多次访问数据块造成的I/O操作。

因此我们先查出偏移后的主键，再根据主键索引查询数据块的所有内容即可优化。

mysql> select a.* from member as a inner join (select id from member where gender=1 limit 300000,1) as b on a.id=b.id;
+--------+------------+--------+
| id  | name  | gender |
+--------+------------+--------+
| 599465 | f48375bdb8 |  1 |
+--------+------------+--------+
1 row in set (0.08 sec)

附：MYSQL limit,offset 区别

SELECT
  keyword
FROM
  keyword_rank
WHERE
  advertiserid='59'
order by
  keyword
LIMIT 2 OFFSET 1;

比如这个SQL ，limit后面跟的是2条数据，offset后面是从第1条开始读取

SELECT
  keyword
FROM
  keyword_rank
WHERE
  advertiserid='59'
ORDER BY
  keyword
LIMIT 2 ,1;

而这个SQL，limit后面是从第2条开始读，读取1条信息。

这两个千万别搞混哦。

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，如果有疑问大家可以留言交流，谢谢大家对脚本之家的支持。

您可能感兴趣的文章:

MySQL性能优化之如何高效正确的使用索引
MySQL数据库查询性能优化策略
Mysql高性能优化技能总结
MySQL性能优化神器Explain的基本使用分析
通过MySQL慢查询优化MySQL性能的方法讲解
MySQL Limit性能优化及分页数据性能优化详解
MySQL中聚合函数count的使用和性能优化技巧
mysql千万级数据分页查询性能优化
MYSQL开发性能研究之批量插入数据的优化方法
MySQL性能优化技巧分享

上一篇：MySQL优化insert性能的方法示例
下一篇：安装mysql8.0.11及修改root密码、连接navicat for mysql的思路详解

mysql查询时offset过大影响性能的原因和优化详解

前言 mysql查询使用select命令，配合limit，offset参数可以读取指定范围的记录。本文将介绍mysql查询时，offset过大影响性能的原因及优化方法。准备测试数据表及数据 1.创建表 CREATE TABLEmysql,查询,时,offset,过大,...

腾讯地图名称修改没变，腾讯地图地址修改好没变怎么回

腾讯地图如何修改店铺名称？可以在自己已标注的位置信息当中选择修改店铺名称与位...

捷通华声亮相2018全国检察机关科技装备展 --灵云AI助

近日，2018全国检察机关科技装备展在京盛大举办，吸引了来自检察、公安、法院等领域...

呼呼电销机器人电话机器人

2.可视化和数字化管理，对所有呼出电话列表进行分类，哪些被应答，哪些未被应答，...

许昌防封卡外呼系统厂家（防封号外呼）

今天给各位分享许昌防封卡外呼系统厂家的知识，其中也会对防封号外呼进行解释，如...

基于docker搭建nginx文件服务器的方法步骤

1.在本机新建配置文件docker_nginx.conf server { listen 7070; server_name localhost; charset utf-8; loca...

呼叫中心加快云转型提升客户体验

巨人网络通讯呼叫中心在2020年突出了企业对呼叫中心灵活性和适应性的急迫需要。加...

一些知名的网站托管代运营公司就一定适合你吗？

现在市面上最不缺的就是抖音代运营，公众号代运营，网站代运营公司这些，为什么尼...

win7怎么进入安全模式(F8/Ctrl键)轻松进入Win7安全模式

win7的安全模式和XP如出一辙，在安全模式里我们可以删除顽固文件、查杀病毒、解除...

小语人工智能电话机器人（小语智能机器人怎么样）

今天给各位分享小语人工智能电话机器人的知识，其中也会对小语智能机器人怎么样进...

分辨电话机器人（接电话的机器人）

本文目录一览： 1、疯了，这终究是板滞人电话仍旧人工电话 2、硅基智能的电话板滞人...

400电话申请流程详解：让杭州企业轻松申请

近年来，随着电商、互联网等行业的快速发展，越来越多的企业开始意识到电话销售的...

濮阳智能外呼系统企业（濮阳智能外呼系统企业有哪些）

今天给各位分享濮阳智能外呼系统企业的知识，其中也会对濮阳智能外呼系统企业有哪...

SQL查询中in和exists的区别分析

select * from A where id in (select id from B); select * from A where exists (select 1 from B where A.id=B.id);...

谷歌卫星地图三维图

谷歌地图是 google 公司提供的电子地图服务,包括局部详细的卫星照片.此款服务可以提供...

智慧农机物联网解决方案

智能农业机械互联解决方案农业机械工业工业互联网在农机工业中的应用，是为了促进...

mysql查询时offset过大影响性能的原因和优化详解

全 部 栏 目

全部栏目