• 企业400电话
  • 微网小程序
  • AI电话机器人
  • 电商代运营
  • 全 部 栏 目

    企业400电话 网络优化推广 AI电话机器人 呼叫中心 网站建设 商标✡知产 微网小程序 电商运营 彩铃•短信 增值拓展业务
    mysql查询时offset过大影响性能的原因和优化详解

    前言

    mysql查询使用select命令,配合limit,offset参数可以读取指定范围的记录。本文将介绍mysql查询时,offset过大影响性能的原因及优化方法。

    准备测试数据表及数据

    1.创建表

    CREATE TABLE `member` (
     `id` int(10) unsigned NOT NULL AUTO_INCREMENT,
     `name` varchar(10) NOT NULL COMMENT '姓名',
     `gender` tinyint(3) unsigned NOT NULL COMMENT '性别',
     PRIMARY KEY (`id`),
     KEY `gender` (`gender`)
    ) ENGINE=InnoDB DEFAULT CHARSET=utf8;

    2.插入1000000条记录

    ?php
    $pdo = new PDO("mysql:host=localhost;dbname=user","root",'');
    
    for($i=0; $i1000000; $i++){
     $name = substr(md5(time().mt_rand(000,999)),0,10);
     $gender = mt_rand(1,2);
     $sqlstr = "insert into member(name,gender) values('".$name."','".$gender."')";
     $stmt = $pdo->prepare($sqlstr);
     $stmt->execute();
    }
    ?>
    
    mysql> select count(*) from member;
    +----------+
    | count(*) |
    +----------+
    | 1000000 |
    +----------+
    1 row in set (0.23 sec)

    3.当前数据库版本

    mysql> select version();
    +-----------+
    | version() |
    +-----------+
    | 5.6.24 |
    +-----------+
    1 row in set (0.01 sec)

    分析offset过大影响性能的原因

    1.offset较小的情况

    mysql> select * from member where gender=1 limit 10,1;
    +----+------------+--------+
    | id | name  | gender |
    +----+------------+--------+
    | 26 | 509e279687 |  1 |
    +----+------------+--------+
    1 row in set (0.00 sec)
    
    mysql> select * from member where gender=1 limit 100,1;
    +-----+------------+--------+
    | id | name  | gender |
    +-----+------------+--------+
    | 211 | 07c4cbca3a |  1 |
    +-----+------------+--------+
    1 row in set (0.00 sec)
    
    mysql> select * from member where gender=1 limit 1000,1;
    +------+------------+--------+
    | id | name  | gender |
    +------+------------+--------+
    | 1975 | e95b8b6ca1 |  1 |
    +------+------------+--------+
    1 row in set (0.00 sec)

    当offset较小时,查询速度很快,效率较高。 

    2.offset较大的情况

    mysql> select * from member where gender=1 limit 100000,1;
    +--------+------------+--------+
    | id  | name  | gender |
    +--------+------------+--------+
    | 199798 | 540db8c5bc |  1 |
    +--------+------------+--------+
    1 row in set (0.12 sec)
    
    mysql> select * from member where gender=1 limit 200000,1;
    +--------+------------+--------+
    | id  | name  | gender |
    +--------+------------+--------+
    | 399649 | 0b21fec4c6 |  1 |
    +--------+------------+--------+
    1 row in set (0.23 sec)
    
    mysql> select * from member where gender=1 limit 300000,1;
    +--------+------------+--------+
    | id  | name  | gender |
    +--------+------------+--------+
    | 599465 | f48375bdb8 |  1 |
    +--------+------------+--------+
    1 row in set (0.31 sec)

    当offset很大时,会出现效率问题,随着offset的增大,执行效率下降。 

    分析影响性能原因

    select * from member where gender=1 limit 300000,1;

    因为数据表是InnoDB,根据InnoDB索引的结构,查询过程为:

    不过既然二级索引已经找到主键值,为什么还需要先用主键索引找到数据块,再根据offset的值做偏移处理呢?

    如果在找到主键索引后,先执行offset偏移处理,跳过300000条,再通过第300001条记录的主键索引去读取数据块,这样就能提高效率了。

    如果我们只查询出主键,看看有什么不同

    mysql> select id from member where gender=1 limit 300000,1;
    +--------+
    | id  |
    +--------+
    | 599465 |
    +--------+
    1 row in set (0.09 sec)

    很明显,如果只查询主键,执行效率对比查询全部字段,有很大的提升。  

    推测

    只查询主键的情况

    因为二级索引已经找到主键值,而查询只需要读取主键,因此mysql会先执行offset偏移操作,再根据后面的主键索引读取数据块。

    需要查询所有字段的情况

    因为二级索引只找到主键值,但其他字段的值需要读取数据块才能获取。因此mysql会先读出数据块内容,再执行offset偏移操作,最后丢弃前面需要跳过的数据,返回后面的数据。 

    证实

    InnoDB中有buffer pool,存放最近访问过的数据页,包括数据页和索引页。

    为了测试,先把mysql重启,重启后查看buffer pool的内容。

    mysql> select index_name,count(*) from information_schema.INNODB_BUFFER_PAGE where INDEX_NAME in('primary','gender') and TABLE_NAME like '%member%' group by index_name;
    Empty set (0.04 sec)

    可以看到,重启后,没有访问过任何的数据页。

    查询所有字段,再查看buffer pool的内容

    mysql> select * from member where gender=1 limit 300000,1;
    +--------+------------+--------+
    | id  | name  | gender |
    +--------+------------+--------+
    | 599465 | f48375bdb8 |  1 |
    +--------+------------+--------+
    1 row in set (0.38 sec)
    
    mysql> select index_name,count(*) from information_schema.INNODB_BUFFER_PAGE where INDEX_NAME in('primary','gender') and TABLE_NAME like '%member%' group by index_name;
    +------------+----------+
    | index_name | count(*) |
    +------------+----------+
    | gender  |  261 |
    | PRIMARY |  1385 |
    +------------+----------+
    2 rows in set (0.06 sec)

    可以看出,此时buffer pool中关于member表有1385个数据页,261个索引页。 

    重启mysql清空buffer pool,继续测试只查询主键

    mysql> select id from member where gender=1 limit 300000,1;
    +--------+
    | id  |
    +--------+
    | 599465 |
    +--------+
    1 row in set (0.08 sec)
    
    mysql> select index_name,count(*) from information_schema.INNODB_BUFFER_PAGE where INDEX_NAME in('primary','gender') and TABLE_NAME like '%member%' group by index_name;
    +------------+----------+
    | index_name | count(*) |
    +------------+----------+
    | gender  |  263 |
    | PRIMARY |  13 |
    +------------+----------+
    2 rows in set (0.04 sec)

    可以看出,此时buffer pool中关于member表只有13个数据页,263个索引页。因此减少了多次通过主键索引访问数据块的I/O操作,提高执行效率。

    因此可以证实,mysql查询时,offset过大影响性能的原因是多次通过主键索引访问数据块的I/O操作。(注意,只有InnoDB有这个问题,而MYISAM索引结构与InnoDB不同,二级索引都是直接指向数据块的,因此没有此问题 )。 

    InnoDB与MyISAM引擎索引结构对比图

    这里写图片描述

    优化方法

    根据上面的分析,我们知道查询所有字段会导致主键索引多次访问数据块造成的I/O操作。

    因此我们先查出偏移后的主键,再根据主键索引查询数据块的所有内容即可优化。

    mysql> select a.* from member as a inner join (select id from member where gender=1 limit 300000,1) as b on a.id=b.id;
    +--------+------------+--------+
    | id  | name  | gender |
    +--------+------------+--------+
    | 599465 | f48375bdb8 |  1 |
    +--------+------------+--------+
    1 row in set (0.08 sec)

    附:MYSQL limit,offset 区别

    SELECT
      keyword
    FROM
      keyword_rank
    WHERE
      advertiserid='59'
    order by
      keyword
    LIMIT 2 OFFSET 1;

    比如这个SQL ,limit后面跟的是2条数据,offset后面是从第1条开始读取

    SELECT
      keyword
    FROM
      keyword_rank
    WHERE
      advertiserid='59'
    ORDER BY
      keyword
    LIMIT 2 ,1;

    而这个SQL,limit后面是从第2条开始读,读取1条信息。

    这两个千万别搞混哦。

    总结

    以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对脚本之家的支持。

    您可能感兴趣的文章:
    • MySQL性能优化之如何高效正确的使用索引
    • MySQL数据库查询性能优化策略
    • Mysql高性能优化技能总结
    • MySQL性能优化神器Explain的基本使用分析
    • 通过MySQL慢查询优化MySQL性能的方法讲解
    • MySQL Limit性能优化及分页数据性能优化详解
    • MySQL中聚合函数count的使用和性能优化技巧
    • mysql千万级数据分页查询性能优化
    • MYSQL开发性能研究之批量插入数据的优化方法
    • MySQL性能优化技巧分享
    上一篇:MySQL优化insert性能的方法示例
    下一篇:安装mysql8.0.11及修改root密码、连接navicat for mysql的思路详解
  • 相关文章
  • 

    © 2016-2020 巨人网络通讯 版权所有

    《增值电信业务经营许可证》 苏ICP备15040257号-8

    mysql查询时offset过大影响性能的原因和优化详解 mysql,查询,时,offset,过大,