• 企业400电话
  • 微网小程序
  • AI电话机器人
  • 电商代运营
  • 全 部 栏 目

    企业400电话 网络优化推广 AI电话机器人 呼叫中心 网站建设 商标✡知产 微网小程序 电商运营 彩铃•短信 增值拓展业务
    记一次因线上mysql优化器误判引起慢查询事件

    前言:

         收到疯狂的慢查询及请求超时报警,通过metrics分析出来自mysql请求的异常,cli —> show proceslist 看到很多慢查询。 先前该sql是没有的,后面因为数据量的增长才出现了这问题。 虽然feeds表大到一个亿,但因为feeds流信息有近期热的特征,所以不是因为 innodb_buffer_pool_size 低效引起的io频繁。 后来经过进一步explain执行计划分析得出了原因,mysql查询优化器选择了他认为高效的索引。

    mysql查询优化器大多数情况是靠谱的!  但是你的sql语言含有多个索引时就要注意了,往往最后的结果令人有些彷徨了。因为mysql同一个sql只能使用一个索引,那么选择哪个呢? 在数据量小时候,mysql优化器会把主键索引后置,优先使用 index和unique 。 当你达到一个数据量级后,又因为你的查询操作有 in ,那么mysql查询优化器很可能会选用主键的 !

    记住一句话,mysql查询优化是基于检索成本考虑,而不是基于时间成本考虑。 优化器是根据现有的数据状态来推算代价,而不是真的去执行一遍sql.

    所以,mysql优化器并不是每次都可以达到优化的效果的。 它并不能准确预估代价,如果要准确得到走各个索引的代价就要去真的执行一遍才能知道,所以代价分析只是做了一个预估,既然是预估那么就有误判。

    我们这里说的表是feed信息流表,我们知道feeds信息流表访问不仅频繁,而且数据量也很大。 但是这个表的数据结构很简单,索引也简单.   一共就两个索引,一个是主键索引, 一个是unique唯一键索引。

    如下,该表的量级已经到亿级别了,因为有足够多的cache前顶,又因为这样那样的原因,所以没来的及做分库分表。

    问题是这样的, 当数据量级不到一个亿的时候,mysql优化器选择使用 index索引, 当数据量级超过一个亿后,mysql查询优化器选择使用 主键索引了。  这样带来的问题就是 查询速度太慢。

    这是正常情况下:

    mysql> explain SELECT * FROM `feed` WHERE user_id IN (116537309,116709093,116709377)     AND cid IN (1001,1005,1054,1092,1093,1095)  AND id = 128384713 ORDER BY id DESC LIMIT 0, 11 \G;
    *************************** 1. row ***************************
          id: 1
     select_type: SIMPLE
        table: feed
      partitions: NULL
         type: range
    possible_keys: PRIMARY,feed_user_target
         key: feed_user_target
       key_len: 6
         ref: NULL
         rows: 18
       filtered: 50.00
        Extra: Using where; Using index; Using filesort
    1 row in set, 1 warning (0.00 sec)
    
    

    同样的sql语句,在数据量有较大变化后,mysql查询优化器对索引的选择也有了变化。

    mysql> explain SELECT * FROM `feed` WHERE user_id IN (116537309,116709093,116709377)    AND cid IN (1001,1005,1054,1092,1093,1095)    AND id = 128384713 ORDER BY id DESC LIMIT 0, 11 \G;
    *************************** 1. row ***************************
          id: 1
     select_type: SIMPLE
        table: feed
         type: range
    possible_keys: PRIMARY,feed_user_target
         key: PRIMARY
       key_len: 4
         ref: NULL
         rows: 11873197
        Extra: Using where
    1 row in set (0.00 sec)
    

    那么解决方法是使用 force index,强制查询优化器使用我们给出的index 。 我这里是python开发环境,常见的python orm都有force index,ignore index,user index 参数的。

    explain  SELECT * FROM `feed` force index (feed_user_target) WHERE user_id IN (116537309,116709093,116709377) ...

    那么我们应该怎么预防这种 因为数据的增进,mysql优化器选择了一个低效索引的问题呢?

    针对这个问题请教了几个厂的dba,得到的答案和我们的方法是一样的。 都是只能通过后期的慢查询来发现问题,然后在sql语句中指定force index来解决索引问题。 另外,在系统上线初期就会做这类问题的规避,但往往业务开发人员初期都会配合dba们的审查工作,但后期为了省事,或者说自以为是认为没有问题,所以造成了 mysql查询事故。

    我自己对于mysql优化器选择索引规则一知半解的,后面准备花时间好好研究下规则

    您可能感兴趣的文章:
    • mysql慢查询优化之从理论和实践说明limit的优点
    • 通过MySQL慢查询优化MySQL性能的方法讲解
    • 简单谈谈MySQL优化利器-慢查询
    • MySQL慢查询优化之慢查询日志分析的实例教程
    • 美团网技术团队分享的MySQL索引及慢查询优化教程
    • Mysql慢查询优化方法及优化原则
    上一篇:MySql Sql 优化技巧分享
    下一篇:MySQL嵌套事务所遇到的问题
  • 相关文章
  • 

    © 2016-2020 巨人网络通讯 版权所有

    《增值电信业务经营许可证》 苏ICP备15040257号-8

    记一次因线上mysql优化器误判引起慢查询事件 记,一次,因,线上,mysql,优化,