• 企业400电话
  • 微网小程序
  • AI电话机器人
  • 电商代运营
  • 全 部 栏 目

    企业400电话 网络优化推广 AI电话机器人 呼叫中心 网站建设 商标✡知产 微网小程序 电商运营 彩铃•短信 增值拓展业务
    浅析MySQL的基数统计

    一、基数是啥?
    Cardinality指的就是MySQL表中某一列的不同值的数量。

    如果这一类是唯一索引,那基数 = 行数。

    如果这一列是sex,枚举类型只有男女,那它是基数就是2

    Cardinality越高,列就越有成为索引的价值。MySQL执行计划也会基于Cardinality选择索引。

    通过下面的方式可以看到表中各列的基数。

    比如这个经典的例子:
    有一列为sex,那对于sex列中存储的值来说 非男即女,它的基数最大就是2。
    那也就完全没有必要为sex建立索引。因为,为了提升你基于sex的查询速度,MySQL会为你选择的这个新索引创建一棵全新的B+Tree。但你sex只有两种值,对于MySQL来说,即使它为你指定的列建立了B+Tree索引,真正执行查询时,最多进行一次二分查询,剩下的操作只能是遍历,所以为sex创建索引意义不大。

    二、InnoDB更新基数的时机?
    参数:innodb_stats_auto_recalc控制MySQL是否主动重新计算这些持久性的信息。默认为1表示true,0表示false。
    默认情况下当表中的行变化超过10%时,重新计算基数信息。

    三、基数是估算出来

    基数并不会实时更新!而且它是通过采样估算出来的值!

    至于基数的公式是怎样的,可能并不重要。

    重要的是你得知道,他是通过随机采样数据页的方式统计出来的一个估算值。

    而且随机采样的页数可以通过参数innodb_stats_persistent_sample_pages 设置,默认值是20。

    这就意味着 基数值并不准确,甚至你每次计算的结果相擦还是蛮大的。

    四、持久化基数

    可以通过参数innodb_stats_persistent 控制是否持久化基数,默认为off。

    当然你可以为一个单独的表设置 STATS_PERSISTENT=1 那么它的 innodb_stats_persistent将自动被启用。

    开启它的好处是:重启MySQL不会再重复计算这个值,加快重启速度。

    五、如何主动更新基数?

    执行下面的SQL时都会触发InnoDB更新基数(即使你并没有意识到它会更新基数)。

    所以尽量选择一个业务低峰期

    analyze table tableName;

    如果因为采样的数量太少了,计算的基数错的离谱。那很可能会导致MySQL的优化器选错索引。这是你可以将这个值适当调大。但是增加 太多可能会导致 ANALYZE TABLE运行缓慢。

    反之, ANALYZE TABLE运行太慢。你可以适度调整参数innodb_stats_persistent_sample_pages 的值。但是这又可能导致基数计算的不准确。

    如果没有办法平衡两者的关系。可以考虑减少表中索引列的数量或限制分区的数量以降低 ANALYZE TABLE复杂性。表的主键中的列数也很重要,因为主键列被附加到每个非唯一索引中。

    参考:

    https://dev.mysql.com/doc/refman/5.7/en/innodb-persistent-stats.html

    https://dev.mysql.com/doc/refman/5.7/en/innodb-analyze-table-complexity.html

    以上就是浅析MySQL的基数统计的详细内容,更多关于MySQL 基数统计的资料请关注脚本之家其它相关文章!

    您可能感兴趣的文章:
    • Mysql脏页flush及收缩表空间原理解析
    • 推荐几款MySQL相关工具
    • 浅析MySQL的lru链表
    • MySQL的查询缓存和Buffer Pool
    • mysql 递归查找菜单节点的所有子节点的方法
    • MySQL的表空间是什么
    • MySQL慢查询如何定位详解
    • MySQL的Flush-List和脏页的落盘机制
    上一篇:mysql 递归查找菜单节点的所有子节点的方法
    下一篇:MySQL的查询缓存和Buffer Pool
  • 相关文章
  • 

    © 2016-2020 巨人网络通讯 版权所有

    《增值电信业务经营许可证》 苏ICP备15040257号-8

    浅析MySQL的基数统计 浅析,MySQL,的,基数,统计,