• 企业400电话
  • 网络优化推广
  • AI电话机器人
  • 呼叫中心
  • 全 部 栏 目

    网站建设 商标✡知产 微网小程序 电商运营 彩铃•短信 增值拓展业务
    Mysql按条件计数多种实现方法详解
    POST TIME:2021-10-18 20:03

    最近在给某网站的后台添加一系列的统计功能,遇到很多需要按条件计数的情况。尝试了几种方法,下面简要记录,供大家参考。

    问题描述

    为使讨论简单易懂,我将问题稍作简化,去掉诸多的背景。

    从前有一个皇帝,他有50个妃子,这些妃子很没有天理的给他生了100,000个儿子,于是,皇帝很苦恼,海量的儿子很难管理,而且,他想知道每个妃子给他生了多少个儿子,从而论功行赏,这很难办。于是,皇帝请了一个程序员帮他编了一个程序,用数据库来存储所有的儿子的信息,这样就可以用程序来统计和管理啦。

    数据库的结构如下:

    id 皇子的唯一编号
    mother 皇子母亲的唯一编号

    皇帝把妃子分成了两个等级,天宫娘娘(编号小于25)和地宫娘娘(编号大于等于25),他想知道天宫娘娘们和地宫娘娘们的生育能力孰强孰弱。于是,程序员开始写SQL Query了。

    方法1:使用GROUP BY

    SQL Query

    SELECT COUNT(*) FROM `prince` GROUP BY `mother` > 24;

    执行结果

    count(*)
    50029
    49971

    在100,000行数据上的运行时间:0.0335 秒

    分析

    这种GROUP BY方法的最大问题在于:无法区分所得到的结果。这两个数字哪一个是天宫娘娘们所生的皇子数,哪一个是地宫娘娘们所生的皇子数呢?不知道。所以,尽管它统计出了总数,但是没有什么意义。

    因此,为了区分统计结果,必须要把条件 mother > 24 也作为一个字段在结果集中作为一个字段体现出来,修改后的sql如下:

    SELECT COUNT(*) AS `number`, `mother` > 24 AS `type` FROM `prince` GROUP BY `mother` > 24;

    执行结果

    number type
    50029 0
    49971 1

    条件表达式作为字段时,该字段的值就是该条件表达式的值,因此,对应我们的例子,type = 1 也就是表示 mother > 24 的值为1,因此,第二行中的数字代表地宫娘娘们所生的皇子数。

    经过修改后,我们看出,天宫娘娘们略胜一筹。

    优缺点

    缺点是显而易见的,由于使用了条件表达式作为分组依据,它只能做二元的划分,对于要分成多类进行统计的情况不能够胜任。比如要分别统计1~10号、11~24号,25号~50号妃子的产子数,就无法实现了。

    另外,由于使用了GROUP BY,因此涉及到排序,执行时间上要更长。

    我暂时没有发现这种方法的优点。

    方法2:使用嵌套的SELECT

    使用嵌套的SELECT也可以达到目的,在每个SELECT子句中统计一个条件下的数据,然后用一个主SELECT把这些统计数据整合起来。

    SQL Query

    SELECT 
      ( SELECT COUNT( * ) FROM `prince` WHERE `mother` >24 ) AS `digong`, 
      ( SELECT COUNT( * ) FROM `prince` WHERE `mother` =24 ) AS `tiangong`

    执行结果

    digong tiangong
    49971 50029

    在100,000行数据上的运行时间:0.0216 秒

    分析

    这种嵌套SELECT的方法非常直观,就是分别统计各个条件下的数值,最后进行汇总,通俗易懂,跟自然语言没啥区别了。

    优缺点

    优点就是直观,而且速度也比GROUP BY要快。虽然是3条SELECT语句,看起来比GROUP BY的方案多了2条语句,但是它不涉及到排序,这就节省了很多时间。

    缺点可能就是语句稍多,对语句数量有洁癖的同学可能会比较不舒服。

    方法3:使用CASE WHEN

    CASE WHEN语句的功能很强大,可以定义灵活的查询条件,很适合进行分类统计。

    SQL Query

    SELECT 
      COUNT( CASE WHEN `mother` >24 THEN 1 ELSE NULL END ) AS `digong`, 
      COUNT( CASE WHEN `mother` =24 THEN 1 ELSE NULL END ) AS `tiangong`
    FROM prince

    执行结果

    digong tiangong
    49971 50029

    在100,000行数据上的运行时间:0.02365825 秒

    分析

    此方法的关键在于

    COUNT( CASE WHEN `mother` >24 THEN 1 ELSE NULL END )

    这里的COUNT和CASE WHEN联合使用,做到了分类计数。先使用CASE WHEN,当满足条件时,将字段值设置为 1, 不满足条件时,将字段值设置为NULL,接着COUNT函数仅对非NULL字段进行计数,于是,问题解决。

    优缺点

    优点嘛,此方法也不涉及到排序,因此运行时间上与方法2相当,SELECT语句减少到了 1 条。

    缺点就是语句比较长,对语句长度有洁癖的同学可能会比较不舒服。

    总结

    对于确定分类的按条件计数,可以尽量不用GROUP BY,从而避免排序动作,加速Query的执行。

    如果需要根据某个字段的值进行分类,而该字段的值是可变的,比如皇帝要统计每一个妃子的产子数,而他可能不停的再娶很多妃子,这种情况下,使用方法2和方法3就不太灵光了,还是使用一个GROUP BY来得简单便捷。

    以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

    您可能感兴趣的文章:
    • 两种方法实现mysql分组计数,范围汇总
    • 详解mysql 获取某个时间段每一天、每一个小时的统计数据
    • MySQL按时间统计数据的方法总结
    • mysql 获取规定时间段内的统计数据
    • MySQL中实现高性能高并发计数器方案(例如文章点击数)
    • Mysql auto_increment 重新计数(让id从1开始)
    • 用PHP和MYSQL建立计数器过程详解
    上一篇:MySQL中使用去重distinct方法的示例详解
    下一篇:MySQL定时备份方案(利用Linux crontab)
  • 相关文章
  • 

    关于我们 | 付款方式 | 荣誉资质 | 业务提交 | 代理合作


    © 2016-2020 巨人网络通讯

    时间:9:00-21:00 (节假日不休)

    地址:江苏信息产业基地11号楼四层

    《增值电信业务经营许可证》 苏B2-20120278

    X

    截屏,微信识别二维码

    微信号:veteran88

    (点击微信号复制,添加好友)

     打开微信