对于一项数值型的KPI指标来说,在进行深入的对比、关联、趋势、预测、模式、特征等深入分析之前,先看一下数据的大致分布情况、有无异常、集中与离散趋势如何,以决定是不是需要对数据做进一步的清理与修补等工作是不可获取的。这部分工作在统计学中叫做描述统计。描述统计一般看两个趋势:集中与离散。表达集中趋势的值主要是均值、中值和众数,表达离散趋势的值主要是方差和标准差,当然还有数据的四分位、最大、最小、极差、峰度和偏度等相关指标。数据分布趋势的可视化主要通过直方图和箱线图来展示。下面就以员工的月度接听量数据展示一下这个过程:
那么这组数据呈现什么样的分布特征呢?是否符合我们的预期呢?有没有异常数据需要进一步处理呢?我们先来看一下Excel给出的描述统计结果:
再来看一下R的数据摘要:
由以上数据可以看出,整个中心所有员工的月度接听量均值约为2500通,中位数和众数也都非常接近,分别为2498和2489,偏度趋近于0,应该说分布还是比较对称和均匀的,并没有出现异常或偏态分布。标准差约为30通,最多和最少之间的月度差距为209通,整体表现的离散趋势还是比较明显的。从业务的角度看,员工之间的这个接听量差距还是稍微有些大,从数据的角度看还是有几个离群值的。
下面我们再用直方图和箱线图更直观地看一下,数据的特征会更明显:
那么问题来了,面对这么一组还算不错的数据,下一步努力方向是什么?基本思路是:集中趋势,代表整体水平,因此要继续合理提升或稳固;离散趋势代表员工表现分布差异,也直接影响着产能和客户体验,因此要继续降低异常干扰,优化流程,合理缩小差异。