软件预测能比人工预测准多少?
这是我们在与同行业沟通探讨时,经常会被问道的一个问题。其实,这里面存在一个误区,准确度的高低并不是由系统或者人工来决定的,而是选取的历史数据、分析的方法以及特殊事宜的考虑而决定的,要做到精准的预测,其实往往与预测人员的工作经验有非常大的关系。
要做好准确的预测,目前普遍认为需要做到一下三点:
选取适当的历史数据
依靠经验抚平或剔除业务异常数据
对业务未来活动、节假日等因素的预估
一选取适当的历史数据
历史数据是一切预测的基础,后续的话务预测都会是在历史数据的基础上进行提升或下降,那如此重要的历史数据是不是越多越好呢?
其实不然。按理说,数据应选取与未来业务变化一致的历史数据进行预测,例如下周或下个月业务将进行技能的变化或用户群体的变化,那之前取的长时间的历史话量参考性将会大幅下降,应该多参考近期业务的话量变化作为预测历史数据,也就是说业务越不稳定,我们选择的历史数据应当越短较好,因为短时间的数据可以反应出业务话量起伏变化的趋势与规律,而长时间的历史数据会将业务的话务起伏“抹平”;反之,如果业务较为稳定,且未来没有重大的变化,我们可以选择较长的历史数据进行预测,这样会将短期内或少量的异常情况进行“抚平”。
二依靠经验抚平或剔除业务异常数据
在选取历史数据中,往往会选到节假日、活动日以及线路故障等日期数据,如果使用这部分数据对未来话量进行预测,将会默认未来的一段时间内会同样有节假日、活动日或故障。这也就需要我们在业务运营时,每日要记录业务出现的临时状况,例如线路故障、天气异常、国家政策等对于话务线路的冲击,在将来进行预测的时候,需要将这部分异常的日期数据进行抛出,等到做活动日或节假日时单独进行预测处理。
三对业务未来活动、节假日等因素的预估
对于这列特殊日期的预测,需要用到特殊方法,不能再像其他普通日期使用长时间历史话量进行预测,而是提取特殊因子进行计算。特殊因子存在与历史发生过的活动日或节假日中,我们需要进行分析往年的活动或节假对于线路的影响比例,将这种影响的比例进行计算后,套用到今年的活动或节假日中,在基础数据上进行折算。
例如对2019年国庆日的节假日预测,我们可以取2018年以及2017年国庆日当周的话量以及前1周、2周、3周、4周的话量,计算出国庆日当周的话量下降因子,这样在我们正常预测出2019年国庆前4周话量后,就可以套用2018年或2017年的国庆日因子,计算出国庆期间的话量数据。
最终我们将获取一段时间业务稳定的话务数据后,进行了异常数据的剔除,以及未来活动、节假日的考虑后,得到了想要的基础数据。
将这些基础数据按周维度统计后,可以看到业务的话量在周中是存在递减或递增的趋势,同样可以将递增或递减的趋势与当周的话量进行计算,得到未来一周的话量。
将选取的历史数据按照星期维度再进行统计,可以得到一周内每天的话量比例,即星期占比,用预测出的未来一周的话量与星期占比相乘,可以计算出未来一周每日的话务量。
将选择的历史数据,以星期、时段的形式进行统计,这样可以得到星期一至星期日每个时段的话量数据,将每个时段的话量与全天话量相除,最终得到星期一至星期日每个时段的时段话量占比。
最终将我们计算出的未来一周每日的话务量与每天的时段占比相乘,就可以得出最终预测的每天每时段的话量数据。
预测的终点,其实并不是100%契合实际话量,话量是自然发生的事情,任何人都无法做到预测与实际完全一致,我们能做到的是不断的收集数据分析问题,在未来的预测中,尽可能的全面的考虑未来的影响因素,这样及时无法与实际相同,但也不至于出现重大的预测错误。随着我们工作经验的增加预测水平的提升,终会有一天,我们可以完全的掌握未来话务所发生的所有因素,到时,预测的准确度自然会得到提升。