一、呼叫中心自助语音系统的起源与现状
呼叫中心是基于现代通讯技术来处理大量各种不同的电话呼入和呼出业务与服务的系统。其最初的模型是基于PSTN的呼叫中心,是最早发展起来的呼叫中心,简称CC(Ca11Center),业务代表通过接听电话为客户提供信息服务,此时尚未与Internet网络集成在一起,由专业的话务员根据自己的经验和记忆力为打入电话的顾客进行咨询服务,由于是凭人工记忆,信息容量有限,服务能力也无法提高。为了使电话系统为用户提供更好的服务,CTI技术应孕而生。
CTI技术是指计算机电信集成(Computer Telecommunication Integration)技术,将计算机技术应用到电话系统中,能够自动地对电话中的指令信息进行识别处理,通过建立有关的话路连接而向用户传送预定的文件、转接电话,并且能够处理传真、电子邮件等其它形式的信息媒体。
现代的呼叫中心应用了CTI技术,通过相关的软件处理使计算机也能够处理电话的声音及有关的信令信息,也可以提供自动语音应答(IVR)、自动呼叫转移(ACD)、语音信箱等业务功能。这其中IVR(Interaction Voice Response,交互式语音应答)是呼叫中心产品链的重要组成部分,实现了呼叫中心的7*24小时服务,为企业处理大量的日常业务。
客户通过按键或语音选择来输入相关信息,在允许范围内访问各类企业数据库(通过ODBC),自助得到多种服务,令业务代表有更多的时间服务于有特别要求的顾客。IVR的文本与语音合成(Text-to-speech Synthesis)技术以事先录制好的清晰的声音为客户服务,同时也可根据服务地区用不同语言播放语音提示或咨询信息,但这种通过电话按键进行交互的自动呼叫系统在一次服务中客户往往需要反复选择按键多次,十分不便,如果可以采用自动语音识别方式将用户的语音直接转换成计算机能自动处理的文本信息则可以令呼叫中心的服务更加自动化、人性化。特别是在如今人工智能高速发展,在Torque和小冰、小娜、siri等智能机器人相继出现的情况下,我们的电话银行自助语音系统是否可以再进一步发展?
二、ASP技术介绍
自动语音识别(Automatic Speech Recognition,简称ASR)系统是一种可以识别讲话者语音的软件系统,通过语音信号处理和模式识别而将语音信号转变为相应的文本,其目的是让计算机自动识别和理解人类口诉的语言。
识别的原理:语音输入后首先进行语音识别,包括对单词(句)、音节和音素等的选取,进行特征提取,去除语音中对识别无关紧要的冗余信息,对确认的语音特征进行模拟训练,建立语音识别所需的模板。而计算机要根据语音识别的模型将计算机中存放的语音模板与待识别的语音信号进行比较、匹配,找出最优的与输入语音匹配的模板。然后根据此模板的定义就可以给出计算机的识别结果(如图1)。
图1 语音识别流程
随着社会的进步,人工智能(Artificial Intelligence)的理论和技术日益成熟,应用领域也不断扩大,可以设想未来人工智能带来的科技产品将会是人类智慧的容器”。
2009 年时 Google 便已经利用语音识别技术在 YouTube上提供实时的自动字幕(Automatic Captions)”功能,让客户可以在避免干扰到他人的前提上在不开启喇叭的状况下观赏网络上各种影片内容,YouTube则利用Google的自动语音识别技术(ASR)给YouTube视频加入字幕。
而在国内,支付宝中引入的语音机器人并非简单地通过语音识别搜索商品或信息,而是进化到深层次语义理解的层面,能够一步处理多层维度的信息。比如在支付宝上方搜索栏点击右侧的小话筒图标启动智能语音机器人,发起向某朋友转账1000元的语音指令,其中包含的朋友名字对应的账户、转账功能、金额1000元”三个信息要素,能够在不足一秒即刻直接跳转至最终功能页,只需要点击转账确认、输入密码即可完成,而以往则需要用户分四步操作近10秒才能到达上述环节。
三、ASP技术是否可以应用于呼叫中心自助语音系统?
1、ASP技术与传统自助语音结合的必要性
案例一:
电影《Her》中,男主角Theodore在情感低落期爱上了操作系统萨曼莎,其实Theodore会喜欢上操作系统一点儿也不奇怪,试想这世界突然有这么一个它”是专属的、私密的、忠诚的,让你能放下防备,毫无负担地袒露脆弱、孤独和彷徨,而这个它”又如此聪慧地理解你的喜怒哀乐,恰如其分地安慰你、鼓励你、满足你。如果呼叫中心是那个它”,你是否会接受它”的陪伴?但实际上在和Theodore沟通的同时萨曼莎总共有8316位人类交互对象,而且与其中的641位发生了爱情,而Theodore只是其中一位。试想如果是萨曼莎是一个人,那她只能为一人服务,但是萨曼莎是操作系统,这恰好反映了计算机的强大、反应迅速,如同呼叫中心,一位人工座席只能为一位客户提供服务,而如果是完善的电话银行语音系统却可以同时向大量客户提供更多的服务。
案例二:
笔者所在的运营小组曾经对七个工作日的全组接听量13440通电话进行电话银行信用卡客户业务偏好分析,结果显示大量的信用卡客户通过电话银行主要办理查还款金额、调额、查可用额度和办理分期付款业务(如表1)。
表1 电话银行信用卡业务列表
但这些业务真的必要通过人工座席查询、办理吗?是否可以通过电话银行语音系统自助办理?
呼叫中心作为企业与客户的纽带,建立功能完善的呼叫中心是增强企业竞争力的重要手段之一。
在呼叫中心将ASR技术应用于自助语音,实现了具有语音识别功能的IVR系统,通过直接的语言输入就可以操作计算机系统,该技术不仅不会受到电话机按键的限制,简化了客户操作;同时还可以使IVR流程的功能大大增强,从而扩大传统IVR的使用范围。
电话接通后系统自动播放提示音,客户根据提示音作出相应回答即可,系统记录客户语音,交由自动语音识别软件处理,通过数据库信息比对之后,系统自动输出确认信息。例如客户需要对20161215消费5000元进行分期付款一年期,按照现在的电话银行业务处理仅可以通过人工服务办理。客户拨通电话后通过自助语音系统输入证件号码/卡号+密码,通过层层语音菜单报读后选择分期付款人工服务,此阶段将近2分钟,进入人工服务后业务代表根据流程办理分期付款,此阶段大约需要3分钟,整个分期付款过程需要耗时5分钟左右。而对于应用ASR技术的自助语音,IVR系统可以达到直接办理分期付款的功能,客户可以在拨通电话后口诉需求:20161215消费1000元分期付款一年,经过模版库匹配后语音自动进行身份核实,为客户办理此笔交易的分期付款。整个业务办理过程简单明了,并且计算机也可以同时为多位客户办理不同业务。
通过语音来输入用户请求,实现用户与系统的互动,将语音识别技术运用到IVR系统中,这无疑将大大提高IVR系统对于呼叫中心的作用,更加坚定了呼叫中心在企业中的价值。
2、ASP技术与传统自助语音结合的优势
反应迅速:根据苹果siri、微软Cortana的表现显示语音输入后会在秒级得到响应,这种速度远远超过人工客服,应用ASR技术的电话银行自助语音完全能够代替一部分人的功能或者提高人的效率,提高呼叫中心工作效率,并且可以给用户带来良好的使用体验。
成本更低:现在呼叫中心的运营成本一般包括人力成本、场地成本、IT成本等,其中人力成本的占比最大,高达75%,在呼叫中心的运营过程中如何控制”人的支出成为了关键,但实际上如果实现更加便捷的自助语音服务自然就可以降低人力成本,同时也可以为人工客服带来更多分流,缓解呼叫中心流失率较大的尴尬。
改变习惯:现在很多客户在拨通客服电话后会直接选择人工服务,甚至在语音提示人工座席忙时仍一直等待接通人工,而客户愿意等待人工服务的原因大多是因为主观地认为自助服务无法解决问题,如果电话银行语音系统能够优化到能更加快捷地解决问题,那么客户也会通过优化后的语音来办理业务,从而改变自己的行为习惯
业务拓展:现在的电话银行人工一般受理咨询、查询、业务办理、投诉、建议等,而语音系统仅能受理简单的咨询、查询,如果利用优化后的语音系统可以受理更多业务如大量咨询、查询,简单的业务办理等,未来的电话银行自助语音系统将可以独立完成业务办理。
3、面临的问题
(1)应用ASR的自助语音系统后在语音中可以进行相关知识匹配,进行业务处理,但这一切需要对应一个强大的模版库以及细化后的专业知识,那么前期的知识整理工作将会非常繁重。
(2)根据呼叫中心服务地区的不同,客户的意图分类以及关键词的设定及语音识别单元的整个选取过程较为复杂。
(3)随着企业长期运营,知识的新增、变更以及过期删除都需要投入大量的人力维护以确保提供知识的准确有效性。
4、未来的展望
改善服务,改善经营,使呼叫中心服务质量和利润双双上升,可以说这样一个新的完整的呼叫中心已为电子商务构架了完美的模式,它将肯定会成为电子商务的主题、平台、核心和灵魂。
ASR技术与呼叫中心的结合以及语音数据、视频信号的多媒体技术的集成将使呼叫中心在功能上有一个飞跃,创造出不同新概念、新功能的呼叫中心,使它在未来信息通信领域中将占有越来越重要的地位,这些新模式的呼叫中心将会成为电子商务的主体和新的平台,这些全新概念的呼叫中心将成为未来电子商务的核心和灵魂。