以语音识别为基础的各种应用,由于准确率技术上的突破,结合大数据库应用,已成为目前金融,保险,政府及个大企业的关注重点。新应用利用语音转文字及文本分析系统,自动检测通话或录音中的关键词、敏感词,实现百分之百的质检,同时对内容进行逻辑分析,了解客户需求及提供更高服务品质。除离线分析外,更可以进行实时监控、提供及时处理方式的业务应用。 近年来在国内市场需求快速扩张。在政府监管方面,保监会对于误导式电话行销的管理从严,要求全面质检并鼓励以语音识别为基础的质检方法,带领风气之先(保监会40号文:鼓励保险公司通过技术手段实现系统信息化质检,如语音识别、关键字、音调时长等新技术进行系统化质检)。 在政府服务方面,以舆情分析,热点关注为主,对于市民或客户的来电进行原因分析,提高首次解决成功率,增加市民或客户的满意度,改善政府形象。在企业应用方面,除全面质检外,还以提高销售业绩及改善服务品质为主。
普强信息技术专注于语音识别及文本分析系统开发,结合最先进的识别技术及分析理论,推出全套解决方案,为行业内的技术领头羊之一。本文介绍语音识别的基础理论、实际案例,与读者们共同分享,并作为企业调研报告参考采用。
语音识别是一种概率学的应用
语音识别(Automatic Speech Recognition, ASR) 的基础技术包括特征提取、模式匹配及模型训练三个方面。利用声音的特征比对,收集语料,建立对比词库,按使用者的语音输入,分析输入的声音特征,比对现有的语料库,找到最可能的词句。所以语音识别应用是一种概率学的应用,是比对分析,而不是单纯语音翻译。
进阶应用:语音转文字
在实际应用中,语音识别应用以语音转文字为主(Speech to Text, STT),即大词库连续性语音识别(Large Vocabulary Continuous Speech Recognition,LVCSR),是指针对连续性的语音输入进行识别,将其由语音翻转成文字形式存储。常见的应用为智能手机上的语音发短信及编写文件时的语音输入法。实际上仍是词库比对,而不是真正意义上的翻译。只能称为语音转文字,而不能称为语音翻译文字。
在语音转文字的应用中,需要按用户的常用词句及话术,建立特定的比对大词库。标准的做法,是根据相关的录音,进行人工标示,即人工记录所听到的录音结果。当累积足够的词库(基本为300小时录音),即形成比对词库。以此为主要比对依据,辅助以行业专业术语、企业产品说明及服务话术内容,即可形成音转字的应用。
通常的单字准确率在电话信道中可以达到70%以上,而关键字的准确率更可高达85%以上。由于是词库比对,所以不同的行业,使用不同的比对词库。发散式天马行空的聊天对话,准确度只能达到30%左右,无实际价值。
在实际应用中,除识别引擎及分析系统外,专业的咨询顾问以导入合适的企业应用是非常的重要。与国内外厂商相比,我司极大的优势之一,是拥有由多年呼叫中心工作经验的专家们所组成的专业咨询团队及完整的分析设备及工具,能协助客户量身定做,按产品及服务内容的变化,提供最合适的应用,以保障企业最高的投资报酬率!
应用案例-邀约话术分析
在本案例中,我们的企业客户为高端教育培训公司,提供1对1的个人辅导,强调学生的全面发展,包括学业,个性,爱好等等。属于长期性的高端服务。潜在客户为具一定经济能力的学生家庭,名单有限而且常需要多次访谈方能成功。该企业的市场总监,每天关心的重点是业绩提高,而业绩的提高与名单及话术成正比。在本案例中,由于名单特殊性及有限性,改善空间不大。所以我们以语音识别应用于话术改善,在有限的投入下,快速的提高邀约业绩。
在进行标音,建立对比词库后,我们将呼叫中心坐席与潜在客户间的录音,转写为文字,以我们的语义分析系统,将通话内容分类为下列四个重点:
建立关系,包括:礼貌用词,建立谈话和谐气氛,促发客户自尊心。
促发需求,包括:了解客户实际需求,说明培训对学生的好处。
提供方案,包括:培训内容说明,同类服务对比,相关法规说明。
异议处理,包括:客户挽留话术,建立下次回访机会。
按照上述重点,我们定义相对应主题,包括合适问候语,孩子成绩分析,适当赞美,介绍专业教育资质,提供免费答疑服务等等,进行分类统计,判断和成功邀约的关联性,以进行话术分析改善,分析结果如下: