近日,捷通华声宣布推出最新一代电信级灵云语音识别(ASR)平台级产品:jASR6.1版本,该产品可广泛用于呼叫中心、IVR导航、语音质检分析等需要用到语音识别技术的领域,全面覆盖企业级CTI应用。这预示着捷通华声将在提供语音合成(TTS)技术服务的基础上为CTI领域同时提供语音识别技术服务,满足广大CTI领域用户应用智能语音交互技术的需求。
近年来,智能语音交互技术在CTI领域得到了越来越广泛的应用,据TechNavio预测,从2014年开始全球自动语音识别市场将会以年复合增长率16.28%的惊人速度增长,这意味着语音识别技术已经被全球范围内的企业和用户接受,正在迅速从工具型应用走向成熟的商用领域。捷通华声在此时推出的灵云语音识别平台级产品恰好在两者之间搭建一座桥梁,助推语音识别技术在CTI领域的商业化进程。作为平台级产品,灵云语音识别(ASR)平台级产品具有功能强大、识别率高、识别速度快、SDK开发简单、开发包资源小等优势,能够实时、准确地对输入的语音进行识别。jASR6.1实现了本地版、网络版、负载版统一开发接口,使用户通过一个SDK包就可以调用不同的语音识别能力。
灵云语音识别(ASR)平台级产品全面支持捷通华声iSpeak语音识别系列引擎。iSpeak是捷通华声基于最新的DNN(深层神经网络)技术开发,具有高识别准确率、高识别速度、可定制模型、支持多种处理模式等特点。
捷通华声根据不同的用户需求将iSpeak语音识别系列引擎划分为三种:
1.iSpeak Freetalk(自由说引擎):自由说引擎又称“听写机”或“语音转写”,基本上不限定用户说话的范围、方式和内容。自由说引擎可以对整段或者是分段传入的音频进行识别,返回识别后的文本。
2.iSpeak KeywordSpot(关键词检出引擎):关键词检出引擎可以在连续语音流中检测出是否存在某些感兴趣的关键词。在使用时,需要事先给定一个关键词列表,系统则给出识别出的关键词在语音流中出现的位置。
3.iSpeak SpeechAnalysis(语音质检分析引擎):质检分析引擎在自由说引擎的基础上,加入了针对语音质检分析的一些额外的分析处理能力,包括话者分离、情绪检测、静音检测和语速检测等等。
上述三种引擎可以满足企业在呼叫中心、IVR导航和语音质检等系统应用的双向需求:企业既可以通过自助化语音服务进行有效的分流、缓解客服压力,也可以通过识别结果挖掘用户需求、完善客服质量,通过对内和对外协同作用实现企业的双丰收。
捷通华声作为国内最早提供智能语音技术服务的专业化厂商,捷通华声的灵云多语种语音合成(TTS)技术早已在金融、电信、交通、能源及CTI等领域大规模应用,在高铁、民航、医院等众多领域……捷通华声的灵云语音合成技术几乎无处不在,市场占有率达到50%,服务十三亿大众大十五年之久。十几年来,捷通华声始终坚持自主研究语音合成、语音识别等智能人机交互(HCI)技术,并不断在智能语音技术领域取得突破,在为CTI领域提供多方面的技术服务支持的同时,也为保证我国智能语音交互技术始终处于世界领先地位做出了重要贡献。
在清华大学的支持下,捷通华声开始全面实施“灵云科技 源自清华 服务全球“的战略规划,此次捷通华声推出的灵云语音识别平台级产品与灵云语音合成技术产品相辅相成,不仅为呼叫中心、IVR导航、语音质检分析等CTI领域系统应用提供智能语音交互全面解决方案,也代表智能语音机交互技术在我国CTI领域应用进入全面普及的阶段。