近日,捷通华声推出搭载最新引擎的灵云语音合成技术,声线细腻、情感丰富、语速真实。得益于核心引擎的深度学习化与高音质声码器,最新灵云语音合成技术的合成效果得到全面提升。
强劲文本处理技术
带来前所未有的语音合成体验
新版灵云语音合成技术采用一体化智能文本分析算法,结合统计和规则等处理手段,让文本处理前端拥有强大的分词、多音字、韵律环境预测能力,使合成的语音听起来更加符合人类发音习惯和说话节奏。它还具备自动识别和处理日期时间、数值金额、电话号码等文本的能力,使得数字发音更自然,“年月日元”、“百分之”、“点”等分词朗读时的发音也更加顺畅。
升级后的语音合成技术在各项指标上都达到了历史新高。测评人员给出的MOS值达4.5分,属行业领先。
注:MOS(Mean Opinion Score),平均主观意见分。在国际标准中,统一使用MOS值来评价系统接收到的话音质量。(满分5分)
合成速度方面,灵云语音合成技术同样毫不逊色。从实际体验来说,用户几乎感受不到任何等待时间,语音合成从点击“播放”开始即刻完成。
为了在各个专业领域都能够有良好稳定的语音合成表现,满足不同行业的特殊需求,灵云语音合成针对特定词汇和语句进行个性化定制,通过用户词表、定制录音以及调整判断规则等方法,提高读音、读法和韵律的准确性。经过十多年不同行业的实践经验,捷通华声积累了大量的专业领域词库、预选音库,可为金融证券、天气预报、体育赛事、公交汽运、航空、税务、POI、排队叫号等众多领域提供更专业的语音合成播报,客户能够快速、轻松定制与自己产品属性、形象相匹配的声音,为产品赋能。
多种产品形态,满足不同需求
为满足各种应用场景对语音合成的需求,捷通华声推出了完善的语音合成产品体系:
a.由灵云公有云平台提供灵云语音合成能力
针对手机app、智能手表、智能机器人等产品,开发者可通过从云端调用能力的方式,搭建轻量化终端。
捷通华声开发的手机app“维汉友谊桥”,能够使用灵云语音合成技术,将翻译前后文本框内的文字用语音播报出来。
b.基于windows系统的灵云语音合成软件
车站、医院、广播站的语音播报,可以直接使用安装在电脑上的灵云语音合成软件,一键播放。
全国大多数高铁站、北京奥运会,上海世博会均采用灵云语音合成技术进行播报。
c.私有化部署的灵云语音合成能力平台
在客服中心、呼叫中心等场景,用电话机器人来服务海量用户,需要高并发的语音合成能力。捷通华声提供可私有云部署的语音合成能力平台,与客户IVR系统对接,提供稳定高效的语音合成服务。
以唯品会为例,面对快递催件、退换货、优惠活动、密码找回等等问题,用户拨打客服热线。灵云智能语音导航系统应用灵云智能语音合成技术,用亲切礼貌地态度引导用户直接说出想要查询或办理的事情,一语直达业务节点,为用户创造了良好的服务体验。
多语种,多音色合成
灵云语音合成技术拥有包含多国语种的音库,持普通话、英语、维语、粤语等20多个语种的语言合成,配合捷通华声的语音识别和机器翻译技术,能够实现多国语音面对面翻译。
音色方面,除了提供男声、女声、童声等基础音色库外,还有更多个性化、饱含情感的音色,包括柔美动听、干净利落、甜美可爱、纯真自然、成熟稳重、热情洋溢、措辞严厉等等,可为各种应用场景提供合适的声音,全面满足企业个性化需求。例如,银行的智能客服需要温柔动听的声音,从而给客户良好的服务体验,而金融行业的欠款催收场景,则需要选择相对严厉的声音,起到警示和催促的作用。
自从2001年在国内率先推出面向市场的语音合成技术以来,捷通华声已广泛服务金融、电信、能源、交通、教育、司法、公安、医疗、互联网等各领域,并出口美国、法国、西班牙、日本、韩国、新加坡等国家。捷通华声愿携手更多产业伙伴,为软件开发商、系统集成商、解决方案供应商等合作伙伴提供优质的产品和全面的技术支持,让更多的企业及个人享受到智能语音合成为生活带来的便利体验。