语音合成(Text To Speech)已经在可懂度、自然度等方面取得了较好的效果,被广泛应用于银行叫号、机场广播、地图导航等多个领域。而人的语音交流不仅包含着基本的文字信息,还承载着大量丰富的情感信息,这就对语音合成提出了更高的要求。
极限元专门从事智能语音技术,拥有完全自主知识产权。其语音合成采用世界先进的数据驱动技术,利用精心设计的语音语料库进行声学模型和文本处理模型的训练,得到的模型深度挖掘了语音语言特性,从而能够合成接近真人发音的语音,合成的语音清晰、自然、亲切、具有高表现力。
韵律是合成语音是否具有高自然度的关键所在。极限元语音合成对输入文本进行韵律分析预测,其中包括韵律词、韵律短语边界划分,词重音的分布,各个语音单元的基频、时长等。这样合成的语音清晰明朗,亲切自然,接近真人发音。目前,极限元已为百度、腾讯、搜狗、奇虎360等众多客户服务,建立了长期稳定的合作关系。
极限元语音合成技术,合成语音效果媲美真人发声,专业MOS分可达4.0,为了市场发展需要,极限元的语音合成技术全面支持多方言、多语种、多音色的选择,目前标配的有甜美女生和浑厚男生,针对用户的不同应用场景和个性化的音色需求,提供全方位的语音合成定制化服务,例如:明星的声音、儿童的声音以及某个地区方言。
极限元语音合成定制化支持录音人选型、录音采集、语料标注,还能实现模型迭代训练、合成引擎优化,支持在线、离线模式,适用于多种平台,可应用于多个领域。如:
呼叫中心行业中的应用
拥有大量客户群体的行业呼叫中心,如电信、银行、证券、保险、房地产、家电、运输、互联网、公共服务机构,语音合成技术能够以有限的资源占用,将文字信息转化成连续语音,合成语音自然、流畅。对于呼叫中心而言,无需对大量的信息进行录音,极大地节省了工作量和存储空间,同时根据呼叫中心需求,语音合成技术还能提供个性化语音合成服务,为呼叫中心提供高质量的服务需求。
车载导航上的应用
智能化、人性化的车载导航已经成为一个重要的发展趋势,车载导航产品中的语音输出用合成技术将需要同用户交互的信息转化成语音,如:道路信息,驾驶导航信息,POI信息,实时路况等,使用户通过语音获取信息,方便驾驶员解放双手和眼睛,同时提高驾驶安全性。
智能机器人的应用
银行、医院、教育等行业的商用机器人逐渐成熟,极限元语音合成可以为机器人合成个性化语音,比如银行、医院的机器人语音需要甜美亲切的,而教育行业主要针对孩子的,机器人的语音需要呆萌可爱的童音。
智能家居的应用
在家居场景中,主要围绕着智能电视、智能音箱展开,解决用户需求,如搜索影片、歌曲、简单交互、应用调取等,极限元语音合成定制化能够根据用户需求,定制合成语音,如明星的声音。
极限元语音合成已达到流畅、连贯、自然、逼近真人发声的语音合成效果,无论是地图导航、机场广播的甜美女生,新闻朗读的浑厚男生,还是机器人的可爱童声,极限元的语音合成技术能够满足企业需求,实现个性化高端定制,让大家听到机器的声音娓娓动听,让未来交互场景更加丰富、个性化。