全球知名语音学术大会INTERSPEECH2019于9月15日至19日在奥地利格拉茨城市举行。
作为全球智能语音及AI数据发展的推动者,标贝科技受邀成为大会黄金级赞助厂商亮相现场。其中,由标贝语音团队撰写的《A Mandarin Prosodic Boundary Prediction Model Based on Multi-Task Learning》论文成功入选会议,并在现场向来自全球的语音科研机构及企业厂商展现标贝语音科研创新及产品动态。
全球语音交流协会INTERSPEECH是世界上规模最大、内容最全面的语音会议。今年恰逢INTERSPEECH成功举办20周年,会议以“Crossroads of Speech and Language”为主题,意在探讨语言多样性、应用多样性以及表达方式多样性,吸引了来自世界各地的近2000名科研学者及企业厂商代表。
历届INTERSPEECH会收到来自全球上千家科研机构及企业厂商投稿,而最终入选的数量却十分有限。缘由国际权威评委的严格标准。本次标贝论文入选大会,体现了中国AI语音厂商在国际语音领域的不俗实力。该论文提出了一种基于多任务学习(MTL)架构的中文普通话韵律边界预测模型。研究结论表明,该模型有效地解决了普通话韵律边界预测的任务,整体预测性能提高了0.8%,模型尺寸减小了约55%。对语音行业研究中文普通话语音合成效果质量提升提供了一定的研究参考价值。
据了解,标贝科技语音及数据核心团队人员拥有超过15年行业经验,拥有业内领先的语音合成技术及数据方案能力,为全球客户提供高品质、多类别、多场景的语音合成方案,以及高质量、安全与多语种为特点的数据服务。截至目前,标贝科技已为微软、百度、阿里、腾讯、字节跳动等海内外100余家企业客户提供服务,项目累计超过300项,涵盖汽车、教育、客服、零售、阅读、智能硬件等应用领域。
标贝科技自成立以来,把AI技术创新放在首位,以“语音连接场景、数据服务技术为理念”,在技术、数据及应用三端不断创新,确保在语音和数据领域的领先地位。
例如,在语音合成方面上,标贝基于Attention机制的深度神经网络技术,充分利用文本数据,构建前端模块、选择合适的声码器,降低运算量,创新语音合成模型,提升语音合成质量效果,并匹配场景应用。以出色的语音技术实力、场景连接能力,赢得客户信任与认可。此外,标贝还自主创新研发TTS评测系统,从前/后端为行业提供评测标准指南,提升语音评测质量整体发展。
同时,在高校科研合作方面,标贝与北京大学、西北工业大学、新加坡国立大学等国际高校建立合作关系,以此获得强有力的产研力量支持。
本届INTERSPEECH2019,标贝科技收获了海外多个地区科研机构和海外客户对标贝自有语音合成方案的认可。未来,标贝科技将与更多科研高校、企业厂商保持紧密的交流合作,携手共同推动语音产业的发展。
完整版论文链接:
https://www.isca-speech.org/archive/Interspeech_2019/pdfs/1400.pdf