编者按:回顾2013,智能语音热潮整整嗨了一整年,最终以工信部牵头主办的中国语音产业联盟年会为此画上了一个圆满的句号。然而2014年国内整个语音产业开局却显疲软,热度呈下滑趋势,而智能图像、人工智能等新概念却逐渐兴起,为何?
一波三折的“智能语音”热
早在2013年底中国语音产业联盟年会上,北大信息技术学院智能科学系副主任吴玺宏教授就已抛出了“随意说”一词,他说:“现在的语音识别是否能在噪音环境中优先识别人声?是否真正能达到语义理解?……”并且着重强调产业界切勿过早过度宣传“语音识别”准确率、“语义理解”等大词,这容易拉高用户的期望值,其实对产业的发展有阻碍作用。而清华大学郑方博士也对北大观点给予了支持,表示产业界切勿过早热炒“语义理解”等热词,在语音热潮背后更需务实,技术与宣传应保持一致;同时也建议政府多多支持中小型创新企业,强调好点子多来自中小型公司,对于中小型企业而言没有创新突破就意味着马上被市场淘汰,生存就是一个很大的问题,而大公司可能更多地需要照顾整体发展,创新进度相比之下较慢于中小型企业。此外,也希望加强学院与产业的合作,政府给予支持,以此吸引流失在外的尖端科技人才回归祖国。
果不其然,一语成谶,一大批新兴智能语音技术公司拔地而起,拥挤进智能语音圈,百度、腾讯、谷歌、微软等大公司也纷纷进入这一领域,整体看上去一片大好的景象,然而实际情况却不容乐观。从用户的使用率和体验评价可以看出,大多数移动端和其它硬件上的智能语音交互功能基本还是一个你有我也有的“摆饰”,就连最着名的苹果Siri的使用率也低至15.2%。
进入2014年后,随着人工智能概念的崛起,语音热潮暂时脱离了大众和媒体的关注视野,这股热潮也随之“又”再次落去--之所以说“又”,是因为智能语音热潮早在几年前就已经历了几次起起落落,因此有专家笑称“智能语音五年火一次,经历着‘热一阵、死一阵’的轮回。”
追其原因,高AI智能语音的实现还是一个任重而道远的梦想,除了用户数据积累等技术因素,语音识别率、用户习惯与对智能语音单方面的理解仍然是不得小视的问题。
那么,借鉴国内最高学府两位教授的劝言,国内又有多少企业接纳并实行了以上建议了呢?
“ASR+TTS”智能语音的完整组合
作为国内智能语音圈数一数二的语音技术服务商捷通华声在中国语音产业联盟年会结束后,审时度势,借助在京城中关村软件园的“地利”之势以及核心团队人员来自清华大学的“人和”关系,积极联动清华学府,并成功吸引清华大学注资捷通华声,成为第二大股东。更重要的是捷通华声得到了清华大学的长年积累研究的学术和技术支持,打通了国内产、学、研三派互通有无的“任督二脉”,也成就了“TTS+ASR”双剑合璧的灵云智能语音完美展现。