:近日消息,国内人工智能领军企业——搜狗公司,继推出智能语音交互引擎“知音”后,又推出车载语音解决方案,该技术运用搜狗自有的语音识别、语音合成和语义理解技术,真正做到了解放双手和双眼,实现全语音交互的驾驶场景,让用户感受到人工智能的魅力。
据了解,凭借搜狗大数据、智能语音优势,搜狗车载语音解决方案能够实现在车内通过自然语音交互拨打电话、发短信、实时天气查询、实时股票行情查询、歌曲查找与播放、新闻查询与推荐、导航信息查询、火车票信息查询、聊天小助手等功能。
首先,优质的数据训练量给搜狗语音带来了领先行业的语音识别技术。搜狗语音拥有互联网规模最大的语音数据。数据显示,搜狗输入法日均语音输入的请求次数超过1.9亿次,是中国语音输入功能使用量最大的移动手机产品。因此在获得真实用户语音语料方面,尤其是噪音环境和口音,搜狗具有很大优势。而此次搜狗针对在车载场景做了独特的优化,针对POI专门优化后识别正确率达99%,通过定向MIC,有效降低周围干扰,识别效果接近安静环境,且拥有回声消除、支持语音打断等优势。
其次,准确的语义理解和复杂的多轮交互,需要应用深度学习为基础的人工智能技术,这正是像搜狗这样的互联网公司尤其是搜索公司擅长的地方。搜狗具有输入法、网页搜索,各类垂搜以及搜狗地图等产品,这些都是单一的语音厂商不具备的。搜狗的车载语音解决方案不仅能够在语音交互的过程中支持用户修正错误的识别结果,同时能够结合地图的结构化数据做与用户的多轮对话,用更自然并且用户更容易接受和理解的方式进行交互。在明确用户语音下达的指令需求后,能够反馈和提供适合用户的服务。比如用户说我要去首都机场,它会问T1还是T2,当用户确定航站楼后,它会问是出发还是接人。
最后,搜狗车载语音解决方案在满足用户基本需求的同时,还能够通过数据能力进行推荐,产生更多惊喜和更好的服务,这决定着人机交互的智能化程度。在车载场景的语义理解中,用户的需求是多样的,不仅仅是既定的地图导航,还包括更具个性化的音乐、新闻等服务,这需要构建完整的用户需求画像。而搜狗从输入法、浏览器、网址导航、搜索等产品中已经积累了一个庞大的用户体系,在用户需求挖掘上显然更具有优势。
此次,搜狗通过多年的数据积累以及强大的语音技术,同时和地图以及周边服务进行深度的整合后推出的车载环境下的全套语音解决方案,让用户动动手指即可获取服务,极大的提高了用户体验和驾驶安全。而与第三方外部合作的展开,包括车载导航、智能家电、VR以及智能手表等智能穿戴设备,也让搜狗语音步入更大的服务空间,成为车联网、物联网以及人工智能的入口。据透露,目前搜狗与四维图新、飞歌的合作已经全面展开,双方联合推出的搭载了搜狗语音技术的趣驾行车助手也即将上市。