不管人类是否乐意,人工智能的车轮已经碾过来了。
智力游戏、国际象棋、围棋、德州扑克……人类逐步沦陷,从去年AlphaGo和李世乭对决前大众认为人类必赢的呼声,到如今围棋第一人柯洁迎战AlphaGo,却面临大众“机器必赢”的预测。而在关于“人工智能会取代人类吗?”的追问里,人工智能已经选择了下一个对手。
5 月 27 日至 28 日,由机器之心主办的 2017 全球机器智能峰会(GMIS)在北京举行,不但云集LSTM 之父Jürgen
Schmidhuber等人工智能业内大咖,分享主题演讲,还设置了各类展览。其中,搜狗汪仔机器人尤为引人注意。峰会期间,它不但在搜狗展位与不雅观众进行了亲密互动,还和人类顶尖速录员进行了一场“人机大战”。
比拟之前大多围绕基础速记展开的对战,这次的角逐难度飙升了数级,普通文章、专业词汇、方言口音、中英混合内容、绕口令,五项角逐内容,都是语音识别领域最难并吞的的技术点。晦涩难懂的专业术语,机器能懂吗?带有口音的港普机器能识别吗?两国语言混杂,机器又能反应过来吗?人类是在机器不擅长的领域寻求本身的优势。
随着峰会现场音频响起,大屏两侧实时出现了对战双方的转录文本。一边是人类速录员,正常打字速度,能到每分钟 220 字以上,一边是搜狗汪仔,背后语音识别技术加持,还能按照上下文意自动调整转化的内容。
普通内容的语音识别对于人机双方都并不难,人类和机器均快速准确地完成了速记任务。但从第二轮比拼开始,人类和机器就同时面临了艰巨的挑战,“解耦神经接口”“误差真值梯度”等难以理解的专业词汇,说话人的四川方言和港普口音,以及中文夹英文的说话方式,让速记难度飙升。中英混合的说话方式,对于机器的影响显然更大,最终机器以4: 1 战胜人类速记。
赛后,搜狗CEO王小川总结说:“AlphaGo2. 0 在围棋上战胜人类,让我们为技术发展而喜悦。但当我们回归真实的使用场景,,就会发现,今天的人工智能与我们抱负中还有差距,所以通过这次人机大战,我们会开始思考,在人工智能技术前沿,我们还有什么地方是做不到的,以及未来还有哪些突破的标的目的。”
实际上,这并非搜狗语音识别技术的首次公开表态。早在 2016 年 7 月,极客公园奇点大会上,搜狗语音就在演讲现场做了实时字幕上屏,演讲者语毕,不雅观众就能直接获得机器所做的速记稿。实际上更早之前,搜狗输入法中就落地了语音输入功能,语音输入日频次高达2. 4 亿次,识别速度达每分钟 400 字。
除大战之外,搜狗也应邀为此次大会提供了机器同传办事,当嘉宾进行演讲时,通过语音识别技术,机器将演讲者的语音转化为文字,同时,搜狗机器同传对内容进行翻译,投射在屏幕上。通过此项技术,即使不使用同传设备,中外嘉宾也能够无障碍理解嘉宾的演讲内容。
AlphaGo2. 0 引发的人机大战在围棋领域,然而我们更多的只是作为“吃瓜群众”感受到人工智能的威力,对它的应用场景却感知甚微。而汪仔引发的人机大战,背后则展示了搜狗在如今大火的语音识别领域的突破性成就。结合搜狗输入法这款国民级产品,搜狗不但实现了语音识别技术的落地与灵活使用,更在酝酿着人机交互方式的全新厘革。