云视频技术让机器人更具有娱乐性让机器人更融
目前市面上已经有不少陪伴机器人产品,主要针对老人或孩子,不管是让机器人提醒老人吃药,还是让机器人陪伴孩子学习,很多机器人企业已经在机器人功能的打造上投入了大量的资金。
但是目前面临的问题是,陪伴机器人与用户之间缺少粘性,很多用户使用机器人之后,基本上让机器人放置在家里吃灰,对机器人企业而言,这是非常实质性的问题。
或许是因为机器人的功能没有做到位,也有可能是这些功能本身不具备跟用户之间产生使用粘性。
例如在智能手机出现之前,人们对手机的依赖不是很强烈,但是自从智能手机出现后,人们对手机的依赖是非常强烈的,这都要归功于微信、爱奇艺、优酷等各类应用软件,现在人们在手机上使用这些软件的次数是最多的,而这些软件基本上都具备社交娱乐的属性。
如果手机植入社交娱乐元素后,能够让用户产生这么强烈的依赖感,那让陪伴机器人产品也植入相似的社交娱乐元素将会有怎样的变化?
在这次1号机器人网研讨会上,经过众多主流企业的探讨,我们认为视频直播将会在陪伴机器人身上有所造诣。
现在市面上很多陪伴机器人产品都具备视频通话的能力,借助视频通话的技术,我们可以让机器人监控家里的环境,以及呵护老人或孩子的安全问题,另外在商业应用上,机器人无法回答的问题,也可以转接人工视频通话处理。
当然,现在视频通话属于陪伴机器人身上的小功能,从视频通话技术上,我们还可以延伸出很多玩法。
深圳市即构科技有限公司(以下简称:即构科技)资深架构师冼牛说:“从技术角度上去讲,视频直播技术可以在机器人身上得到应用,现在欧美提倡的小班课,可以通过视频直播很好的架构起线上线下一体课堂,学生在这个课堂里可以有更多人的围观以及互动。”
“陪伴机器人本身就是为孩子贴身打造的教育流量入口,对于课堂直播、在线课堂等都是十分好的产品形态。”
广东沃盛教育科技有限公司(以下简称:沃盛教育)产品总监何进伟说:“我们下一代产品就是往这方向规划,即将推出的下一代机器人产品自带8寸屏,我们会更好的发挥屏幕的作用,除了监护、课程学习等功能外,我们还会跟国内的教育机构合作(如:乐思塾),通过陪伴机器人,家长也能够看到孩子在课堂上的学习情况,以及课堂的学习氛围情况。”
当然,这些功能还不足以让用户对机器人产品产生使用粘性,所以我们还需要更进一步。
比如孩子可以通过陪伴机器人录一段唱歌或跳舞的短视频发布到微信朋友圈或脸书,吸引更多人关注自己。
冼牛说:“从技术的角度去讲,这些功能的实现不具有技术难度,或者可以让陪伴机器人更具有可玩性,例如在直播的画面上集成合成音,可以让直播视频里人的说话声变声,像美声或怪声,也可以把直播中的我变成熊或狗,让我模拟熊或狗的样子给孩子讲故事,让孩子觉得更好玩。”
“只有让孩子与机器人玩的过程中,参与进来,让画面变得可操作,如在线课堂上把老师或其他学生变成动物,而且有更多人的参与围观,这样孩子上课就会觉得非常有趣。”
何进伟说:“引着这个思路,那接下来让孩子们互发信息,通过机器人发送可以是一条短视频,而不再是一段语音。”
深圳市狗尾草智能科技有限公司(以下简称:狗尾草)联合创始人张博说:“直播在机器人身上可能会有很多的延伸应用,如果在画面上可以把人变成动物,那是否也可以把某人变成特朗普在那里说话?”
冼牛说:“从技术上是显得通的,主要是声纹的辨别,只要有其他机构能够辨别声纹,而且让人能够分不出真假,我们只要开放接口,提供原始的视频云数据,然后就可以接入各种模块,你想变成谁在讲话,或者植入各种道具,如:帽子、胡子、美颜效果等都是可行的,我们现在提供给映客直播、花椒直播等就是这套方案。”
通过这次1号机器人网研讨会,我们认为视频直播技术可以在机器人领域得到广泛应用,只不过相关的业务模式探索上,还需要进一步的沟通。
按照目前的技术发展速度,现在越来越多的新技术正在走向相互应用,视频直播也在向视频AI方向跨度,当然这个方向存在太多的未知应用,在这里先不做深入的探索。
视频AI将会与机器人大脑紧密相连,所以接下来我们把目光转向语音语义的发展方向上,要说机器人大脑就会包含语音和语义。
在语义的发展方向上,百度自然语言处理部资深研发工程师凌光说:“现在语义发展会存在两个方向:一个是闲聊式,另一个是任务式。闲聊式的人机对话,通过百度的大数据可以支撑人们与机器人闲聊对话,但是它相当长的时间里很难会有所突破,而任务式的人机对话,相当于要在一个专业的领域里深耕,让机器人可以与人在这个领域深度的互动,但是把产品做好需要投入巨大的资金。”
“在任务式对话中,不管是百度的UINT、苹果的Siri、还是谷歌的语音助手,所使用的技术都是大同小异,不管是哪一家,在任意行业做好深度的深层次互动对话,都需要投入大量的时间,如知识库的建立,解析意图,训练模型等,这一过程都要投入较多的人力和资金。”
这也意味着,针对机器人行业,百度更多的是提供通用语义,在特定语义方向,百度是不会涉足,因为投入是巨大的,这也给机器人企业和语义公司提供了一个方向,要想在语义方向有所建树,必须要往特定领域去精耕,这是目前的机器人产品所需要的,也是BAT等企业不愿意涉足的。
在语音的发展方向上,苏州思必驰信息科技有限公司(以下简称:思必驰)技术顾问甘楚辉说:“目前语音在识别的速度上已经得到提升,之前1秒识别7个文字左右,现在1秒能够识别十多个字,接下来的发展方向是中文、英文,以及其它语言,可以通过一个引擎识别出来。”
“再往下发展就是通过识别你说的话,能够知道你这个人的画像,以及大概的年龄和性别。而这些技术在今年Q3季度,我们会展示出来。”
目前看来声纹技术要比视觉技术发展的更快,现在通过声纹技术也能够识别人讲话时候的情绪。
再回到视频AI技术的方向上,以后视频AI发展会与机器人大脑变得更加的紧密,举一个场景例子来讲,当我们在商场闲逛的时候,我们可以对着手机或附近的机器人说一声,“我要吃披萨,”手机或者机器人会调出附近所有披萨店的动态图,以及评价和路线等,凌光说:“这样的应用场景,未来三年是能够落地的。”
最后再回到我们的视频直播技术上,视频直播将会是陪伴机器人身上必配的技术,因为陪伴机器人后续发展,视频直播将会是过渡的应用技术,你还可以通过视频直播技术开发出更多的应用,这篇文章中谈到的应用场景还只是皮毛,视频直播技术可以作为一项基础技术,后续发展可以为陪伴机器人打开更广阔的应用大门。