人工智能就可像人类大脑那样,不仅会计算、作曲,更可以驾车、写作、决策、鉴宝甚至社交。未来将是机器超人的时代。随着技术日趋城市,智能对话机器人技术将在政府网站,金融、游戏等各个行业应用大展拳脚。
“双胞胎报道”“悬浮照”“只有一张图的”,这些笑点再度集中置于公众面前,是因为始于3月底的政府网站全国普查。此次普查范围涵盖几万家政府网站,重点在其可用性、信息更新、互动回应等情况。
可问题来了,一边是在线解答各类与百姓生活息息相关的政务问题,体现政府网站服务性与生命力;一边是面对数以千计大同小异的提问,工作人员应接不暇、无力招架。
智能对话机器人技术的出现,就是为了解决此类问题,且其应用范围并不止于政府网站,金融、游戏等行业应用都是其用武之地。
试想,一个虚拟的客服,不但能分辨出你的真实需求,提供最为准确的解答,还能偶尔陪你插科打诨,这必将是又一个层面的人力解放,当然这也是呼叫中心从业人员的坏消息。
会思考会说话的“阿惹妞”
“您好!我是阿惹妞……期待与您互动,希望您对我的回答满意!”
“阿惹妞”,在彝语里特指“最小的表妹”或“幺表妹”,这是四川凉山彝族自治州政府网站问答机器人的自称,“她”负责政务知识问答板块,可以解答与保障房、残疾人证、户口、身份证、公积金贷款等政务服务相关的问题。
技术提供方中科汇联信息技术有限公司CEO胡绍武向记者演示了这一系统的使用,在网页对话框内键入“身份证丢失”时,系统会提示出很多有关可能的问题选项,如身份证使用周期,办理身份证的费用等。
回车后,阿惹妞直接告诉你:“参见《居民身份证补领办事指南规范》流程图”。这意味着,在提问者说出身份证丢失后,阿惹妞判断出其想要问补办事宜。然后她还细心地提供了下辖各县区补办流程的链接。
这一问一答,值得玩味,因为阿惹妞“思考”了。
“由于在电脑上语音输入不太方便,所以文字为主,而在手机端,就可以发挥语音的优势了。”胡绍武介绍说。
他掏出手机,打开APP,对着手机聊了起来,一个在导航软件里经常听到的女声,跟他聊了。二人的对话,包含怎么样办理户口等事宜,也包括“你是男是女?”“我是女生。”
这一问一答,值得细说,因为有很多关键的技术。
“首先,你说‘她’听,需要很好地解决语音识别技术。”胡绍武介绍,然后回答问题时机器人要把答案文字转换成语言播放出来,这需要语音合成技术。
而在这两者之间,还有一个更重要的因素。“语音变成了文字以后,机器必须要领会意图,即机器还要做语义的理解。”于是,语义解析就成为机器听懂与否的核心。这其中包含着诸多世界上最前沿的研究技术。
“有意思的是,中文是最复杂的语言,因此siri中文版等应用做得没有中国人好。中国人处理汉语语义上的优势,也是我们很快可以达到先进水平的原因之一。”胡绍武告诉记者,其公司与清华大学共建语音实验室,经过三年多的研发,研制的行业深度对话机器人已达到国内最高水平。
机器人的三个时代
机器人在中国大热。国家领导人在去年的两院院士大会讲话中提到,“机器人革命”有望成为“第三次工业革命”的一个切入点和重要增长点,将影响全球制造业格局,而且我国将成为全球最大的机器人市场。
按照不同产业与行业,机器人也可以看作有不同的“职业”,工业机器人、人形机器人、玩具机器人,种类繁多,就连汽车无人驾驶系统也是一类智能机器人。
中科汇联总裁游世学介绍说,我们研发的对话机器人主要服务于企业、政府和相关机构,回复客户的提问,降低人工劳动。从电子商务、保险到传统制造,甚至教育和游戏,其应用可延伸至很多产业,“需要有服务的地方,就可以有它的存在。”
不论被视作未来的魔鬼,还是现代化的帮手。机器人技术的研究和应用已从工业领域快速扩展到航空航天、国防军事、国家安全、医疗康复、社会服务等其他领域。
2013年,麦肯锡发布的《引领全球经济变革的颠覆性技术》报告预计,2025年机器人每年将为全球带来1.7万亿至4.5万亿美元的经济规模。
在游世学看来,机器人与人的关系可以分成三个阶段。第一个阶段是“机器 人”的时代。机器人此时只是工具的延伸,其价值是减少体力劳动,因此可称为“机器奴隶时代”。时间大约是2014年—2024年。
从2024年到2045年,是“类人机器人”的时代,客户服务人员、售货员、工厂工人等普通工作机器人大都可胜任,准确地说,机器人可以做得更好,因为这时机器人已经具备了推理处理等智慧能力。
第三阶段可能是我们不太想看到的。据未来学家雷蒙德·库兹韦尔预测,到2045年,“奇点”时刻到来,电脑所创造人工智能的数量将是当今存在所有人类智能数量的大约10亿倍。那样,人工智能就可像人类大脑那样,不仅会计算、作曲,更可以驾车、写作、决策、鉴宝甚至社交。“这将是机器超人的时代。”游世学说。
当然,这一进程中,有很多技术需要突破。有的注重机械关节对人类动作的完美模拟,有的则注重精密的机械制造,而中科汇联所关注的语义解析,旨在提高机器人的智力,甚至是为其注入灵魂。
让机器人自学成才
怎样让机器人自己学习?对话与搜索有区别吗?
如何让阿惹妞“自己”读过新政新规后,就能为凉山州百姓答疑释惑?
“我们的大脑存储了很多过往的经验、经历和知识。机器也一样,也要大量存储行业知识,以及日常沟通交流的生活常识。”游世学说,如何存储管理这些知识,是构建机器人知识库的新挑战。
中科汇联基于自主研发的语义理解、语义分析专利技术,实现了自然语言和结构化数据间的智能理解,“语义解析配套的知识图谱和知识库,有别于传统,我们是基于本体,基于语言和语言模型的体系去构建,当然还要兼顾语言语境的判断。”
游世学拿凉山州政府网站举例。他们事先将与保障房、残疾人证、户口、身份证、公积金贷款等政务服务相关的,两千个知识点梳理清楚,构建了独到的图谱和知识库。这样一来,只要提问触及某知识点,不论问话方式有多少种变化,对应的答案唯一。也因此,机器人就具备了判断能力。“这与搜索的区别是,搜索在输入关键词后,是提供无数个可能的答案让你挑,而我们的机器人是判断你的意图后,直接给你答案。”
基于深度神经网络的机器学习算法技术,他们在实验室内对人机对话的知识库进行模型训练,已经实现对话与问答准确度优化的目标。这意味着,一堆看似杂乱无章的信息,尽管未经过梳理,机器人仍可通过数据自己学习,自己分析。这样看来,机器人似乎有了“灵魂”。
该技术一旦成熟应用,政府工作人员不用再事先提炼总结知识点,而是机器人自己分析归类,然后回答别人的提问。而且在与人的互动过程中,系统还会不断完善知识库。
我们可以设想这样的场面,如果凉山州出台新的公积金贷款政策,只需将通知文件录入网站,“阿惹妞”就会根据实际情况告诉你,能办多大额度贷款、怎么办贷款……
从小学、高中到大学,一个人在课堂所接触的知识面越来越窄,深度逐步提升,这一过程一直持续到硕士博士阶段。游世学说,中科汇联从一开始就向服务的核心发力——政府企业等深度行业应用,“深度越深,服务精准度就越高,价值就越好,从而能真正解决问题,提高效率。”