在人工智能迅速发展的当今社会,人们的生活也在不断被人工智能所改变,其中有一种机器人叫做语音交互机器人。说到语音机器人大家马上想到的可能就是我们打客服电话转接人工座席前的那个智能语音菜单,但是很多人却不知道自己有时会接到的一些销售或者调研回访类的电话,跟自己说话的那个甜美声音居然也是个AI机器人,神奇吧!
可是如何能把一个语音机器人做得如此拟人,作为一个做了两年outbound智能语音的新人团队,想在这里把我们团队这两年中摸索出来的一些经验做些分享,希望能对同样也在智能语音道路上不断探索的你有所帮助。
1
智能语音的丰富性
首先作为语音交互机器人,它需要针对不同的客群和渠道,比如新客户还是老客户,主要是男性群体还是女性群体等等,渠道主要是来自微博、微信、小程序还是APP等等,从而实现精细化客群对话运营。
然后针对不同的业务模型,需要匹配不同的样本数据场景,比如有的模型更适应小样本数据场景,有的模型则更适应大的样本数据场景。
最后机器人一定要适应场景的匹配,比如多轮就更适合outbound场景,图谱则更适合文本机器人,而文本机器人基本上都是inbound场景。
所以在做智能语音前你一定要明确你的客群渠道、模型大小和场景类型,从而才能找到与之相匹配的交互机器人。当然作为一个outbound语音团队,后面同大家分享的主要也会是从outbound的一个角度来说。
2
流程跳转的灵活性
在人与人交流的时候,大家可能都会遇到一种情况——正在聊一件事,突然想到了另外一件事,话题马上就会被扯开。语音交互机器人同用户的交互也是一样,如果不能灵活应对用户突如其来的各种“意外”,那语音交互机器人的交互能力永远只能停留在初级阶段。
如何让机器人在交互中变得更加灵活呢?
首先,在设计流程前期需要把用户所有可能会提到的问题进行收集整理,然后进行分类,哪些意图是只属于这句机器人话术下才会出现的意图,那就将这类意图对应的话术配置在这句机器人话术下面去进行响应就可以了。哪些意图是属于公共意图,就是无论在哪句机器人话术下客户都有可能出现这样的问题,那这类意图可放入到全局的子流程中,从主流程的任意机器人话术节点都可以跳转触发该意图对应的机器人话术。
当然更加智能的机器人还可以实时通过客户画像标签进行不同的对话,比如说对客户前几轮的一些问答进行画像,从中分析出客户的实际需求,更加智能的跳转到更符合客户需求的交互路径中去,从而实现交互跳转的灵活性。
3
话术应答的多样性
相信大家都有这种经历——接起电话听到对方说话是一个字一个字往外蹦的时候,我们便知道对方一定是机器人,有时甚至都没听清对方说的是什么就会直接选择挂断电话。作为语音机器人的训练团队,想必如何留住用户听完开场白,是个首要解决的问题,如何做到语音播报的拟人化,这时我们可以选择声音和业务相匹配的专业录音师,来进行自主录音,让每句机器人话术播报起来都更流畅而富有情感,把用户留下来后如何让用户在之后的交互中察觉不出这是位机器人呢?那就需要在技术上做到可打断,而话术上要做到多样性。
同真人交流时,往往当对方听不懂我说的这句话时,我们会选择换一种表达方式,在机器人上如何高效且有逻辑的编写话术1、话术2、话术3等就显得尤为重要了。
当语音机器人能够实现这种流畅的一问一答交互方式后,用户却始终无法根据自身的需求随时对机器人进行打断,必须要求用户听完机器人的语音输出,这时也会大大降低用户的体验感。而打断技术在语音交互中一直也是一个难点,它需要另一个检测设备,对收录到的语音进行判别,判别是用户声音还是周围的杂音,判别用户是有问题需要表达还是只是在做无意图的响应,从而才能及时暂停语音播报,给出正确的响应。当这三点都能做到近乎完美时,那机器人的应答能力也能达到一个质的飞跃,我想这应该也是当前行业中一个急需突破解决的问题。
4
意图识别的准确性
有了灵活的交互和多样的应答话术,却无法准确识别到用户的意图,对于一个优秀的机器人来说自然是不行的。如何提升机器人的意图识别能力,自然少不了大量的语料训练,如果每天通过人工来进行大量的语料收集、清洗及标注,这将是一个相当耗费人力且繁琐的工作。
但是如果将大部分工作交给机器人自己完成的话,一切就会变得容易很多,首先在每天外呼结束后,让机器人对当天所有语料进行自我验证,只将有问题的语料筛选出来,由人工进行ASR及NLP的清洗及重新标注,最后回流给机器人重新进行ASR优化、语料质检及训练发布,从而使机器人的意图识别准确性得到不断的提升。
这两年中为了不断提升语音机器人的交互能力,同仁们都付出了很多的努力,同时也克服了很多的困难,但是当我们看到自家AI机器人从“小baby”飞速成长为一个“大人”的时候,不断收获到来自行业和周边的肯定的时候,一切付出瞬间也都觉得值了。希望同样在智能语音交互领域辛勤耕耘的你,也能收获到一份属于您的价值和成就感。