• 企业400电话
  • 微网小程序
  • AI电话机器人
  • 电商代运营
  • 全 部 栏 目

    企业400电话 网络优化推广 AI电话机器人 呼叫中心 网站建设 商标✡知产 微网小程序 电商运营 彩铃•短信 增值拓展业务
    深度 | AI 建模实际应用场景及效益
      随着AI科技的发展,过去很多无法应用计算机算法分析的场景现在已经成为可能,并且能经由AI的算法带来实际的业务效益,提升营收。本文将以普强的AI建模、语义理解、语音识别等相关技术为核心所建立的一套优化商业场景机制,在行业中的实际应用所产生的效益做详细阐述。
      国内一名列世界500强的保险公司(以下简称A保险公司),拥有庞大的电销团队,雇佣了上万名电销人员,每月电销电话拨打量达到千万通。由于客户名单基本为白名单,即没有客户的信息,传统的格式化维度分析无法应用,所以A保险公司在没有客户信息的情况下,实行全量拨打,这样的拨打效果成交率在千分之一以下。另一方面,全量拨打的电销电话也给客户带来不良的印象,对客户造成不必要的干扰。近年来,监管力度逐年上升,对电销电话管控严度加大。为能有效运营电销就需要有特定对象,向有购买保险意愿的客户精准的拨打。
      随着AI科技的进步,普强AI建模产品的核心运用了最新的AI语音转译和语义理解技术,为这样的场景提供了一个极佳的解决方案,能够让A保险公司和有类似业务场景公司的电销人员将资源集中在有潜在购买意愿的客户。一方面,避免拨打全量的电话,减少人力资源和电信话费,另一方面,能有效减少对没有购买意愿客户的干扰。当客户有意愿和需求购买保险时,电销的外呼电话不被认为是干扰;相反,对没有购买意愿或能力的人,这样的电话即成为客户的干扰。
      事实上,经过AI建模的分析,在数百万的客户名单中,有购买意愿的大约在15%左右,因此80%以上的电话都是不必要拨打的。这样的应用给A保险公司和有类似应用场景的公司省下巨大的成本。接下来,将会对此做详尽的描述。
      1、语音语义理解可获取有价值的客户特征
      虽然没有客户的固定维度信息,但是有许多已拨打过的录音,A保险公司拥有海量的客户通话录音,录音内含有宝贵的客户信息、客户特征等。这些数据都可以作为筛选客户的依据,例如在电销的过程中可以得知:
      买过保险:谢谢,我已经有保险了。
      可能有车:对不起,我正在开车,不方便讲话。
      有房人士:我目前房贷压力大,没有闲钱买保险。
      还有许多类似的特征都可以从电销人员和客户的通话中获取,做成客户画像。普强过去积累了许多成功案例,其中就包含大量这样有价值的客户特征。从各样的案例中,电销人员重点关注拥有这些特征的客户,拨打给这类有较高意愿的客户并提高销售力度,增加拨打次数和跟进,从而提升销售成交率。因此,若能将这些宝贵的客户信息特征挖掘出来,也就能更进一步找出潜在客户,从而将电销团队的大量资源(人力、时间、电话费用……)做最有效的运用,达到最大收益。
      2、AI语音转译和语义理解
      自从2010年苹果电脑、手机发布Siri应用后,语音识别技术不断的更新、突破。其主要是源于一种计算机算法架构的技术突破:深度神经网络。使用神经网络的技术,研究人员不断推进许多人工智能以前不能突破的障碍,例如语音识别、图像识别、语义理解等三大领域。借助神经网络架构,这些领域里的问题都大大提升了应用上的效果。这样的突破主要由以下几个因素造成:
      在语音识别方面,2017年微软研究院的技术达到了与人翻译的结果相同的里程碑。在电话对话的数据集(Switchboard),微软的研究员们使用了多个神经网络模型来翻译使结果达到最优,翻译的字错误率与4位专业翻译人士共同翻译的错误率基本相同。2018年谷歌的DeepMind使用了大型的CNN-RNN-CTC神经网络架构,翻译结果比翻译专家好六倍。同时在图像识别方面,也同样有重大突破,使得自动驾驶这样复杂的工作,变得可实现。
      语音、图像识别持续突破,在语义理解方面,使用神经网络架构的算法也突破了人的水平。著名的史丹佛大学语义理解竞赛的文本问答数据集,内有10万条问答,都是从维基百科摘选的文章片段,然后对每一片段由真人提出问题,并在文章片段内找出答案的位置。准确率由2017年前的60%迅速攀升到最新的90%以上,远远超过人的水平,人的水平为86.8%,而准确率最高的神经网络是94.6%。它所使用的神经网络架构为一种称为Transformer的网络,叠加24次,形成一个深度大型的网络(BERT),并使用了兆级数量的词汇做训练。在其它常用的语义任务上,神经网络也都极大的提升了准确率,例如命名实体识别(NER)、关系识别、文本蕴含(textentailment)等。
      这些人工智能的科技突破,让许多以往计算机不能应用到的场景成为新的应用。在语音方面,企业存储的海量录音,以往是黑盒子,无法进行分析整理。不像结构化的数据,使用大型的数据库,可以做查询、统计、分析、图表化等工作。如今,可以经由语音识别成为文字,然后再经由语义理解做分析,产生实际的应用效益。接下来将对最新的语音、语义技术在人工智能科技的应用作案例分析。
      3、语音语义分析现行科技状况
      语音识别相对比较容易理解和定义,其任务就是将声音转成文字,而转化的效果可以简易的用字错误率来界定。但是识别的准确率与诸多因素相关,可以用人的体验来做比喻,因为人工智能基本就是模仿人的智能:
      这些都会影响识别的结果,就像人需要时间适应后才能听懂一个新环境里的对话交流。所以要降低语音转译的错误率,必须要能对专业或应用领域有足够的认识,熟悉地域的口音、方言等。
      普强的语音转译专注于固定领域来积累领域的专业话语,也同时积累了大量的语音覆盖了口音、方言、传播媒介特性、背景声音等因素,来优化语音转译的正确率。
      另一方面,语义理解任务相对的就比较不容易定义和理解,有一组学术界定义的语义理解相关的问题(GLUE):
      这些任务都有许多应用场景,但是语义理解的应用范畴也有很多不能直接应用这些任务,例如从一段对话文本中来判断一个人是否结婚,如下面的对话:
      A:您好,我想跟您谈下我们公司最近的一个产品的活动,这个产品能够......
      B:嗯,谢谢,不过我需要和我老婆商量商量...。
      明显的从这段对话里,可以判定B是已经结过婚的人。再例如,服务业里常有禁忌的用语如:
      A-先听我说orA-是谁说orA-怎么知道orA-谁告诉你orA-有没有搞错orA-你弄错了orA-说重点orA-你必须orA-本来应该orA-这个部门很差劲orA-这个部门差劲orA-到底需要不需要orA-你不要跟我喊orA-你明白了吗orA-那您觉得呢orA-我说的很清楚了orA-刚才不是对你说了
      这样的语义理解应用均不是GLUE里面的任务能够直接应用的,并且在GLUE里表现良好的神经网络架构也不能保证在真实应用的场景里达到产生业务价值的效果。
      2018年底,谷歌发布了一种神经网络架构BERT,一种基于Transformer架构的多层叠加的神经网络,BERT提出两种版本,基本版(BASE)和大型版(LARGE),参数如下:
      BERTBASE:L=12,H=768,A=12,TotalParameters=110M
      BERTLARGE:L=24,H=1024,A=16,TotalParameters=34
      使用了3.3Giga的词汇作预训练,然后再按任务作微调训练,硬件使用了谷歌TPUV2.0的处理器,BERT的基础版(BASE)需要16个TPU芯片,BERT的LARGE版使用了64个TPU芯片,预训练需要4天。   在GLUE的许多任务上均优于此前的神经网络架构(如上表所列)。BERT在语音识别和图像识别突破后带来了语义理解的突破。此后在BERT的基础上,在语义理解的许多应用上都带来了突破。然而由于BERT和后续的神经网络都需要庞大的计算资源和时间,给私有化部署的应用带来高昂的成本,除非能够使用云端共享的BERT计算资源。由于数据保密的要求,许多应用的数据无法上传到云端,例如金融业的客户数据等。
      如前所述,这样的科技还需要经过再创新才能应用在实际的商业场景里。普强在这个方面做了十年的科研投入,不断的将最新的科技应用在实际的商业场景上。
      4、普强语音语义框架
      当前人工智能算法均属在高维度的空间中寻找线性/非线性复合函数的最优值点,其最核心的架构设计实为设计此高维度空间里的数学复合函数,许多的复合函数/神经网络框架都在不同的任务中被验证有应用的效益,下面列举了几个重要的类别:
      全联多层的神经网络:每层的神经元均与下一层的所有神经元相连,逻辑回归等算法均使用此种网络。
      以上仅就目前人工智能应用领域里经常使用并产生实际应用效益的网络做了简介,当应用到各个实际场景里时,还有基于上述网络衍生的众多版本和彼此之间的结合版,不能一一详述。
      深度学习里的神经网络架构及其参数和超参数均需按实际场景和数据的情况作调试优化,方能达到理想的效果以产生实际应用价值。然而实际的场景虽然都有相似之处,但也有诸多不同的细节,为能满足每一应用场景的应用效益要求,以过往往需要由资深的算法工程师做深度的调试,此种模式耗时且效率低,常常不能满足客户快速的迭代需求。
      大型人工智能科技公司提倡将大量的数据存储在它们的云计算平台上,并同时按采集到的海量数据调试一个能广泛应用的平台。此种商业模式,虽有可行性,但同时也面临着一些根本的挑战。例如如何能保证数据的安全,特别是金融行业和其它对数据保密要求高的行业,同时这些大型的人工智能公司现今也不断的扩张他们的业务领域,将数据提供给此类的云平台,也加速了他们的竞争力来切入不同的商业领域,这样的担忧也是使得这样的方法无法获得更多商业应用的数据,从而不能提供一个通用的应用人工智能系统。
      据此普强提出发展一种可重复复用的机制,将这个机制灵活的应用到每一个客户业务场景上,当这个机制应用到特定场景上时,会按已成功的案例,做梳理业务逻辑并同时在客户内的私有云上采集数据,再用成功案例的深度学习神经网络,机器学习算法架构来训练、测试、验证模型,最终上线运行业务逻辑,提升业务价值及效益。这样的机制主要包含两项重要元素,方法论和计算技术框架:
      普强在金融及相关领域,积累十年以上的人工智能行业落地经验,专注于垂直领域,归纳成功的案例、相关的业务流程规则和算法算力需求,建立起一套完整的机制。随着客户的业务需求变化和成功案例积累,不断的扩充加强优化此机制,作快速的迭代。
      5、成功案例分享
      A保险公司为名列世界500强的保险公司(在本文开头已有提及),普强将语义分析机制应用在A保险公司的电销业务里,项目一期应用在A保险公司两个主要的业务区:BJ市和TJ市。对大约250万的客户电销通话录音(约400万通录音)作落地实施,其中包括了下列的步骤:
      与使用普强机制前业务情况对比的成效如下:
      6、结语
      随着计算力和云存储容量的大幅提升,海量数据的收集,使得以往不能突破的人工智能问题均得到突破:如语音识别、图像识别、语义理解等领域。借着这些突破,许多商业场景都能应用这些最新的人工智能突破,而产生实际的商业效应。
      本文中叙述了语音识别和语义理解在特定的垂直领域中的应用,并详述案例和其应用的效益。此种效应随着科技的进步和突破,必能扩及更多的场景和商业应用。本文中所述的方法论和技术计算框架也必定会不断的迭代更新和扩充,带给实际的业务更多的效益。
    上一篇:通过远程团队管理客户体验 --Xarios讨论了分析对于远程团队的重要性
    下一篇:浅谈呼叫中心ACD智能可视化配置
  • 相关文章
  • 

    © 2016-2020 巨人网络通讯 版权所有

    《增值电信业务经营许可证》 苏ICP备15040257号-8

    深度 | AI 建模实际应用场景及效益 深度,建模,实际,应用,场景,