为了打赢这场疫情防控阻击战,便于相关单位根据需求选择合适的产品,充分发挥人工智能技术在疫情防控中的应用,信通院联合中国人工智能产业发展联盟(AIIA)迅速开展了智能疫情防控机器人评估测试工作。
本轮试评估将通过技术测试、材料审查和企业披露等方式对参测产品的基础功能、业务能力和服务性能等指标进行评测。竹间智能作为中国人工智能产业发展联盟成员,以“竹间疫情防控情感机器人”系统参与了本次首批测评,并在各项指标上均取得了不错成绩。
参评企业名单:
功能评测结果与分析
本轮评测系统测试了方言支持、结果报表、异常上报等7项基础功能指标,测试了筛查、防控、回访等5项业务功能指标。下图给出了功能部分的评测结果,列出了参测产品对于各指标的支持情况:
图1基础功能测试结果
总体而言,参评产品在并发外呼、话术配置和结果报表等方面表现较好,主要有以下三个方面的特点:
系统对并发外呼的支持充分保证了呼叫效率,多数参评产品并发能力超过1000;
话术配置具备多样性,使得疫情防控机器人的使用场景更为丰富;
结果报表支持实时统计和展示关键信息;
图2 业务功能测试结果
针对疫情防控场景,参评产品设置了多种适配话术。在筛查、防控、回访三个话术上,全面支持的参评产品的占比分别达到89%、67%和89%。由于宣教话术通常应用于在线客服场景,因此参评产品中约有一半暂未集成。
本次竹间疫情防控情感机器人能快速上线筛查、防控、回访等多项功能并实际投入使用,得益于竹间自研的人工智能开放平台Bot Factory™2020。竹间智能将自研的语音识别技术和NLP融合,可视化的界面和简易操作的流程能快速构建例如人员筛查、隔离人员回访等多轮场景对话,话术配置具备多样性,使得疫情防控机器人的使用场景更为丰富。
可以自动批量拨打电话进行外呼任务,大大降低人工压力并可快速准确收集相关信息,自动生成报表以供留档、分析。
性能评测结果与分析
本轮评测系统测试了语音识别、语义理解、结果分析等6项服务性能指标。下图(图中系统与上表参评企业排序无对应关系)给出了信息采集能力、统计分析能力、语音识别能力和语义理解能力等多个重要性能指标的准确率。
图3 服务性能测试结果
总体来看,参评产品在信息采集能力、语言识别能力和系统可靠性等方面较为出色,充分利用自身优势助力疫情防控。在信息采集能力方面,参评产品的准确率都超过了83%,可有效保证相关字段信息的获取,从而满足政府、机构等对关键信息的统计和分析需求;在语音识别能力方面,考虑到电话环境噪声嘈杂,参评产品的准确率主要分布在82%-96%之间,可以达到较好的使用效果;在语义理解能力上,各家准确率在80%上下浮动。
竹间智能出色的语义理解能力基于强大的NLP基础和针对业务领域优化的Emotibot-BERT深度迁移学习模型。
通过结合计算语言学的词法分析、句法分析、语义角色分析和基于大规模迁移学习的中文预训练语言模型Emotibot-BERT,可以在无训练数据的零启动测试当中,已达到80%的准确率,跨领域的意图理解中,平均准确率已达95%以上,语音识别+多轮交互在外呼的实际应用场景已达93.9%的准确率。再根据场景的数据训练之后,准确率将继续提升。
运营情况统计与分析
除上述功能和性能指标评测以外,在首轮疫情防控机器人评测中,还统计了截至2020年2月7日各参评产品的外呼系统的呼叫情况。下图给出了外呼系统的总呼叫量与日均呼叫量在各数量级上的企业分布情况。
图4 参评产品总呼叫量及日呼叫量规模情况
如图4所示,约有54%的企业呼叫总数为百万级,其余占比较多的总呼叫量分别处于十万级以下、十万级、五十万级和千万级。从日均呼叫量来看,约有85%的企业每天都有超过几万通外呼电话进行信息采集、防控回访。
目前竹间智能的竹间外呼防疫情感机器人已经在北京、上海、深圳等多地帮助企业组织、社区居委进行防疫工作。防疫期间也将持续免费向社会各界提供竹间防疫全场景智能解决方案。
疫情期间免费使用
拨打:400-831-9111防疫期间7*24小时为您服务