9月20日-22日,由中国自动化学会智能自动化专业委员会主办、江苏大学承办的中国智能自动化大会(CIAC)在江苏镇江召开。小i机器人联合北京邮电大学发表的论文《Discovering Bursty Events based on Enhanced Bursty Term Detection》在本届大会上获得“最佳论文奖”。
关于CIAC-2019
中国智能自动化大会(CIAC)是由中国自动化学会智能自动化专业委员会发起的系列学术会议,每一年或两年举办一次,至今已成功举办13届。CIAC-2019旨在为国内外智能自动化领域的研究者提供一个面对面的交流平台。CIAC-2019邀请了来自高等院校、科研院所和产业部门的专家汇聚一堂,深入交流前沿学术思想,积极探讨技术与产业的发展趋势。
关于获奖论文
本篇获奖论文由小i机器人与北京邮电大学联合发表,聚焦基于增强突发词检测的突发事件检测方法(Discovering Bursty Events based on Enhanced Bursty Term Detection,Burst_NBT)。
以微博为例,微博作为一种实时交互的社交媒体,能够提供给用户作为社交平台来发表内容、交换信息。许多真实的事件都是被微博首先揭露,然后再被传统主流媒体报道,例如滴滴顺风车事件、2018年重庆公交车坠江事件。因此,基于微博的突发事件检测已经成为了一个研究热点。
如何从微博中发现重要的突发事件目前还存在着挑战。因为微博内容简短多变、五花八门,充满了各种类型的话题。例如对日常天气的描述、个人心情的表达等。我们如何从微博博文中挖掘重要的突发事件,过滤掉不重要信息,并且区分属于同一主题的不同事件?
目前业内针对短文本话题检测已有一些方法。例如BTM直接对词的共现模式进行建模、BBTM在BTM的基础上将词对的突发性作为先验知识用于突发主题建模、Burst_ST抽取事件突发期间的hashtag,将提取关键词用于描述检测到的事件等……这些方法虽然对突发事件检测的性能有所改善,但问题依然存在,而这些问题正是此次获奖论文要解决的难点问题。
在本篇获奖论文中提出的Burst_NBT由两部分构成。第一部分,增强突发词的检测;第二部分,突发词聚类与突发事件排序。增强突发词的检测由两部分构成,分别是有意义字符串字典的构建与突发词得分的计算。Burst_NBT利用微博中的hashtag与标题等信息构建有意义字符串字典,并利用突发词的先验信息计算突发词得分,然后利用微博博文评论数平滑后的对数表示博文影响力。在大量数据集上的实验结果验证了Burst_NBT在突发事件检测准确率以及事件描述准确性上均优于其他方法。
注重产学研深度结合推动技术创新应用
经过多年的建设,小i机器人目前已经形成了三级技术研发体系:研究院—产品研发中心—解决方案中心。同时,小i机器人也非常重视产学研的深度结合,其中除了与华东师范大学、中国科学院软件所、香港科技大学等建立了联合实验室外,也与中国科技大学、复旦大学、北京邮电大学、北京大学等建立了深度合作关系,在自然语言处理、文本挖掘及情感交互等多方面开展了深度研究工作。
小i机器人也一直将最新的认知智能技术研究成果和落地应用展示于国际顶级学术会议和赛事中。例如,小i机器人研究院团队在今年7月的国际权威机器阅读理解评测SQuAD1.1挑战赛中独立参赛斩获全球第三的成绩;于今年8月再次参加IJCAI,分享在认知智能相关技术领域的突破等。
小i机器人核心技术的不断突破与进阶,将持续为社会、行业和客户带来更多价值。未来,小i机器人也将不断加强与学界的合作,进一步提升人工智能技术水平,确保以更成熟的人工智能技术为更多的行业企业客户提供服务。