科研进展 | 基于对比教师学生学习的实体关系抽取模型
来源:发布时间:2022-06-27【字体: 大 中 小 】
近日,中国科学院深圳先进技术研究院数字所高性能数据挖掘重点实验室在自然语言处理领域中实体关系抽取研究方面取得了重要进展,相关成果以“Exploring Privileged Features for Relation Extraction with Contrastive Student-Teacher Learning”为题被数据挖掘顶级期刊IEEE TKDE (IEEE Transactions on Knowledge and Data Engineering)录用。深圳先进院数据挖掘实验室硕士生赵笑艳为论文第一作者,曲强研究员为赵笑艳同学的第一导师,第二导师杨敏副研究员为论文的通讯作者。
该项研究致力于解决当前实体关系抽取研究中所面临的实体和关系之间的交互信息建模问题,提出了基于对比教师学生学习的实体关系抽取模型(STER)。随着深度学习在自然语言处理领域的不断发展,越来越多的联合实体关系方法在实体关系抽取问题显示出良好的性能,但是不足依然存在。现有的联合模型在一定程度上失去了传统的流水线关系抽取方法充分利用实体特征和关系特征的优势,无法在这两个任务之间获得明确和必要的信息互补。为了更加有效地利用实体和关系特征,本文定义了关系抽取任务中的特权信息,提出了一种对比教师学生学习框架,鼓励一个综合的学生模型融合两个专家教师模型的知识,增强模型生成特定的实体关系三元组所需的潜在特征。我们在COLIEE、ADE、SciERC等基准数据集上进行大量实验,验证了所提出的基于对比教师学生学习的实体关系抽取模型的有效性。

STER框架

STER训练过程

STER性能提升
IEEE Transactions on Knowledge and Data Engineering为CCF-A类国际期刊,主要刊登计算机科学、人工智能、电子工程、计算机工程等领域在知识与数据工程方向的学术论文。
上述工作得到国家自然科学基金“基于深度学习的端对端跨领域个性化任务型对话研究”和深圳市基础研究(重点项目)等项目的资助。