本文共 941 字,大约阅读时间需要 3 分钟。
作者:徐甘霖
单位:燕山大学这篇文章是今年2月份发表AAAL上的一片论文,论述了开放领域文本的一种新方法,取得了不俗的效果。作者在文章中提出开放意图分类的概念,如下图所示:
用户询问的意图有Book flight、Restaurant reservation的明确意图分类,对于未知的意图全部归为“Open”,即开放集合中,这在本质上还是属于开放领域分类问题。所以作者构建了一个输出结果为n+1类别概率的分类,整个结构如下图所示: 首先使用BERT模型抽取句子的语义特征作为inputs,然后经过均值池化和全连接层得到BERT Embedding。 经过均值池化和全连接分别得到如下结果: 使用如下图方法代表一个类别,论文中将每一个类一个ball表示,在所有ball之外的空间即为开放空间,在开放空间的intent视为open intent。 如下所示,Ck表示ball的质心,∆k表示半径。对于每一个ball来说,质心是唯一确定的(bert向量的均值),所以半径的学习过程极为重要,半径过大容易导致open space risk,即开放空间风险,这样是不属于此类的的数据点落在ball内,被错误分类为该类。半径太小又容易导致属于该类的数据点落在ball外,被错误的分类为open intent,导致empirical risk。 因此作者提出一种边界损失函数,动态的确定每个ball的半径。 在测试时,使用如下公式计算每个测试数据到每个已知类别代表的ball,如果数据点落在全部ball的外部,我们将其归为open intent,否则属于距离最近的质心的那个ball。作者首次提出一种新颖的后处理方法来计算每个类的决策边界,定义了一种边界损失函数,这对于开放分类至关重要的作用。同时,自适应性地结合已知的分类确定簇中心和决策半径,进而确定决策边界用于区分已知类意图和开放意图,而且不需要开发类别参与训练,最优化解决了open space risk和empirical risk等问题。
论文地址:https://arxiv.org/abs/2012.10209
代码地址:https://github.com/thuiar/Adaptive-Decision-Boundary转载地址:http://dhmgi.baihongyu.com/