论文笔记|Deep Open Intent Classification with Adaptive Decision Boundary-白红宇

论文笔记|Deep Open Intent Classification with Adaptive Decision Boundary

阅读量：4289 次

发布时间：2019-05-27

本文共 941 字，大约阅读时间需要 3 分钟。

作者：徐甘霖

单位：燕山大学

这篇文章是今年2月份发表AAAL上的一片论文，论述了开放领域文本的一种新方法，取得了不俗的效果。作者在文章中提出开放意图分类的概念，如下图所示：

用户询问的意图有Book flight、Restaurant reservation的明确意图分类，对于未知的意图全部归为“Open”，即开放集合中，这在本质上还是属于开放领域分类问题。所以作者构建了一个输出结果为n+1类别概率的分类，整个结构如下图所示：

首先使用BERT模型抽取句子的语义特征作为inputs，然后经过均值池化和全连接层得到BERT Embedding。

经过均值池化和全连接分别得到如下结果：

使用如下图方法代表一个类别，论文中将每一个类一个ball表示，在所有ball之外的空间即为开放空间，在开放空间的intent视为open intent。

如下所示，Ck表示ball的质心，∆k表示半径。对于每一个ball来说，质心是唯一确定的（bert向量的均值），所以半径的学习过程极为重要，半径过大容易导致open space risk，即开放空间风险，这样是不属于此类的的数据点落在ball内，被错误分类为该类。半径太小又容易导致属于该类的数据点落在ball外，被错误的分类为open intent,导致empirical risk。

在这里插入图片描述

因此作者提出一种边界损失函数，动态的确定每个ball的半径。

在测试时，使用如下公式计算每个测试数据到每个已知类别代表的ball，如果数据点落在全部ball的外部，我们将其归为open intent，否则属于距离最近的质心的那个ball。

在这里插入图片描述作者首次提出一种新颖的后处理方法来计算每个类的决策边界，定义了一种边界损失函数，这对于开放分类至关重要的作用。同时，自适应性地结合已知的分类确定簇中心和决策半径，进而确定决策边界用于区分已知类意图和开放意图，而且不需要开发类别参与训练，最优化解决了open space risk和empirical risk等问题。

论文地址：https://arxiv.org/abs/2012.10209

代码地址：https://github.com/thuiar/Adaptive-Decision-Boundary

转载地址：http://dhmgi.baihongyu.com/

你可能感兴趣的文章