博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
论文笔记|Deep Open Intent Classification with Adaptive Decision Boundary
阅读量:4289 次
发布时间:2019-05-27

本文共 941 字,大约阅读时间需要 3 分钟。

作者:徐甘霖

单位:燕山大学


这篇文章是今年2月份发表AAAL上的一片论文,论述了开放领域文本的一种新方法,取得了不俗的效果。作者在文章中提出开放意图分类的概念,如下图所示:

在这里插入图片描述用户询问的意图有Book flight、Restaurant reservation的明确意图分类,对于未知的意图全部归为“Open”,即开放集合中,这在本质上还是属于开放领域分类问题。所以作者构建了一个输出结果为n+1类别概率的分类,整个结构如下图所示:
在这里插入图片描述首先使用BERT模型抽取句子的语义特征作为inputs,然后经过均值池化和全连接层得到BERT Embedding。
经过均值池化和全连接分别得到如下结果:
在这里插入图片描述在这里插入图片描述使用如下图方法代表一个类别,论文中将每一个类一个ball表示,在所有ball之外的空间即为开放空间,在开放空间的intent视为open intent。
在这里插入图片描述如下所示,Ck表示ball的质心,∆k表示半径。对于每一个ball来说,质心是唯一确定的(bert向量的均值),所以半径的学习过程极为重要,半径过大容易导致open space risk,即开放空间风险,这样是不属于此类的的数据点落在ball内,被错误分类为该类。半径太小又容易导致属于该类的数据点落在ball外,被错误的分类为open intent,导致empirical risk。

在这里插入图片描述

在这里插入图片描述因此作者提出一种边界损失函数,动态的确定每个ball的半径。
在这里插入图片描述
在测试时,使用如下公式计算每个测试数据到每个已知类别代表的ball,如果数据点落在全部ball的外部,我们将其归为open intent,否则属于距离最近的质心的那个ball。

在这里插入图片描述作者首次提出一种新颖的后处理方法来计算每个类的决策边界,定义了一种边界损失函数,这对于开放分类至关重要的作用。同时,自适应性地结合已知的分类确定簇中心和决策半径,进而确定决策边界用于区分已知类意图和开放意图,而且不需要开发类别参与训练,最优化解决了open space risk和empirical risk等问题。


论文地址:https://arxiv.org/abs/2012.10209

代码地址:https://github.com/thuiar/Adaptive-Decision-Boundary

转载地址:http://dhmgi.baihongyu.com/

你可能感兴趣的文章
MySQL Explain详解
查看>>
一直搞不清楚什么是读写分离,主从复制的原理,今天总算搞懂了
查看>>
消息队列 mq 必会面试题
查看>>
线程池的工作原理是啥?能手写一个线程池吗?
查看>>
一口气说出 6种 延时队列的实现方案,大厂offer稳稳的
查看>>
原来redis这么简单,跟着文章操作一遍你就会了
查看>>
Redis两种持久化机制RDB和AOF详解(面试常问,工作常用)
查看>>
事务隔离级别中的可重复读能防幻读吗?
查看>>
老伙计,关于JDK并发包,这些不为人知的秘密你知道多少?
查看>>
图片的左右切换
查看>>
进级的RecyclerView——LRecyclerView
查看>>
Android 利用Gradle实现app的环境分离
查看>>
Android系统篇之----Binder机制和远程服务调用
查看>>
JavaScript DOM 属性
查看>>
Gradle 实现 Android 多渠道定制化打包
查看>>
Android开源项目及库整理总结
查看>>
Android快速开发系列 10个常用工具类
查看>>
深入理解JSON对象
查看>>
类似新浪微博帖子显示话题、@好友、表情解析等
查看>>
JSP 自动刷新
查看>>