Out-of-Domain Detection for Natural Language Understanding in Dialog Systems

计算机科学 自编码 分类器(UML) 自然语言理解 话语 人工智能 领域(数学分析) 自然语言 生成对抗网络 对话框 机器学习 自然语言处理 深度学习 数学 数学分析 万维网
作者
Yinhe Zheng,Guanyi Chen,Minlie Huang
出处
期刊:IEEE/ACM transactions on audio, speech, and language processing [Institute of Electrical and Electronics Engineers]
卷期号:28: 1198-1209 被引量:98
标识
DOI:10.1109/taslp.2020.2983593
摘要

Natural Language Understanding (NLU) is a vital component of dialogue systems, and its ability to detect Out-of-Domain (OOD) inputs is critical in practical applications, since the acceptance of the OOD input that is unsupported by the current system may lead to catastrophic failure. However, most existing OOD detection methods rely heavily on manually labeled OOD samples and cannot take full advantage of unlabeled data. This limits the feasibility of these models in practical applications. In this paper, we propose a novel model to generate high-quality pseudo OOD samples that are akin to IN-Domain (IND) input utterances and thereby improves the performance of OOD detection. To this end, an autoencoder is trained to map an input utterance into a latent code. Moreover, the codes of IND and OOD samples are trained to be indistinguishable by utilizing a generative adversarial network. To provide more supervision signals, an auxiliary classifier is introduced to regularize the generated OOD samples to have indistinguishable intent labels. Experiments show that these pseudo OOD samples generated by our model can be used to effectively improve OOD detection in NLU. Besides, we also demonstrate that the effectiveness of these pseudo OOD data can be further improved by efficiently utilizing unlabeled data.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
Sun1c7完成签到,获得积分10
刚刚
伍迎海发布了新的文献求助10
1秒前
1秒前
隐形傲霜完成签到 ,获得积分10
1秒前
勤劳的小刺猬完成签到,获得积分10
2秒前
windows完成签到,获得积分10
2秒前
2秒前
3秒前
General完成签到 ,获得积分10
3秒前
Wendy完成签到,获得积分10
3秒前
3秒前
莎莎发布了新的文献求助10
3秒前
了尘应助MY采纳,获得10
3秒前
SLY完成签到 ,获得积分10
3秒前
一目完成签到,获得积分10
4秒前
赘婿应助莹0000采纳,获得10
4秒前
20250702完成签到 ,获得积分10
4秒前
外向半青完成签到,获得积分10
4秒前
Jason完成签到,获得积分10
4秒前
研友_VZG7GZ应助青春纯白色采纳,获得10
4秒前
Coai517完成签到 ,获得积分10
5秒前
WRECKIE发布了新的文献求助10
5秒前
NexusExplorer应助知榕采纳,获得10
7秒前
谷飞飞完成签到,获得积分10
7秒前
无限夏云完成签到,获得积分10
7秒前
tt完成签到,获得积分10
7秒前
Akim应助duanhahaha采纳,获得30
7秒前
carbonhan完成签到,获得积分10
8秒前
luchong发布了新的文献求助30
8秒前
123完成签到,获得积分10
8秒前
快乐小菜瓜完成签到 ,获得积分10
8秒前
小研大究完成签到,获得积分10
9秒前
czz完成签到,获得积分10
10秒前
Mark完成签到,获得积分10
10秒前
布同完成签到,获得积分10
11秒前
张雨欣完成签到 ,获得积分10
11秒前
12秒前
拼搏听寒完成签到,获得积分10
12秒前
12秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Fermented Coffee Market 2000
Methoden des Rechts 600
Constitutional and Administrative Law 500
PARLOC2001: The update of loss containment data for offshore pipelines 500
Critical Thinking: Tools for Taking Charge of Your Learning and Your Life 4th Edition 500
Vertebrate Palaeontology, 5th Edition 380
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5282438
求助须知:如何正确求助?哪些是违规求助? 4436450
关于积分的说明 13809099
捐赠科研通 4317015
什么是DOI,文献DOI怎么找? 2369541
邀请新用户注册赠送积分活动 1364917
关于科研通互助平台的介绍 1328426