Neural Variational Gaussian Mixture Topic Model

可解释性 计算机科学 推论 人工智能 高斯分布 主题模型 光学(聚焦) 相关性(法律) 文字嵌入 词(群论) 自然语言处理 混合模型 嵌入 机器学习 数学 物理 法学 几何学 光学 量子力学 政治学
作者
Yi-Kun Tang,Heyan Huang,Xuewen Shi,Xian-Ling Mao
出处
期刊:ACM Transactions on Asian and Low-Resource Language Information Processing 卷期号:22 (4): 1-18
标识
DOI:10.1145/3578583
摘要

Neural variational inference-based topic modeling has gained great success in mining abstract topics from documents. However, these topic models usually mainly focus on optimizing the topic proportions for documents, while the quality and the internal construction of topics are usually neglected. Specifically, these models lack the guarantee that semantically related words are supposed to be assigned to the same topic and are difficult to ensure the interpretability of topics. Moreover, many topical words recur frequently in the top words of different topics, which makes the learned topics semantically redundant and similar, and of little significance for further study. To solve the above problems, we propose a novel neural topic model called Neural Variational Gaussian Mixture Topic Model (NVGMTM). We use Gaussian distribution to depict the semantic relevance between words in the topics. Each topic in NVGMTM is considered as a multivariate Gaussian distribution over words in the word-embedding space. Thus, semantically related words share similar probabilities in each topic, which makes the topics more coherent and interpretable. Experimental results on two public corpora show the proposed model outperforms the state-of-the-art baselines.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
年轻的元菱应助机灵柚子采纳,获得10
刚刚
NexusExplorer应助castro采纳,获得10
1秒前
1秒前
2秒前
张铃仪发布了新的文献求助10
2秒前
juice完成签到,获得积分10
3秒前
ysq发布了新的文献求助10
3秒前
hs完成签到,获得积分10
4秒前
Chang发布了新的文献求助10
4秒前
3033完成签到,获得积分20
4秒前
英姑应助11采纳,获得30
4秒前
5秒前
QDUlong发布了新的文献求助10
6秒前
3033发布了新的文献求助10
7秒前
9秒前
Chang完成签到,获得积分10
9秒前
Hyacinth完成签到,获得积分10
10秒前
10秒前
10秒前
pinging发布了新的文献求助10
10秒前
11秒前
11秒前
11秒前
11秒前
11秒前
夜白应助shionn采纳,获得20
11秒前
11秒前
weiweiwu12完成签到,获得积分10
12秒前
12秒前
12秒前
12秒前
12秒前
12秒前
12秒前
12秒前
12秒前
12秒前
12秒前
12秒前
12秒前
高分求助中
Manual of Clinical Microbiology, 4 Volume Set (ASM Books) 13th Edition 1000
Sport in der Antike 800
De arte gymnastica. The art of gymnastics 600
Berns Ziesemer - Maos deutscher Topagent: Wie China die Bundesrepublik eroberte 500
Stephen R. Mackinnon - Chen Hansheng: China’s Last Romantic Revolutionary (2023) 500
Sport in der Antike Hardcover – March 1, 2015 500
Boris Pesce - Gli impiegati della Fiat dal 1955 al 1999 un percorso nella memoria 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2422058
求助须知:如何正确求助?哪些是违规求助? 2111559
关于积分的说明 5345491
捐赠科研通 1839069
什么是DOI,文献DOI怎么找? 915501
版权声明 561201
科研通“疑难数据库(出版商)”最低求助积分说明 489590