已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Large Language Models Offer an Alternative to the Traditional Approach of Topic Modelling

计算机科学 管理科学 自然语言处理 经济
作者
Yida Mu,Chun Dong,Kalina Bontcheva,Xingyi Song
出处
期刊:Cornell University - arXiv 被引量:6
标识
DOI:10.48550/arxiv.2403.16248
摘要

Topic modelling, as a well-established unsupervised technique, has found extensive use in automatically detecting significant topics within a corpus of documents. However, classic topic modelling approaches (e.g., LDA) have certain drawbacks, such as the lack of semantic understanding and the presence of overlapping topics. In this work, we investigate the untapped potential of large language models (LLMs) as an alternative for uncovering the underlying topics within extensive text corpora. To this end, we introduce a framework that prompts LLMs to generate topics from a given set of documents and establish evaluation protocols to assess the clustering efficacy of LLMs. Our findings indicate that LLMs with appropriate prompts can stand out as a viable alternative, capable of generating relevant topic titles and adhering to human guidelines to refine and merge topics. Through in-depth experiments and evaluation, we summarise the advantages and constraints of employing LLMs in topic extraction.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Ava应助lucky采纳,获得10
刚刚
yjyjj完成签到,获得积分10
2秒前
昵称完成签到,获得积分10
2秒前
7秒前
星辰大海应助萤lueluelue采纳,获得10
9秒前
9秒前
可颂完成签到 ,获得积分10
9秒前
shaonianzu完成签到 ,获得积分10
10秒前
在水一方应助科研通管家采纳,获得10
11秒前
香蕉觅云应助科研通管家采纳,获得10
11秒前
ding应助科研通管家采纳,获得10
11秒前
乐乐应助科研通管家采纳,获得10
11秒前
大个应助科研通管家采纳,获得10
11秒前
科研通AI6应助科研通管家采纳,获得10
11秒前
英姑应助科研通管家采纳,获得10
11秒前
喵喵张完成签到 ,获得积分10
11秒前
Ak完成签到,获得积分0
11秒前
缓慢的破茧完成签到 ,获得积分10
12秒前
雾气海蓝完成签到 ,获得积分10
13秒前
dao发布了新的文献求助10
14秒前
15秒前
Eureka完成签到 ,获得积分10
16秒前
16秒前
平淡的水池完成签到,获得积分10
16秒前
JamesPei应助千禧嘻嘻嘻采纳,获得10
17秒前
jj完成签到,获得积分10
18秒前
萤lueluelue完成签到,获得积分10
18秒前
单薄乐珍完成签到 ,获得积分0
19秒前
kiterunner完成签到,获得积分10
20秒前
狗头233完成签到,获得积分20
21秒前
清脆的问凝完成签到,获得积分10
21秒前
萤lueluelue发布了新的文献求助10
21秒前
22秒前
iShine完成签到 ,获得积分10
22秒前
23秒前
倾卿如玉完成签到 ,获得积分10
23秒前
南北完成签到,获得积分10
23秒前
23秒前
小易完成签到 ,获得积分10
23秒前
葛初蓝完成签到 ,获得积分10
24秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Zeolites: From Fundamentals to Emerging Applications 1500
Hidden Generalizations Phonological Opacity in Optimality Theory 500
translating meaning 500
Storie e culture della televisione 500
Selected research on camelid physiology and nutrition 500
《2023南京市住宿行业发展报告》 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 4899727
求助须知:如何正确求助?哪些是违规求助? 4180069
关于积分的说明 12976114
捐赠科研通 3944319
什么是DOI,文献DOI怎么找? 2163689
邀请新用户注册赠送积分活动 1181964
关于科研通互助平台的介绍 1087761