已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

ClimateBert: A Pretrained Language Model for Climate-Related Text

计算机科学 语言模型 自然语言处理 变压器 人工智能 领域(数学) 自然语言 语言学 哲学 物理 数学 量子力学 电压 纯数学
作者
Nicolas Webersinke,Mathias Kraus,Julia Anna Bingler,Markus Leippold
出处
期刊:Cornell University - arXiv 被引量:1
标识
DOI:10.48550/arxiv.2110.12010
摘要

Over the recent years, large pretrained language models (LM) have revolutionized the field of natural language processing (NLP). However, while pretraining on general language has been shown to work very well for common language, it has been observed that niche language poses problems. In particular, climate-related texts include specific language that common LMs can not represent accurately. We argue that this shortcoming of today's LMs limits the applicability of modern NLP to the broad field of text processing of climate-related texts. As a remedy, we propose CLIMATEBERT, a transformer-based language model that is further pretrained on over 2 million paragraphs of climate-related texts, crawled from various sources such as common news, research articles, and climate reporting of companies. We find that CLIMATEBERT leads to a 48% improvement on a masked language model objective which, in turn, leads to lowering error rates by 3.57% to 35.71% for various climate-related downstream tasks like text classification, sentiment analysis, and fact-checking.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
1秒前
j1kxm完成签到,获得积分10
2秒前
不要加糖发布了新的文献求助10
2秒前
4秒前
卉卉完成签到,获得积分10
4秒前
5秒前
orixero应助Hiker采纳,获得10
5秒前
脑洞疼应助wvwvwv采纳,获得10
7秒前
领导范儿应助将军采纳,获得10
7秒前
Pepsi发布了新的文献求助10
7秒前
lvsehx发布了新的文献求助30
7秒前
8秒前
云雨完成签到 ,获得积分10
9秒前
韩寒完成签到 ,获得积分10
14秒前
三只保全完成签到,获得积分10
14秒前
独眼发布了新的文献求助10
14秒前
15秒前
Mercury应助aiinga采纳,获得30
15秒前
七慕凉应助PDY采纳,获得10
17秒前
嚯嚯完成签到,获得积分10
17秒前
zzzq完成签到 ,获得积分10
17秒前
17秒前
cdercder应助lvsehx采纳,获得10
18秒前
将军发布了新的文献求助10
21秒前
22秒前
冷酷青枫发布了新的文献求助60
23秒前
慕青应助不要加糖采纳,获得10
23秒前
平淡又柔完成签到,获得积分10
29秒前
31秒前
33秒前
Hello应助11楼阿水采纳,获得10
36秒前
36秒前
涨涨涨发布了新的文献求助10
36秒前
十三发布了新的文献求助10
36秒前
土拨鼠完成签到,获得积分10
37秒前
songyongjian完成签到,获得积分10
37秒前
38秒前
tutu发布了新的文献求助10
39秒前
观测者L完成签到,获得积分10
40秒前
高分求助中
Les Mantodea de Guyane Insecta, Polyneoptera 2500
Mobilization, center-periphery structures and nation-building 600
Technologies supporting mass customization of apparel: A pilot project 450
China—Art—Modernity: A Critical Introduction to Chinese Visual Expression from the Beginning of the Twentieth Century to the Present Day 430
Tip60 complex regulates eggshell formation and oviposition in the white-backed planthopper, providing effective targets for pest control 400
A Field Guide to the Amphibians and Reptiles of Madagascar - Frank Glaw and Miguel Vences - 3rd Edition 400
China Gadabouts: New Frontiers of Humanitarian Nursing, 1941–51 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3792253
求助须知:如何正确求助?哪些是违规求助? 3336501
关于积分的说明 10281144
捐赠科研通 3053220
什么是DOI,文献DOI怎么找? 1675522
邀请新用户注册赠送积分活动 803469
科研通“疑难数据库(出版商)”最低求助积分说明 761436