ESGReveal: An LLM-based approach for extracting structured data from ESG reports

透明度(行为) 计算机科学 公司治理 元数据 企业社会责任 持续性 数据提取 市值 证券交易所 过程管理 会计 业务 数据科学 数据挖掘 股票市场 财务 万维网 地理 政治学 法学 生态学 背景(考古学) 计算机安全 梅德林 考古 生物
作者
Yi Zeng,Mengying Shi,Zhongjie Chen,Zhu Deng,Lei Zhu,Zhi Zeng,Shuai Yang,Hanghang Tong,Ling Xiao,Wenwen Zhou
出处
期刊:Cornell University - arXiv
标识
DOI:10.48550/arxiv.2312.17264
摘要

ESGReveal is an innovative method proposed for efficiently extracting and analyzing Environmental, Social, and Governance (ESG) data from corporate reports, catering to the critical need for reliable ESG information retrieval. This approach utilizes Large Language Models (LLM) enhanced with Retrieval Augmented Generation (RAG) techniques. The ESGReveal system includes an ESG metadata module for targeted queries, a preprocessing module for assembling databases, and an LLM agent for data extraction. Its efficacy was appraised using ESG reports from 166 companies across various sectors listed on the Hong Kong Stock Exchange in 2022, ensuring comprehensive industry and market capitalization representation. Utilizing ESGReveal unearthed significant insights into ESG reporting with GPT-4, demonstrating an accuracy of 76.9% in data extraction and 83.7% in disclosure analysis, which is an improvement over baseline models. This highlights the framework's capacity to refine ESG data analysis precision. Moreover, it revealed a demand for reinforced ESG disclosures, with environmental and social data disclosures standing at 69.5% and 57.2%, respectively, suggesting a pursuit for more corporate transparency. While current iterations of ESGReveal do not process pictorial information, a functionality intended for future enhancement, the study calls for continued research to further develop and compare the analytical capabilities of various LLMs. In summary, ESGReveal is a stride forward in ESG data processing, offering stakeholders a sophisticated tool to better evaluate and advance corporate sustainability efforts. Its evolution is promising in promoting transparency in corporate reporting and aligning with broader sustainable development aims.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
ning完成签到,获得积分10
3秒前
reading gene发布了新的文献求助10
4秒前
fff完成签到 ,获得积分10
5秒前
lily完成签到 ,获得积分10
5秒前
bwh完成签到,获得积分10
6秒前
自知难明完成签到,获得积分10
6秒前
针尖上的王子完成签到,获得积分10
6秒前
兴奋蜡烛完成签到,获得积分10
9秒前
hihi完成签到,获得积分10
13秒前
cctv18应助duonicola采纳,获得30
15秒前
Spark完成签到 ,获得积分10
17秒前
HtzSir完成签到,获得积分10
17秒前
旺仔小甜欣完成签到,获得积分10
23秒前
时尚听筠完成签到,获得积分10
25秒前
29秒前
阳光彩虹小白马完成签到 ,获得积分10
32秒前
33秒前
所所应助朱灭龙采纳,获得10
33秒前
holly发布了新的文献求助10
34秒前
某某某完成签到 ,获得积分10
34秒前
星河长明完成签到,获得积分10
34秒前
34秒前
35秒前
晨曦发布了新的文献求助30
37秒前
wanci应助你好啊采纳,获得10
39秒前
丈八二桃发布了新的文献求助10
39秒前
高贵路灯发布了新的文献求助10
39秒前
孝艺完成签到 ,获得积分10
41秒前
和谐小南完成签到,获得积分10
48秒前
香蕉觅云应助丈八二桃采纳,获得10
48秒前
50秒前
就看最后一篇完成签到 ,获得积分10
51秒前
星辰大海应助NULI采纳,获得10
53秒前
彪壮的小五完成签到,获得积分10
53秒前
杏林靴子完成签到,获得积分10
54秒前
满满阳光完成签到,获得积分10
54秒前
jg完成签到,获得积分10
56秒前
licheng完成签到,获得积分10
57秒前
稳重元菱发布了新的文献求助10
57秒前
ommphey完成签到 ,获得积分10
58秒前
高分求助中
Un calendrier babylonien des travaux, des signes et des mois: Séries iqqur îpuš 1036
Sustainable Land Management: Strategies to Cope with the Marginalisation of Agriculture 1000
Corrosion and Oxygen Control 600
Python Programming for Linguistics and Digital Humanities: Applications for Text-Focused Fields 500
Heterocyclic Stilbene and Bibenzyl Derivatives in Liverworts: Distribution, Structures, Total Synthesis and Biological Activity 500
重庆市新能源汽车产业大数据招商指南(两链两图两池两库两平台两清单两报告) 400
Division and square root. Digit-recurrence algorithms and implementations 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2546350
求助须知:如何正确求助?哪些是违规求助? 2175744
关于积分的说明 5600595
捐赠科研通 1896474
什么是DOI,文献DOI怎么找? 946322
版权声明 565379
科研通“疑难数据库(出版商)”最低求助积分说明 503557