Creation of a structured solar cell material dataset and performance prediction using large language models

计算机科学 推论 任务(项目管理) 特征选择 人工智能 机器学习 自然语言处理 选择(遗传算法) 性能预测 数据科学 数据挖掘 系统工程 工程类 模拟
作者
Tong Xie,Yuwei Wan,Yufei Zhou,Wei Huang,Yixuan Liu,Qingyuan Linghu,Shaozhou Wang,Chunyu Kit,Clara Grazian,Wenjie Zhang,Bram Hoex
出处
期刊:Patterns [Elsevier BV]
卷期号:5 (5): 100955-100955 被引量:11
标识
DOI:10.1016/j.patter.2024.100955
摘要

Materials scientists usually collect experimental data to summarize experiences and predict improved materials. However, a crucial issue is how to proficiently utilize unstructured data to update existing structured data, particularly in applied disciplines. This study introduces a new natural language processing (NLP) task called structured information inference (SII) to address this problem. We propose an end-to-end approach to summarize and organize the multi-layered device-level information from the literature into structured data. After comparing different methods, we fine-tuned LLaMA with an F1 score of 87.14% to update an existing perovskite solar cell dataset with articles published since its release, allowing its direct use in subsequent data analysis. Using structured information, we developed regression tasks to predict the electrical performance of solar cells. Our results demonstrate comparable performance to traditional machine-learning methods without feature selection and highlight the potential of large language models for scientific knowledge acquisition and material development.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
科目三应助宁地啊采纳,获得10
刚刚
希望天下0贩的0应助zhaowei采纳,获得10
刚刚
爱吃冻梨发布了新的文献求助20
3秒前
3秒前
小许会更好完成签到,获得积分10
5秒前
liaokilo发布了新的文献求助50
5秒前
8秒前
zhaowei完成签到,获得积分10
10秒前
量子星尘发布了新的文献求助10
11秒前
11秒前
皛鱼完成签到,获得积分10
12秒前
江河发布了新的文献求助10
13秒前
陈佳谊完成签到 ,获得积分20
14秒前
小马甲应助11采纳,获得30
15秒前
在水一方应助Xzmmmm采纳,获得10
15秒前
HYYYa应助朱明静采纳,获得10
16秒前
16秒前
17秒前
19秒前
20秒前
20秒前
ding应助崔昕雨采纳,获得10
22秒前
23秒前
23秒前
科研通AI6应助坚定的依丝采纳,获得10
24秒前
待定完成签到,获得积分10
25秒前
罗先生完成签到,获得积分10
25秒前
25秒前
量子星尘发布了新的文献求助10
26秒前
27秒前
待定发布了新的文献求助10
27秒前
星辉的斑斓完成签到 ,获得积分10
28秒前
29秒前
30秒前
科研通AI6应助哈哈采纳,获得10
30秒前
土豆条子完成签到,获得积分10
33秒前
34秒前
35秒前
昕昕完成签到,获得积分10
36秒前
俊逸鸣凤发布了新的文献求助10
39秒前
高分求助中
(禁止应助)【重要!!请各位详细阅读】【科研通的精品贴汇总】 10000
Organic Chemistry 1500
The Netter Collection of Medical Illustrations: Digestive System, Volume 9, Part III - Liver, Biliary Tract, and Pancreas (3rd Edition) 600
物理流体力学(第三版)西安交通大学出版社 500
Introducing Sociology Using the Stuff of Everyday Life 400
Conjugated Polymers: Synthesis & Design 400
Picture Books with Same-sex Parented Families: Unintentional Censorship 380
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 4259070
求助须知:如何正确求助?哪些是违规求助? 3791949
关于积分的说明 11894479
捐赠科研通 3439907
什么是DOI,文献DOI怎么找? 1887895
邀请新用户注册赠送积分活动 938681
科研通“疑难数据库(出版商)”最低求助积分说明 844148