Leveraging Large Language Models for Contextual Prioritization of Contaminants of Emerging Concern in Chemical Mixtures

工作流程 背景(考古学) 计算机科学 优先次序 口译(哲学) 化学空间 风险分析(工程) 生化工程 注释 数据科学 化学毒性 风险评估 贝叶斯网络 风险管理 数据集成 化学过程 钥匙(锁) 修剪 环境科学 化学工业 公制(单位)
作者
Fei Cheng,Qianhui Li,Lan He,Huizhen Li,Bryan W. Brooks,Zhiqiang Yu,Jing You
出处
期刊:Environmental Science & Technology [American Chemical Society]
卷期号:60 (15): 11380-11391
标识
DOI:10.1021/acs.est.6c01342
摘要

Effective management of chemical mixtures presents a continuing challenge due to the growing diversity and inadequate characterization of contaminants of emerging concern (CECs). While recent advances in nontarget analysis enable the generation of extensive chemical inventories, key bottlenecks have shifted to postidentification interpretation within heterogeneous data. Here, we present an agent-based workflow that integrates large language models (LLMs) with functional categories, potential sources, and toxicology information to support risk prioritization. The practical technical components and evaluation benchmarks for LLMs were established, showing that optimized prompts and the best-performing model (GPT-4-Turbo) among the seven candidates enhanced user alignment with context perfectly. Integrating real-world data through retrieval-augmented generation enabled us to retrieve 100% truthful content, and further fine-tuning nearly doubled response consistency, substantially reducing hallucination. The workflow was validated using two mixture scenarios to assess the applicability across matrices and chemical contexts. The agent enabled complete functional and source annotation of chemicals by querying the NORMAN Network and achieved ∼85% accuracy for substances absent from existing databases by emulating NORMAN-aligned logic. This capability allowed mixture-level interpretation of chemical inventory, revealing dominant categories and industrial sources, such as lubricants in shale gas flowback produced water and semiconductor-related industrial intermediates, which contributed to elevated risks in the studied scenarios.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
汉堡包应助学术小白two采纳,获得10
2秒前
2秒前
Capricorn完成签到 ,获得积分10
2秒前
3秒前
3秒前
3秒前
3秒前
LJ发布了新的文献求助10
4秒前
每天都在找完成签到,获得积分0
4秒前
wbb1234554发布了新的文献求助30
4秒前
hy发布了新的文献求助10
4秒前
孤风发布了新的文献求助10
4秒前
ysssbq完成签到,获得积分10
5秒前
6秒前
852应助zclm采纳,获得10
6秒前
7秒前
背后的以菱关注了科研通微信公众号
7秒前
aibing发布了新的文献求助10
7秒前
8秒前
Akim应助堆堆采纳,获得10
8秒前
8秒前
8秒前
zeng发布了新的文献求助10
8秒前
栗子完成签到,获得积分10
8秒前
9秒前
烂漫的书蕾完成签到,获得积分10
9秒前
9秒前
无奈小熊猫给难过的冰蓝的求助进行了留言
9秒前
asheng98完成签到,获得积分10
9秒前
plankton发布了新的文献求助20
10秒前
10秒前
刘禹彤完成签到,获得积分10
11秒前
11秒前
林志坚完成签到 ,获得积分10
11秒前
汉堡包应助X_X采纳,获得10
11秒前
hsadu完成签到 ,获得积分10
11秒前
orixero应助124采纳,获得10
11秒前
12秒前
demon王完成签到,获得积分10
12秒前
桐桐应助量子化采纳,获得10
12秒前
高分求助中
Principles of Economics, 11th Edition 10000
Prescott's Microbiology: 2026 Release ISE 10000
University Physics with Modern Physics, 16th edition 10000
Cronologia da história de Macau 5000
Environmental Leverage in Times of Climate Crisis: Product Standards, Carbon Border Measures and Preferential Trade Agreements 1000
Interactions of Vowel Quality and Prosody in East Slavic 1000
Erwählung und Berufung bei Paulus: Bedeutung, Entwicklung und Funktion einer Vorstellung in ihrem frühjüdischen und griechisch-römischen Kontext 850
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 内科学 物理 复合材料 催化作用 细胞生物学 无机化学 光电子学 物理化学 电极 基因
热门帖子
关注 科研通微信公众号,转发送积分 7154546
求助须知:如何正确求助?哪些是违规求助? 8799471
关于积分的说明 18596190
捐赠科研通 6754465
什么是DOI,文献DOI怎么找? 3160922
关于科研通互助平台的介绍 2294889
邀请新用户注册赠送积分活动 2135578