亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

MSformer: A Meta-Structure Based Interpretable Framework for Representation Learning of Natural Products

可解释性 化学空间 人工智能 碎片(计算) 化学 模块化(生物学) 计算机科学 相关性(法律) 鉴定(生物学) 模块化设计 集合(抽象数据类型) 概化理论 深度学习 可扩展性 代表(政治) 药物发现 数据集 机器学习 领域知识 领域(数学分析) 转化式学习 自举(财务) 自然(考古学) 化学信息学 编码 数据科学 桥接(联网) 计算生物学 数据驱动 资源(消歧) 本体论 结构母题 特征学习 生物学数据
作者
Bingjie Zhu,Jie Liao,Huihui Liu,Xiaohui Fan,Yiyu Cheng
出处
期刊:Analytical Chemistry [American Chemical Society]
卷期号:97 (47): 26009-26023 被引量:1
标识
DOI:10.1021/acs.analchem.5c03958
摘要

Natural products (NPs) are a treasure trove of drug discovery, yet their structural complexity and extreme data scarcity critically hinder AI-driven exploration. To address this challenge, we present MSformer, a transformer-based architecture that bridges this gap by leveraging molecule fragments to systematically encode NP chemical space. These fragments were generated by a mass spectrometry-inspired fragmentation algorithm, termed meta-structures. Unlike chemical models pretrained on comprehensive molecule databases, MSformer is totally pretrained on very limited NP data set by deconstructing 400,000 NPs into 234 million meta-structures. This design enables MSformer to capture the structural richness and drug-like relevance of NPs. Evaluated on 14 tasks across MoleculeNet and the Therapeutics Data Commons data sets, MSformer outperforms state-of-the-art models, demonstrating superior generalizability in property prediction. The abundant meta-structures enable MSformer hierarchical interpretability that reveals task-specific structural determinants and successfully deconstructing approved drugs into bioactive fragments. By integrating domain knowledge with deep learning, MSformer establishes a transformative paradigm for NP-based drug discovery, offering a scalable framework to navigate nature's underexplored chemical repertoire and accelerate the identification of bioactive candidates.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
5秒前
10秒前
花陵完成签到 ,获得积分10
12秒前
nfyyqwj完成签到,获得积分10
16秒前
CodeCraft应助虚心的寒天采纳,获得10
21秒前
23秒前
Wu发布了新的文献求助10
28秒前
慕青应助跌跌撞撞采纳,获得10
33秒前
Wu完成签到,获得积分10
37秒前
王君青见完成签到,获得积分10
37秒前
47秒前
达不溜搽发布了新的文献求助10
48秒前
hh发布了新的文献求助10
54秒前
领导范儿应助hh采纳,获得10
1分钟前
ding应助F光采纳,获得10
1分钟前
PYF完成签到,获得积分10
1分钟前
白芷完成签到 ,获得积分10
1分钟前
1分钟前
F光发布了新的文献求助10
1分钟前
安尔完成签到 ,获得积分10
1分钟前
大胆的碧菡完成签到,获得积分10
2分钟前
F光完成签到,获得积分20
2分钟前
栗子熊完成签到,获得积分10
2分钟前
清欢完成签到 ,获得积分10
2分钟前
大个应助Pk采纳,获得10
2分钟前
上官若男应助666采纳,获得30
2分钟前
2分钟前
文天完成签到,获得积分10
2分钟前
zqq完成签到,获得积分0
2分钟前
2分钟前
2分钟前
2分钟前
在雨SAMA发布了新的文献求助10
3分钟前
666发布了新的文献求助30
3分钟前
FZ发布了新的文献求助10
3分钟前
666完成签到,获得积分20
3分钟前
wdasdas完成签到,获得积分10
3分钟前
pokexuejiao完成签到,获得积分10
3分钟前
慈祥的蛋挞完成签到 ,获得积分10
3分钟前
张大头发布了新的文献求助10
3分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Salmon nasal cartilage-derived proteoglycan complexes influence the gut microbiota and bacterial metabolites in mice 2000
The Composition and Relative Chronology of Dynasties 16 and 17 in Egypt 1500
Cowries - A Guide to the Gastropod Family Cypraeidae 1200
ON THE THEORY OF BIRATIONAL BLOWING-UP 666
Signals, Systems, and Signal Processing 610
LASER: A Phase 2 Trial of 177 Lu-PSMA-617 as Systemic Therapy for RCC 520
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6381055
求助须知:如何正确求助?哪些是违规求助? 8193381
关于积分的说明 17317357
捐赠科研通 5434459
什么是DOI,文献DOI怎么找? 2874646
邀请新用户注册赠送积分活动 1851385
关于科研通互助平台的介绍 1696148