Deep Learning Prediction of Glycopeptide Tandem Mass Spectra Powers Glycoproteomics

糖蛋白组学 糖基化 串联质谱法 聚糖 糖肽 化学信息学 计算机科学 计算生物学 质谱法 化学 糖蛋白 色谱法 生物 生物化学 抗生素 计算化学
作者
裕文 宗,Yuxin Wang,Xipeng Qiu,Xuanjing Huang,Liang Qiao
标识
DOI:10.1101/2024.02.03.575604
摘要

Abstract Protein glycosylation plays a significant role in numerous physiological and pathological cellular functions. Glycoproteomics based on liquid chromatography-tandem mass spectrometry (LC-MS/MS) studies the protein glycosylation on a proteome-wide scale to get combinational information on glycosylation site, glycosylation level and glycan structure. However, the current sequence searching-based methods for glycoproteomics often fall short in glycan structure determination due to the limited occurrence of structure-determining ions. While spectral searching methods can utilize fragment intensity information to facilitate the identification of glycopeptides, its application is hindered by the difficulties in spectral library construction. In this work, we present DeepGP, a hybrid deep learning framework based on Transformer and graph neural network (GNN), for the prediction of MS/MS spectra and retention time of glycopeptides. Two GNN modules are utilized to capture the branched glycan structure and predict glycan ions intensity, respectively. Additionally, a pre-training strategy is implemented to alleviate the insufficiency of glycoproteomics data. Testing on multiple biological datasets, we demonstrate that DeepGP can predict MS/MS spectra and retention time of glycopeptides closely aligning with the experimental results. Comprehensive benchmarking of DeepGP on synthetic and biological datasets validates its effectiveness in distinguishing similar glycoforms. Remarkably, DeepGP can differentiate isomeric glycopeptides using MS/MS spectra without diagnostic ions. Based on various decoy methods, we demonstrated that DeepGP in combination with database searching can significantly increase the detection sensitivity of glycopeptides. We outlook that DeepGP can inspire extensive future work in glycoproteomics.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Karry完成签到 ,获得积分10
7秒前
爱听歌素发布了新的文献求助10
18秒前
kaier完成签到 ,获得积分10
19秒前
19秒前
山山而川发布了新的文献求助10
20秒前
星空完成签到 ,获得积分10
23秒前
荣安安发布了新的文献求助10
24秒前
28秒前
28秒前
32秒前
khh完成签到 ,获得积分10
37秒前
明亮梦山完成签到 ,获得积分10
37秒前
荣安安完成签到,获得积分10
38秒前
失眠的安卉完成签到,获得积分10
40秒前
世界第一大庸医完成签到,获得积分10
49秒前
勤奋尔丝完成签到 ,获得积分10
50秒前
落落完成签到 ,获得积分0
56秒前
58秒前
59秒前
kumo完成签到 ,获得积分10
1分钟前
xun发布了新的文献求助10
1分钟前
yanmh完成签到,获得积分10
1分钟前
tangchao完成签到,获得积分10
1分钟前
starleo完成签到,获得积分10
1分钟前
善学以致用应助落寞代桃采纳,获得10
1分钟前
别闹闹完成签到 ,获得积分10
1分钟前
1分钟前
白枫完成签到 ,获得积分10
1分钟前
pterionGao完成签到 ,获得积分10
1分钟前
KrisTina完成签到 ,获得积分10
1分钟前
1分钟前
ksak607155发布了新的文献求助10
1分钟前
1分钟前
婉莹完成签到 ,获得积分0
1分钟前
落寞代桃发布了新的文献求助10
1分钟前
lili完成签到 ,获得积分10
2分钟前
由由完成签到 ,获得积分10
2分钟前
yinyin完成签到 ,获得积分10
2分钟前
STH完成签到 ,获得积分10
2分钟前
文静灵阳完成签到 ,获得积分10
2分钟前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Technologies supporting mass customization of apparel: A pilot project 450
Mixing the elements of mass customisation 360
Периодизация спортивной тренировки. Общая теория и её практическое применение 310
the MD Anderson Surgical Oncology Manual, Seventh Edition 300
Nucleophilic substitution in azasydnone-modified dinitroanisoles 300
Political Ideologies Their Origins and Impact 13th Edition 260
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3780879
求助须知:如何正确求助?哪些是违规求助? 3326359
关于积分的说明 10226699
捐赠科研通 3041539
什么是DOI,文献DOI怎么找? 1669502
邀请新用户注册赠送积分活动 799081
科研通“疑难数据库(出版商)”最低求助积分说明 758732