Phenotype Classification using Proteome Data in a Data-Independent Acquisition Tensor Format

深度学习 人工智能 人工神经网络 可视化 计算机科学 蛋白质组 模式识别(心理学) 文件格式 化学 计算生物学 数据库 生物化学 生物
作者
Fangfei Zhang,Shaoyang Yu,Lirong Wu,Zelin Zang,Yi Xiao,Jiang Zhu,Cong Lu,Ping Sun,Yaoting Sun,Sathiyamoorthy Selvarajan,Lirong Chen,Xiaodong Teng,Yongfu Zhao,Guangzhi Wang,Junhong Xiao,Shiang Huang,Oi Lian Kon,N. Gopalakrishna Iyer,Stan Z. Li,Zhongzhi Luan,Tiannan Guo
出处
期刊:Journal of the American Society for Mass Spectrometry [American Chemical Society]
卷期号:31 (11): 2296-2304 被引量:8
标识
DOI:10.1021/jasms.0c00254
摘要

A novel approach for phenotype prediction is developed for data-independent acquisition (DIA) mass spectrometric (MS) data without the need for peptide precursor identification using existing DIA software tools. The first step converts the DIA-MS data file into a new file format called DIA tensor (DIAT), which can be used for the convenient visualization of all the ions from peptide precursors and fragments. DIAT files can be fed directly into a deep neural network to predict phenotypes such as appearances of cats, dogs, and microscopic images. As a proof of principle, we applied this approach to 102 hepatocellular carcinoma samples and achieved an accuracy of 96.8% in distinguishing malignant from benign samples. We further applied a refined model to classify thyroid nodules. Deep learning based on 492 training samples achieved an accuracy of 91.7% in an independent cohort of 216 test samples. This approach surpassed the deep-learning model based on peptide and protein matrices generated by OpenSWATH. In summary, we present a new strategy for DIA data analysis based on a novel data format called DIAT, which enables facile two-dimensional visualization of DIA proteomics data. DIAT files can be directly used for deep learning for biological and clinical phenotype classification. Future research will interpret the deep-learning models emerged from DIAT analysis.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
多边形完成签到 ,获得积分10
刚刚
铭名洺完成签到 ,获得积分10
1秒前
Owen应助wei1390采纳,获得10
2秒前
木木SCI完成签到 ,获得积分10
3秒前
颇黎完成签到,获得积分10
4秒前
5秒前
眼睛大的电脑完成签到 ,获得积分10
6秒前
7秒前
fighting完成签到,获得积分10
8秒前
power完成签到,获得积分10
8秒前
卜哥完成签到,获得积分10
8秒前
ywjkeyantong完成签到,获得积分10
9秒前
直率的宛海完成签到,获得积分10
10秒前
科研通AI2S应助荣冥幽采纳,获得10
12秒前
孟伟发布了新的文献求助10
12秒前
金木发布了新的文献求助10
13秒前
大紫罗兰馒头完成签到 ,获得积分10
14秒前
16秒前
16秒前
argon完成签到,获得积分10
18秒前
满意代萱完成签到 ,获得积分10
20秒前
马哥二弟无敌完成签到 ,获得积分10
20秒前
谢大喵完成签到 ,获得积分10
20秒前
孟伟完成签到,获得积分10
21秒前
溜了溜了发布了新的文献求助10
21秒前
Papillon完成签到,获得积分10
25秒前
阿北完成签到,获得积分10
26秒前
LegendThree完成签到,获得积分10
26秒前
27秒前
Aile。完成签到,获得积分10
31秒前
荣冥幽完成签到,获得积分10
31秒前
shang发布了新的文献求助10
32秒前
夜行完成签到,获得积分10
32秒前
卡农完成签到,获得积分10
32秒前
田様应助shengyou采纳,获得10
33秒前
学术老6完成签到,获得积分10
34秒前
lyy完成签到 ,获得积分10
35秒前
LALALADDDD发布了新的文献求助10
36秒前
planto完成签到,获得积分10
37秒前
37秒前
高分求助中
Applied Survey Data Analysis (第三版, 2025) 800
Narcissistic Personality Disorder 700
Assessing and Diagnosing Young Children with Neurodevelopmental Disorders (2nd Edition) 700
The Elgar Companion to Consumer Behaviour and the Sustainable Development Goals 540
The Martian climate revisited: atmosphere and environment of a desert planet 500
Images that translate 500
Transnational East Asian Studies 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3843340
求助须知:如何正确求助?哪些是违规求助? 3385634
关于积分的说明 10541427
捐赠科研通 3106276
什么是DOI,文献DOI怎么找? 1710911
邀请新用户注册赠送积分活动 823851
科研通“疑难数据库(出版商)”最低求助积分说明 774313