清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Accounting for Digestion Enzyme Bias in Casanovo

胰蛋白酶 计算生物学 元数据 消化(炼金术) 质谱法 产量(工程) 计算机科学 化学 色谱法 生物化学 数据挖掘 生物 材料科学 冶金 操作系统
作者
Carlo Melendez,Justin J. Sanders,Melih Yilmaz,Wout Bittremieux,William E. Fondrie,Sewoong Oh,William Stafford Noble
出处
期刊:Journal of Proteome Research [American Chemical Society]
被引量:1
标识
DOI:10.1021/acs.jproteome.4c00422
摘要

A key parameter of any bottom-up proteomics mass spectrometry experiment is the identity of the enzyme that is used to digest proteins in the sample into peptides. The Casanovo de novo sequencing model was trained using data that was generated with trypsin digestion; consequently, the model prefers to predict peptides that end with the amino acids "K" or "R". This bias is desirable when Casanovo is used to analyze data that was also generated using trypsin but can be problematic if the data was generated using some other digestion enzyme. In this work, we modify Casanovo to take as input the identity of the digestion enzyme alongside each observed spectrum. We then train Casanovo with data generated by using several different enzymes, and we demonstrate that the resulting model successfully learns to capture enzyme-specific behavior. However, we find, surprisingly, that this new model does not yield a significant improvement in sequencing accuracy relative to a model trained without enzyme information but using the same training set. This observation may have important implications for future attempts to make use of experimental metadata in de novo sequencing models.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
bookgg完成签到 ,获得积分10
11秒前
cdercder应助科研通管家采纳,获得10
16秒前
华仔应助科研通管家采纳,获得10
16秒前
cdercder应助科研通管家采纳,获得10
17秒前
20秒前
科研狗完成签到 ,获得积分10
22秒前
语亦菲扬921完成签到,获得积分10
26秒前
Rwslpy完成签到 ,获得积分10
36秒前
Skywalk满天星完成签到,获得积分10
37秒前
发嗲的慕蕊完成签到 ,获得积分10
41秒前
lql完成签到 ,获得积分10
42秒前
digger2023完成签到 ,获得积分10
57秒前
牛马完成签到 ,获得积分10
1分钟前
shyxia完成签到 ,获得积分10
1分钟前
勤恳的TT完成签到 ,获得积分10
1分钟前
CHEN完成签到 ,获得积分10
1分钟前
czzlancer完成签到,获得积分10
1分钟前
孳孳为善6387完成签到,获得积分10
1分钟前
Lz555完成签到 ,获得积分10
1分钟前
he完成签到 ,获得积分10
1分钟前
1分钟前
ira完成签到,获得积分10
1分钟前
kenchilie完成签到 ,获得积分10
1分钟前
阿星捌完成签到 ,获得积分10
1分钟前
木南完成签到 ,获得积分10
1分钟前
霍霍完成签到 ,获得积分10
2分钟前
bono完成签到 ,获得积分10
2分钟前
涛1完成签到 ,获得积分10
2分钟前
2分钟前
Zhaoyuemeng发布了新的文献求助20
2分钟前
年轻的笙完成签到,获得积分10
2分钟前
大个应助ybwei2008_163采纳,获得10
2分钟前
弧光完成签到 ,获得积分10
2分钟前
zhangkx23发布了新的文献求助10
2分钟前
浚稚完成签到 ,获得积分10
3分钟前
lily336699完成签到,获得积分10
3分钟前
大模型应助ybwei2008_163采纳,获得10
3分钟前
研究啥完成签到,获得积分10
3分钟前
3分钟前
ybwei2008_163发布了新的文献求助10
3分钟前
高分求助中
Applied Survey Data Analysis (第三版, 2025) 800
Narcissistic Personality Disorder 700
Assessing and Diagnosing Young Children with Neurodevelopmental Disorders (2nd Edition) 700
The Elgar Companion to Consumer Behaviour and the Sustainable Development Goals 540
Images that translate 500
Transnational East Asian Studies 400
Mapping the Stars: Celebrity, Metonymy, and the Networked Politics of Identity 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3843292
求助须知:如何正确求助?哪些是违规求助? 3385538
关于积分的说明 10540750
捐赠科研通 3106152
什么是DOI,文献DOI怎么找? 1710900
邀请新用户注册赠送积分活动 823818
科研通“疑难数据库(出版商)”最低求助积分说明 774308