ToxDL: deep learning using primary structure and domain embeddings for assessing protein toxicity

生物信息学 计算机科学 卷积神经网络 可转让性 深度学习 计算生物学 机器学习 人工智能 源代码 蛋白质测序 领域(数学分析) 肽序列 生物 基因 生物化学 程序设计语言 数学分析 罗伊特 数学
作者
Xiaoyong Pan,Jasper Zuallaert,Xi Wang,Hong‐Bin Shen,Elda Posada Campos,Denys Marushchak,Wesley De Neve
出处
期刊:Bioinformatics [Oxford University Press]
卷期号:36 (21): 5159-5168 被引量:50
标识
DOI:10.1093/bioinformatics/btaa656
摘要

Abstract Motivation Genetically engineering food crops involves introducing proteins from other species into crop plant species or modifying already existing proteins with gene editing techniques. In addition, newly synthesized proteins can be used as therapeutic protein drugs against diseases. For both research and safety regulation purposes, being able to assess the potential toxicity of newly introduced/synthesized proteins is of high importance. Results In this study, we present ToxDL, a deep learning-based approach for in silico prediction of protein toxicity from sequence alone. ToxDL consists of (i) a module encompassing a convolutional neural network that has been designed to handle variable-length input sequences, (ii) a domain2vec module for generating protein domain embeddings and (iii) an output module that classifies proteins as toxic or non-toxic, using the outputs of the two aforementioned modules. Independent test results obtained for animal proteins and cross-species transferability results obtained for bacteria proteins indicate that ToxDL outperforms traditional homology-based approaches and state-of-the-art machine-learning techniques. Furthermore, through visualizations based on saliency maps, we are able to verify that the proposed network learns known toxic motifs. Moreover, the saliency maps allow for directed in silico modification of a sequence, thus making it possible to alter its predicted protein toxicity. Availability and implementation ToxDL is freely available at http://www.csbio.sjtu.edu.cn/bioinf/ToxDL/. The source code can be found at https://github.com/xypan1232/ToxDL. Supplementary information Supplementary data are available at Bioinformatics online.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Alden发布了新的文献求助10
刚刚
大力惜芹完成签到 ,获得积分10
1秒前
2秒前
oywc发布了新的文献求助30
2秒前
2秒前
zero1832完成签到,获得积分10
7秒前
7秒前
IDHNAPHO发布了新的文献求助10
7秒前
欢呼平灵发布了新的文献求助10
9秒前
10秒前
英姑应助清飏采纳,获得30
10秒前
11秒前
鱼鱼鱼发布了新的文献求助10
12秒前
12秒前
13秒前
义气如萱完成签到,获得积分10
13秒前
奋斗不二完成签到,获得积分10
13秒前
小蘑菇应助IDHNAPHO采纳,获得10
16秒前
lytelope发布了新的文献求助10
16秒前
义气如萱发布了新的文献求助10
17秒前
17秒前
三把骨刀关注了科研通微信公众号
18秒前
zjz发布了新的文献求助10
18秒前
19秒前
鱼鱼鱼完成签到,获得积分10
19秒前
谨慎天问发布了新的文献求助10
21秒前
欢呼平灵完成签到,获得积分20
22秒前
小小二完成签到,获得积分10
22秒前
OcRyf5发布了新的文献求助10
24秒前
lytelope完成签到,获得积分10
25秒前
优美飞柏完成签到,获得积分10
29秒前
oywc完成签到,获得积分10
31秒前
34秒前
奋斗的蜗牛应助芷莯采纳,获得10
35秒前
SS完成签到,获得积分10
36秒前
37秒前
38秒前
答案说明所有完成签到 ,获得积分10
39秒前
42秒前
三把骨刀发布了新的文献求助10
43秒前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Les Mantodea de Guyane Insecta, Polyneoptera 2500
Computational Atomic Physics for Kilonova Ejecta and Astrophysical Plasmas 500
Technologies supporting mass customization of apparel: A pilot project 450
Mixing the elements of mass customisation 360
Периодизация спортивной тренировки. Общая теория и её практическое применение 310
the MD Anderson Surgical Oncology Manual, Seventh Edition 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3782130
求助须知:如何正确求助?哪些是违规求助? 3327565
关于积分的说明 10232237
捐赠科研通 3042513
什么是DOI,文献DOI怎么找? 1670024
邀请新用户注册赠送积分活动 799592
科研通“疑难数据库(出版商)”最低求助积分说明 758825