PseDNA‐Pro: DNA‐Binding Protein Identification by Combining Chou’s PseAAC and Physicochemical Distance Transformation

伪氨基酸组成 支持向量机 蛋白质测序 转化(遗传学) 水准点(测量) 计算机科学 人工智能 计算生物学 序列(生物学) 特征向量 特征(语言学) 蛋白质法 DNA DNA测序 机器学习 模式识别(心理学) 肽序列 序列分析 氨基酸 生物 生物化学 基因 哲学 语言学 地理 二肽 大地测量学
作者
Bin Liu,Jinghao Xu,Shixi Fan,Ruifeng Xu,Jiyun Zhou,Xiaolong Wang
出处
期刊:Molecular Informatics [Wiley]
卷期号:34 (1): 8-17 被引量:157
标识
DOI:10.1002/minf.201400025
摘要

Identification of DNA-binding proteins is an important problem in biomedical research as DNA-binding proteins are crucial for various cellular processes. Currently, the machine learning methods achieve the-state-of-the-art performance with different features. A key step to improve the performance of these methods is to find a suitable representation of proteins. In this study, we proposed a feature vector composed of three kinds of sequence-based features, including overall amino acid composition, pseudo amino acid composition (PseAAC) proposed by Chou and physicochemical distance transformation. These features not only consider the sequence composition of proteins, but also incorporate the sequence-order information of amino acids in proteins. The feature vectors were fed into Support Vector Machine (SVM) for DNA-binding protein identification. The proposed method is called PseDNA-Pro. Experiments on stringent benchmark datasets and independent test datasets by using the Jackknife test showed that PseDNA-Pro can achieve an accuracy of higher than 80 %, outperforming several state-of-the-art methods, including DNAbinder, DNA-Prot, and iDNA-Prot. These results indicate that the combination of various features for DNA-binding protein prediction is a suitable approach, and the sequence-order information among residues in proteins is relative for discrimination. For practical applications, a web-server of PseDNA-Pro was established, which is available from http://bioinformatics.hitsz.edu.cn/PseDNA-Pro/.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
chaosyw完成签到,获得积分10
3秒前
111完成签到 ,获得积分10
3秒前
Owen应助自信的孱采纳,获得10
5秒前
卷大喵完成签到,获得积分10
8秒前
15秒前
benj完成签到,获得积分10
18秒前
苍鹰发布了新的文献求助10
18秒前
kolya2013完成签到,获得积分20
22秒前
直击灵魂完成签到,获得积分10
25秒前
29秒前
ufofly730完成签到 ,获得积分10
29秒前
科研通AI5应助cs采纳,获得10
31秒前
酒菜盒子发布了新的文献求助10
35秒前
CipherSage应助GAGA采纳,获得10
35秒前
立冬完成签到,获得积分10
37秒前
38秒前
38秒前
38秒前
38秒前
38秒前
冰魂应助科研通管家采纳,获得20
38秒前
ZJFL完成签到,获得积分10
40秒前
41秒前
慕青应助酒菜盒子采纳,获得10
41秒前
九月初五完成签到 ,获得积分10
42秒前
4652376完成签到 ,获得积分10
43秒前
cs发布了新的文献求助10
44秒前
nav发布了新的文献求助10
45秒前
阁下宛歆完成签到,获得积分10
46秒前
充电宝应助LIJINGGE采纳,获得10
46秒前
微纳组刘同完成签到,获得积分10
46秒前
djdh完成签到 ,获得积分10
47秒前
小羊完成签到 ,获得积分10
48秒前
坚定的跳跳糖完成签到 ,获得积分10
49秒前
凤里完成签到 ,获得积分10
51秒前
ru完成签到 ,获得积分10
53秒前
打打应助tianshicanyi采纳,获得10
56秒前
北秋颐完成签到,获得积分20
57秒前
北秋颐发布了新的文献求助10
1分钟前
首席或雪月完成签到,获得积分10
1分钟前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Continuum Thermodynamics and Material Modelling 2000
Encyclopedia of Geology (2nd Edition) 2000
105th Edition CRC Handbook of Chemistry and Physics 1600
Maneuvering of a Damaged Navy Combatant 650
Периодизация спортивной тренировки. Общая теория и её практическое применение 310
Mixing the elements of mass customisation 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3779327
求助须知:如何正确求助?哪些是违规求助? 3324815
关于积分的说明 10220149
捐赠科研通 3039982
什么是DOI,文献DOI怎么找? 1668528
邀请新用户注册赠送积分活动 798717
科研通“疑难数据库(出版商)”最低求助积分说明 758503