清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

RBP-TSTL is a two-stage transfer learning framework for genome-scale prediction of RNA-binding proteins

人工智能 计算机科学 学习迁移 深度学习 特征(语言学) 机器学习 计算生物学 RNA结合蛋白 基因 核糖核酸 生物 遗传学 哲学 语言学
作者
Xinxin Peng,Xiaoyu Wang,Hyewon Lee,Zongyuan Ge,Fuyi Li,Xin Gao,Jiangning Song
出处
期刊:Briefings in Bioinformatics [Oxford University Press]
卷期号:23 (4) 被引量:3
标识
DOI:10.1093/bib/bbac215
摘要

Abstract RNA binding proteins (RBPs) are critical for the post-transcriptional control of RNAs and play vital roles in a myriad of biological processes, such as RNA localization and gene regulation. Therefore, computational methods that are capable of accurately identifying RBPs are highly desirable and have important implications for biomedical and biotechnological applications. Here, we propose a two-stage deep transfer learning-based framework, termed RBP-TSTL, for accurate prediction of RBPs. In the first stage, the knowledge from the self-supervised pre-trained model was extracted as feature embeddings and used to represent the protein sequences, while in the second stage, a customized deep learning model was initialized based on an annotated pre-training RBPs dataset before being fine-tuned on each corresponding target species dataset. This two-stage transfer learning framework can enable the RBP-TSTL model to be effectively trained to learn and improve the prediction performance. Extensive performance benchmarking of the RBP-TSTL models trained using the features generated by the self-supervised pre-trained model and other models trained using hand-crafting encoding features demonstrated the effectiveness of the proposed two-stage knowledge transfer strategy based on the self-supervised pre-trained models. Using the best-performing RBP-TSTL models, we further conducted genome-scale RBP predictions for Homo sapiens, Arabidopsis thaliana, Escherichia coli, and Salmonella and established a computational compendium containing all the predicted putative RBPs candidates. We anticipate that the proposed RBP-TSTL approach will be explored as a useful tool for the characterization of RNA-binding proteins and exploration of their sequence–structure–function relationships.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
天天快乐应助科研通管家采纳,获得10
15秒前
青羽落霞完成签到 ,获得积分10
31秒前
wure10完成签到 ,获得积分10
50秒前
1分钟前
科研通AI2S应助科研通管家采纳,获得10
2分钟前
科研通AI2S应助科研通管家采纳,获得10
2分钟前
2分钟前
3分钟前
科研通AI5应助Nn采纳,获得10
3分钟前
3分钟前
Nn发布了新的文献求助10
3分钟前
玛卡巴卡爱吃饭完成签到 ,获得积分10
4分钟前
4分钟前
Sunny完成签到,获得积分10
5分钟前
xiaxiao完成签到,获得积分0
5分钟前
Nn完成签到,获得积分20
5分钟前
快乐随心完成签到 ,获得积分10
5分钟前
Nn发布了新的文献求助10
5分钟前
widesky777完成签到 ,获得积分0
6分钟前
欢呼的冰蝶完成签到,获得积分10
6分钟前
Wang完成签到 ,获得积分20
7分钟前
Owen应助Xin采纳,获得10
7分钟前
文献搬运工完成签到 ,获得积分10
8分钟前
宇文非笑完成签到 ,获得积分10
8分钟前
完美世界应助985博士采纳,获得10
8分钟前
丘比特应助LULU采纳,获得20
9分钟前
9分钟前
9分钟前
whardon发布了新的文献求助10
9分钟前
merrylake完成签到 ,获得积分10
10分钟前
科研通AI2S应助科研通管家采纳,获得10
10分钟前
捉迷藏完成签到,获得积分10
11分钟前
11分钟前
qipengchen发布了新的文献求助10
11分钟前
Becky完成签到 ,获得积分10
11分钟前
斯文败类应助科研通管家采纳,获得10
12分钟前
cadcae完成签到,获得积分10
12分钟前
12分钟前
哈哈哈发布了新的文献求助10
12分钟前
12分钟前
高分求助中
The Oxford Encyclopedia of the History of Modern Psychology 1500
Parametric Random Vibration 600
城市流域产汇流机理及其驱动要素研究—以北京市为例 500
Plasmonics 500
Drug distribution in mammals 500
Building Quantum Computers 458
Happiness in the Nordic World 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3857311
求助须知:如何正确求助?哪些是违规求助? 3399737
关于积分的说明 10613474
捐赠科研通 3122022
什么是DOI,文献DOI怎么找? 1721183
邀请新用户注册赠送积分活动 828920
科研通“疑难数据库(出版商)”最低求助积分说明 777928