Integrated mRNA sequence optimization using deep learning

非翻译区 信使核糖核酸 打开阅读框 计算生物学 基因 三素数非翻译区 生物 肽序列 计算机科学 遗传学
作者
Haoran Gong,Jianguo Wen,Ruihan Luo,Yuzhou Feng,Jingjing Guo,Hongguang Fu,Xiaobo Zhou
出处
期刊:Briefings in Bioinformatics [Oxford University Press]
卷期号:24 (1) 被引量:4
标识
DOI:10.1093/bib/bbad001
摘要

Abstract The coronavirus disease of 2019 pandemic has catalyzed the rapid development of mRNA vaccines, whereas, how to optimize the mRNA sequence of exogenous gene such as severe acute respiratory syndrome coronavirus 2 spike to fit human cells remains a critical challenge. A new algorithm, iDRO (integrated deep-learning-based mRNA optimization), is developed to optimize multiple components of mRNA sequences based on given amino acid sequences of target protein. Considering the biological constraints, we divided iDRO into two steps: open reading frame (ORF) optimization and 5′ untranslated region (UTR) and 3′UTR generation. In ORF optimization, BiLSTM-CRF (bidirectional long-short-term memory with conditional random field) is employed to determine the codon for each amino acid. In UTR generation, RNA-Bart (bidirectional auto-regressive transformer) is proposed to output the corresponding UTR. The results show that the optimized sequences of exogenous genes acquired the pattern of human endogenous gene sequence. In experimental validation, the mRNA sequence optimized by our method, compared with conventional method, shows higher protein expression. To the best of our knowledge, this is the first study by introducing deep-learning methods to integrated mRNA sequence optimization, and these results may contribute to the development of mRNA therapeutics.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
qll发布了新的文献求助10
1秒前
搬砖工完成签到,获得积分10
1秒前
咯咚完成签到 ,获得积分10
1秒前
1秒前
2秒前
2秒前
李健的小迷弟应助鲸落采纳,获得10
2秒前
称心笑柳完成签到,获得积分10
3秒前
读研好难完成签到,获得积分10
3秒前
芸苔AA完成签到,获得积分10
3秒前
ZYZTMS完成签到,获得积分10
3秒前
3秒前
分子筛完成签到,获得积分20
3秒前
布丁完成签到,获得积分10
4秒前
4秒前
少帅的科研路完成签到,获得积分20
5秒前
稀释液发布了新的文献求助30
5秒前
Mike001发布了新的文献求助10
5秒前
5秒前
5秒前
6秒前
Mike001发布了新的文献求助10
6秒前
7秒前
分子筛发布了新的文献求助10
7秒前
Oli发布了新的文献求助10
7秒前
yyds完成签到,获得积分10
7秒前
俊俊发布了新的文献求助10
7秒前
xxxHolic41完成签到,获得积分10
7秒前
8秒前
爆米花应助柏特瑞采纳,获得10
8秒前
砂锅粥发布了新的文献求助10
8秒前
9秒前
9秒前
10秒前
10秒前
11秒前
岳莹晓发布了新的文献求助10
11秒前
111完成签到,获得积分10
11秒前
罐罐儿完成签到,获得积分10
11秒前
13秒前
高分求助中
Teaching Social and Emotional Learning in Physical Education 900
Plesiosaur extinction cycles; events that mark the beginning, middle and end of the Cretaceous 500
Two-sample Mendelian randomization analysis reveals causal relationships between blood lipids and venous thromboembolism 500
Chinese-English Translation Lexicon Version 3.0 500
[Lambert-Eaton syndrome without calcium channel autoantibodies] 440
薩提亞模式團體方案對青年情侶輔導效果之研究 400
3X3 Basketball: Everything You Need to Know 310
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2387766
求助须知:如何正确求助?哪些是违规求助? 2094296
关于积分的说明 5271975
捐赠科研通 1821016
什么是DOI,文献DOI怎么找? 908378
版权声明 559289
科研通“疑难数据库(出版商)”最低求助积分说明 485288