清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

BERT-TFBS: a novel BERT-based model for predicting transcription factor binding sites by transfer learning

计算机科学 DNA结合位点 编码器 卷积神经网络 编码 学习迁移 人工智能 源代码 深度学习 机器学习 发起人 基因 生物 遗传学 基因表达 操作系统
作者
Kai Wang,Xuan Zeng,Jingwen Zhou,Fei Liu,Xiaoli Luan,Xinglong Wang
出处
期刊:Briefings in Bioinformatics [Oxford University Press]
卷期号:25 (3) 被引量:7
标识
DOI:10.1093/bib/bbae195
摘要

Abstract Transcription factors (TFs) are proteins essential for regulating genetic transcriptions by binding to transcription factor binding sites (TFBSs) in DNA sequences. Accurate predictions of TFBSs can contribute to the design and construction of metabolic regulatory systems based on TFs. Although various deep-learning algorithms have been developed for predicting TFBSs, the prediction performance needs to be improved. This paper proposes a bidirectional encoder representations from transformers (BERT)-based model, called BERT-TFBS, to predict TFBSs solely based on DNA sequences. The model consists of a pre-trained BERT module (DNABERT-2), a convolutional neural network (CNN) module, a convolutional block attention module (CBAM) and an output module. The BERT-TFBS model utilizes the pre-trained DNABERT-2 module to acquire the complex long-term dependencies in DNA sequences through a transfer learning approach, and applies the CNN module and the CBAM to extract high-order local features. The proposed model is trained and tested based on 165 ENCODE ChIP-seq datasets. We conducted experiments with model variants, cross-cell-line validations and comparisons with other models. The experimental results demonstrate the effectiveness and generalization capability of BERT-TFBS in predicting TFBSs, and they show that the proposed model outperforms other deep-learning models. The source code for BERT-TFBS is available at https://github.com/ZX1998-12/BERT-TFBS.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
青山完成签到 ,获得积分10
29秒前
千里草完成签到,获得积分10
43秒前
59秒前
在水一方完成签到 ,获得积分0
1分钟前
zhangsan完成签到,获得积分0
1分钟前
001完成签到,获得积分10
1分钟前
pjjpk01完成签到,获得积分10
2分钟前
2分钟前
哈喽发布了新的文献求助10
2分钟前
Richard完成签到,获得积分10
2分钟前
2分钟前
科研通AI2S应助哈喽采纳,获得10
3分钟前
大个应助哈喽采纳,获得10
3分钟前
鬼笔环肽完成签到 ,获得积分10
3分钟前
随心所欲完成签到 ,获得积分10
4分钟前
世间安得双全法完成签到,获得积分0
4分钟前
三水完成签到 ,获得积分10
4分钟前
Hu6868给Hu6868的求助进行了留言
4分钟前
小许完成签到 ,获得积分10
4分钟前
脑洞疼应助YHL采纳,获得10
5分钟前
牛黄完成签到 ,获得积分10
6分钟前
6分钟前
夕禾发布了新的文献求助10
6分钟前
无所畏惧完成签到 ,获得积分10
6分钟前
小蘑菇应助斯文的冰蓝采纳,获得10
6分钟前
建建完成签到,获得积分10
6分钟前
7分钟前
7分钟前
领导范儿应助科研通管家采纳,获得10
7分钟前
赘婿应助斯文的冰蓝采纳,获得10
7分钟前
火锅完成签到,获得积分10
7分钟前
海边的曼彻斯特完成签到 ,获得积分10
7分钟前
8分钟前
火锅发布了新的文献求助10
8分钟前
GMEd1son完成签到,获得积分10
8分钟前
9分钟前
kyokyoro完成签到,获得积分10
9分钟前
00发布了新的文献求助10
9分钟前
qqq完成签到 ,获得积分0
9分钟前
科研通AI2S应助科研通管家采纳,获得10
9分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Molecular Biology of Cancer: Mechanisms, Targets, and Therapeutics 3000
Les Mantodea de guyane 2500
VASCULITIS(血管炎)Rheumatic Disease Clinics (Clinics Review Articles) —— 《风湿病临床》(临床综述文章) 1000
Feldspar inclusion dating of ceramics and burnt stones 1000
The Oxford Handbook of Transcranial Stimulation: Second Edition (2nd edn) 820
What is the Future of Psychotherapy in a Digital Age? 801
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5973216
求助须知:如何正确求助?哪些是违规求助? 7306674
关于积分的说明 15996902
捐赠科研通 5111811
什么是DOI,文献DOI怎么找? 2744828
邀请新用户注册赠送积分活动 1711554
关于科研通互助平台的介绍 1622455