PLPMpro: Enhancing promoter sequence prediction with prompt-learning based pre-trained language model

计算机科学 人工智能 利用 机器学习 抄写(语言学) 深度学习 语言模型 透视图(图形) 序列(生物学) 计算生物学 生物 遗传学 哲学 语言学 计算机安全
作者
Zhongshen Li,Junru Jin,Wentao Long,Leyi Wei
出处
期刊:Computers in Biology and Medicine [Elsevier BV]
卷期号:164: 107260-107260 被引量:4
标识
DOI:10.1016/j.compbiomed.2023.107260
摘要

The promoter region, positioned proximal to the transcription start sites, exerts control over the initiation of gene transcription by modulating the interaction with RNA polymerase. Consequently, the accurate recognition of promoter regions represents a critical focus within the bioinformatics domain. Although some methods leveraging pre-trained language models (PLMs) for promoter prediction have been proposed, the full potential of such PLMs remains largely untapped. In this study, we introduce PLPMpro, a model that capitalizes on prompt-learning and the pre-trained language model to enhance the prediction of promoter sequences. PLPMpro effectively harnesses the prompt learning paradigm to fully exploit the inherent capacities of the PLM, resulting in substantial improvements in prediction performance. Experiment results unequivocally demonstrate the efficacy of prompt learning in bolstering the capabilities of the pre-trained model. Consequently, PLPMpro surpasses both typical pre-trained model-based methods for promoter prediction and typical deep learning methods. Furthermore, we conduct various experiments to meticulously scrutinize the effects of different prompt learning settings and different numbers of soft modules on the model performance. More importantly, the interpretation experiment reveals that the pre-trained model captures biological semantics. Collectively, this research imparts a novel perspective on the optimal utilization of PLMs for addressing biological problems.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
一吃就饱发布了新的文献求助10
刚刚
刚刚
2秒前
不发一区不改名完成签到 ,获得积分10
2秒前
香蕉觅云应助忧虑的代容采纳,获得10
2秒前
芋泥桃桃完成签到,获得积分10
4秒前
5秒前
充电宝应助赫赫采纳,获得10
6秒前
北北完成签到,获得积分10
6秒前
8秒前
10秒前
TRACEY完成签到,获得积分10
10秒前
12秒前
tjfwg完成签到,获得积分10
13秒前
cbp560发布了新的文献求助10
13秒前
所所应助Chloe采纳,获得10
14秒前
ariaooo发布了新的文献求助10
15秒前
18秒前
义气的钥匙完成签到,获得积分10
20秒前
lenne完成签到,获得积分10
22秒前
中国郎完成签到 ,获得积分10
22秒前
明芬发布了新的文献求助10
23秒前
24秒前
xiaoguoxiaoguo完成签到,获得积分10
28秒前
miemie发布了新的文献求助10
30秒前
研友_enP05n完成签到,获得积分10
30秒前
30秒前
星辰大海应助TRACEY采纳,获得10
32秒前
爆米花应助安静的幼旋采纳,获得10
32秒前
田玲念完成签到,获得积分10
33秒前
蓝醉澹翠妖娆应助赵永斌采纳,获得10
34秒前
Ava应助明芬采纳,获得10
34秒前
35秒前
小蘑菇应助糊涂的大象采纳,获得10
37秒前
subohr发布了新的文献求助10
38秒前
38秒前
外向的曲奇完成签到,获得积分10
38秒前
潇潇雨歇发布了新的文献求助20
39秒前
华仔应助小王同志采纳,获得10
39秒前
Chloe发布了新的文献求助10
41秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Rapid Review of Electrodiagnostic and Neuromuscular Medicine: A Must-Have Reference for Neurologists and Physiatrists 800
求中国石油大学(北京)图书馆的硕士论文,作者董晨,十年前搞太赫兹的 500
Vertebrate Palaeontology, 5th Edition 500
Narrative Method and Narrative form in Masaccio's Tribute Money 500
Aircraft Engine Design, Third Edition 500
Neonatal and Pediatric ECMO Simulation Scenarios 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 4769054
求助须知:如何正确求助?哪些是违规求助? 4105314
关于积分的说明 12699354
捐赠科研通 3823522
什么是DOI,文献DOI怎么找? 2110144
邀请新用户注册赠送积分活动 1134535
关于科研通互助平台的介绍 1015920