清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

ProteinBERT: a universal deep-learning model of protein sequence and function

人工智能 深度学习 注释 语言模型 任务(项目管理) 计算机科学 功能(生物学) 序列(生物学) 自然语言处理 方案(数学) 机器学习 数学分析 遗传学 数学 管理 进化生物学 经济 生物
作者
Nadav Brandes,Dan Ofer,Yam Peleg,Nadav Rappoport,Michal Linial
出处
期刊:Bioinformatics [Oxford University Press]
卷期号:38 (8): 2102-2110 被引量:949
标识
DOI:10.1093/bioinformatics/btac020
摘要

SUMMARY: Self-supervised deep language modeling has shown unprecedented success across natural language tasks, and has recently been repurposed to biological sequences. However, existing models and pretraining methods are designed and optimized for text analysis. We introduce ProteinBERT, a deep language model specifically designed for proteins. Our pretraining scheme combines language modeling with a novel task of Gene Ontology (GO) annotation prediction. We introduce novel architectural elements that make the model highly efficient and flexible to long sequences. The architecture of ProteinBERT consists of both local and global representations, allowing end-to-end processing of these types of inputs and outputs. ProteinBERT obtains near state-of-the-art performance, and sometimes exceeds it, on multiple benchmarks covering diverse protein properties (including protein structure, post-translational modifications and biophysical attributes), despite using a far smaller and faster model than competing deep-learning methods. Overall, ProteinBERT provides an efficient framework for rapidly training protein predictors, even with limited labeled data. AVAILABILITY AND IMPLEMENTATION: Code and pretrained model weights are available at https://github.com/nadavbra/protein_bert. SUPPLEMENTARY INFORMATION: Supplementary data are available at Bioinformatics online.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
zqgxiangbiye发布了新的文献求助10
3秒前
黄花菜完成签到 ,获得积分10
6秒前
chen完成签到 ,获得积分10
7秒前
12秒前
cdercder应助科研通管家采纳,获得10
12秒前
cdercder应助科研通管家采纳,获得10
12秒前
逍遥子完成签到,获得积分10
12秒前
flysky120完成签到,获得积分10
13秒前
满意的伊完成签到,获得积分10
26秒前
碗碗豆喵完成签到 ,获得积分10
27秒前
30秒前
35秒前
梁芯完成签到 ,获得积分10
47秒前
1分钟前
我很厉害的1q完成签到,获得积分10
1分钟前
游泳池完成签到,获得积分10
1分钟前
阿洁发布了新的文献求助10
1分钟前
qianzhihe2完成签到,获得积分10
1分钟前
horse完成签到,获得积分10
1分钟前
三脸茫然完成签到 ,获得积分0
1分钟前
会飞的柯基完成签到 ,获得积分10
1分钟前
1分钟前
ykk完成签到 ,获得积分10
1分钟前
华仔完成签到 ,获得积分10
1分钟前
可爱的函函应助Crisp采纳,获得10
1分钟前
jekyll发布了新的文献求助50
1分钟前
萨尔莫斯完成签到,获得积分10
2分钟前
2分钟前
2分钟前
2分钟前
温暖完成签到 ,获得积分10
2分钟前
Xiaojiu完成签到 ,获得积分10
2分钟前
3分钟前
Crisp发布了新的文献求助10
3分钟前
顾矜应助Garfieldlilac采纳,获得10
3分钟前
芸芸众生完成签到,获得积分10
3分钟前
3分钟前
高山流水完成签到 ,获得积分10
3分钟前
Garfieldlilac完成签到 ,获得积分20
3分钟前
Crisp完成签到,获得积分10
3分钟前
高分求助中
Adhesion Science: Principles & Practice 1234
Signals, Systems, and Signal Processing 610
Petrology and Plate Tectonics,2025 450
Circular Polar Constellations Providing Continuous Single or Multiple Coverage Above a Specified Latitude 400
Social democracy and urban politics Party responses to the diversifying left in European cities 400
Burger's Medicinal Chemistry and Drug Discovery 400
Probability and Stochastic Processes 333
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6735116
求助须知:如何正确求助?哪些是违规求助? 8468008
关于积分的说明 18068676
捐赠科研通 5998658
什么是DOI,文献DOI怎么找? 3001218
邀请新用户注册赠送积分活动 1977626
关于科研通互助平台的介绍 1938482