Exploiting protein language models for the precise classification of ion channels and ion transporters

稳健性(进化) 计算机科学 随机森林 一般化 人工智能 机器学习 生物 数学 数学分析 生物化学 基因
作者
Hamed Ghazikhani,Gregory Butler
出处
期刊:Proteins [Wiley]
卷期号:92 (8): 998-1055 被引量:4
标识
DOI:10.1002/prot.26694
摘要

Abstract This study introduces TooT‐PLM‐ionCT, a comprehensive framework that consolidates three distinct systems, each meticulously tailored for one of the following tasks: distinguishing ion channels (ICs) from membrane proteins (MPs), segregating ion transporters (ITs) from MPs, and differentiating ICs from ITs. Drawing upon the strengths of six Protein Language Models (PLMs)—ProtBERT, ProtBERT‐BFD, ESM‐1b, ESM‐2 (650M parameters), and ESM‐2 (15B parameters), TooT‐PLM‐ionCT employs a combination of traditional classifiers and deep learning models for nuanced protein classification. Originally validated on an existing dataset by previous researchers, our systems demonstrated superior performance in identifying ITs from MPs and distinguishing ICs from ITs, with the IC‐MP discrimination achieving state‐of‐the‐art results. In light of recommendations for additional validation, we introduced a new dataset, significantly enhancing the robustness and generalization of our models across bioinformatics challenges. This new evaluation underscored the effectiveness of TooT‐PLM‐ionCT in adapting to novel data while maintaining high classification accuracy. Furthermore, this study explores critical factors affecting classification accuracy, such as dataset balancing, the impact of using frozen versus fine‐tuned PLM representations, and the variance between half and full precision in floating‐point computations. To facilitate broader application and accessibility, a web server ( https://tootsuite.encs.concordia.ca/service/TooT-PLM-ionCT ) has been developed, allowing users to evaluate unknown protein sequences through our specialized systems for IC‐MP, IT‐MP, and IC‐IT classification tasks.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Wen完成签到,获得积分10
1秒前
盛开的芒果完成签到,获得积分10
1秒前
kanglan完成签到,获得积分10
1秒前
waiho完成签到,获得积分10
1秒前
某某完成签到,获得积分10
2秒前
豆豆发布了新的文献求助10
2秒前
waitamoment完成签到,获得积分10
2秒前
kexing完成签到 ,获得积分10
3秒前
工科小白求学路完成签到,获得积分10
3秒前
芒琪完成签到,获得积分10
3秒前
www完成签到 ,获得积分10
4秒前
liuyue完成签到,获得积分10
4秒前
养花低手完成签到 ,获得积分10
4秒前
Hou完成签到,获得积分10
5秒前
清秀寇完成签到,获得积分10
5秒前
大模型应助twive采纳,获得10
5秒前
5秒前
贪玩星完成签到,获得积分10
6秒前
渤大彭于晏完成签到,获得积分10
6秒前
言非离完成签到,获得积分10
7秒前
脑洞疼应助juju采纳,获得30
8秒前
wind完成签到,获得积分10
8秒前
hhr完成签到 ,获得积分10
8秒前
陆仓颉完成签到,获得积分10
8秒前
9秒前
深情不平完成签到,获得积分10
9秒前
nanxun完成签到,获得积分10
9秒前
Nexus应助云吃吃采纳,获得10
9秒前
澄钰羽完成签到,获得积分10
10秒前
11秒前
11秒前
夏侯初完成签到,获得积分10
12秒前
咩咩完成签到,获得积分10
13秒前
昏睡的帆布鞋完成签到 ,获得积分10
13秒前
Kiry完成签到 ,获得积分10
13秒前
华仔应助平常聪健采纳,获得10
13秒前
伊里七完成签到 ,获得积分10
14秒前
和春住完成签到,获得积分10
14秒前
sincyking完成签到,获得积分10
14秒前
wind发布了新的文献求助10
15秒前
高分求助中
Adhesion Science: Principles & Practice 1234
Cold War Transcended: Australia's China Policy, 1949-1990 998
Signals, Systems, and Signal Processing 610
Fundamentals of Pharmaceutical and Biologics Regulations: A Global Perspective, Second Edition 600
Testimonial Injustice and Trust 510
Burger's Medicinal Chemistry and Drug Discovery 400
Fundamentals of Body MRI 3rd Edition 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6639358
求助须知:如何正确求助?哪些是违规求助? 8397036
关于积分的说明 17954311
捐赠科研通 5826249
什么是DOI,文献DOI怎么找? 2967611
邀请新用户注册赠送积分活动 1942420
关于科研通互助平台的介绍 1858072