DeepFusionGO: Protein function prediction by fusing heterogeneous features through deep learning

计算机科学 人工智能 代表(政治) 特征学习 源代码 图形 功能(生物学) 特征(语言学) 蛋白质功能预测 模式识别(心理学) 机器学习 蛋白质功能 理论计算机科学 生物 基因 进化生物学 生物化学 语言学 哲学 政治 政治学 法学 操作系统
作者
Zhijian Huang,Ruisheng Zheng,Lei Deng
标识
DOI:10.1109/bibm55620.2022.9994899
摘要

Exploring the functions of proteins is crucial for explaining cellular mechanisms, treating diseases, and developing new drugs. Due to experimental limitations, large-scale identification of protein function remains a challenging task in cell biology. Here we propose DeepFusionGo, a novel protein function prediction method that adopts a graph representation learning approach (GraphSAGE) to extract features from heterogeneous data sources. First, we generate embeddings from protein sequences using the pre-trained protein language model and InterPro domains with scaling gradient. Then we integrate these two embeddings with adaptive feature weights to the PPI graph and use GraphSAGE to generate the representation vector. Finally, we build the classification model to predict protein function based on the concatenated feature vector. The experimental results show that DeepFusionGO outperforms existing state-of-the-art methods, including sequence-based DeepGOPLUS, and PPI-based DeepGraphGO. DeepFusionGO also performs well in difficult protein function prediction. We demonstrate that selecting an appropriate protein features fusion method can improve the prediction performance, and using the PPI network and the protein representation vector obtained from the protein language model through the GraphSAGE algorithm is an effective way to mine potential functional clues. The source code and data sets are available at: https://github.com/Hhhzj-7/DeepFusionGO.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Rr发布了新的文献求助50
1秒前
英俊的铭应助123456采纳,获得10
1秒前
Ther完成签到,获得积分20
2秒前
Ther发布了新的文献求助10
5秒前
SOLOMON应助songvv采纳,获得10
5秒前
7秒前
thy完成签到,获得积分10
10秒前
10秒前
11秒前
麻薯包发布了新的文献求助10
14秒前
Nice完成签到,获得积分10
15秒前
研友_nEWRJ8完成签到,获得积分10
15秒前
灵巧忆南给灵巧忆南的求助进行了留言
16秒前
16秒前
小蘑菇应助Ther采纳,获得10
19秒前
熊大发布了新的文献求助10
20秒前
21秒前
22秒前
skyeblue完成签到,获得积分10
22秒前
汉堡包应助流芳采纳,获得10
23秒前
亭语完成签到 ,获得积分0
24秒前
幻想Cloudy完成签到 ,获得积分10
26秒前
oo发布了新的文献求助10
26秒前
体贴的青烟完成签到,获得积分10
27秒前
29秒前
30秒前
MARK发布了新的文献求助10
32秒前
今朝完成签到 ,获得积分10
34秒前
流芳发布了新的文献求助10
35秒前
NexusExplorer应助skyeblue采纳,获得10
36秒前
37秒前
实验顺利完成签到,获得积分10
38秒前
40秒前
口腔医生发布了新的文献求助10
43秒前
snow_dragon发布了新的文献求助10
44秒前
SONGYEZI应助科研通管家采纳,获得10
45秒前
45秒前
充电宝应助科研通管家采纳,获得10
45秒前
无花果应助科研通管家采纳,获得10
45秒前
共享精神应助科研通管家采纳,获得10
45秒前
高分求助中
Formgebungs- und Stabilisierungsparameter für das Konstruktionsverfahren der FiDU-Freien Innendruckumformung von Blech 1000
The Illustrated History of Gymnastics 800
The Bourse of Babylon : market quotations in the astronomical diaries of Babylonia 680
Herman Melville: A Biography (Volume 1, 1819-1851) 600
Division and square root. Digit-recurrence algorithms and implementations 500
機能營養學前瞻(3 Ed.) 300
Improving the ductility and toughness of Fe-Cr-B cast irons 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2508700
求助须知:如何正确求助?哪些是违规求助? 2159388
关于积分的说明 5528590
捐赠科研通 1879861
什么是DOI,文献DOI怎么找? 935361
版权声明 564126
科研通“疑难数据库(出版商)”最低求助积分说明 499433