A Distributed Framework for Large-scale Protein-protein Interaction Data Analysis and Prediction Using MapReduce

计算机科学 树(集合论) 比例(比率) 任务(项目管理) 数据挖掘 大数据 吞吐量 分布式计算 数学 量子力学 电信 物理 数学分析 经济 管理 无线
作者
Lun Hu,Shicheng Yang,Xin Luo,Huaqiang Yuan,Khaled Sedraoui,MengChu Zhou
出处
期刊:IEEE/CAA Journal of Automatica Sinica [Institute of Electrical and Electronics Engineers]
卷期号:9 (1): 160-172 被引量:67
标识
DOI:10.1109/jas.2021.1004198
摘要

Protein-protein interactions are of great significance for human to understand the functional mechanisms of proteins. With the rapid development of high-throughput genomic technologies, massive protein-protein interaction (PPI) data have been generated, making it very difficult to analyze them efficiently. To address this problem, this paper presents a distributed framework by reimplementing one of state-of-the-art algorithms, i.e., CoFex, using MapReduce. To do so, an in-depth analysis of its limitations is conducted from the perspectives of efficiency and memory consumption when applying it for large-scale PPI data analysis and prediction. Respective solutions are then devised to overcome these limitations. In particular, we adopt a novel tree-based data structure to reduce the heavy memory consumption caused by the huge sequence information of proteins. After that, its procedure is modified by following the MapReduce framework to take the prediction task distributively. A series of extensive experiments have been conducted to evaluate the performance of our framework in terms of both efficiency and accuracy. Experimental results well demonstrate that the proposed framework can considerably improve its computational efficiency by more than two orders of magnitude while retaining the same high accuracy.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
yyg完成签到,获得积分10
3秒前
映城给野性的乌冬面的求助进行了留言
4秒前
思源应助2323142578采纳,获得10
4秒前
5秒前
花生油炒花生米完成签到,获得积分10
9秒前
10秒前
善学以致用应助武雨寒采纳,获得10
10秒前
2323142578完成签到,获得积分10
11秒前
HXL完成签到 ,获得积分10
12秒前
所所应助Casson采纳,获得10
13秒前
季生发布了新的文献求助10
17秒前
oncctv完成签到 ,获得积分10
18秒前
20秒前
20秒前
22秒前
Casson完成签到,获得积分20
23秒前
chengying624发布了新的文献求助10
23秒前
鲸鱼完成签到,获得积分10
24秒前
Casson发布了新的文献求助10
26秒前
王振兴完成签到 ,获得积分10
27秒前
FashionBoy应助影子采纳,获得10
27秒前
28秒前
余烬完成签到 ,获得积分10
28秒前
仁爱觅风完成签到 ,获得积分10
28秒前
大模型应助火焰向上采纳,获得10
29秒前
科研通AI5应助11采纳,获得10
30秒前
包容春天完成签到 ,获得积分10
31秒前
32秒前
33秒前
西梅完成签到,获得积分10
34秒前
赘婿应助chengying624采纳,获得10
35秒前
36秒前
鳗鱼新之发布了新的文献求助10
38秒前
xiao发布了新的文献求助10
38秒前
无奈的代珊完成签到 ,获得积分10
39秒前
小鱼骑单车完成签到 ,获得积分10
39秒前
39秒前
41秒前
quzhenzxxx完成签到 ,获得积分10
41秒前
迷你的夏菡完成签到 ,获得积分10
42秒前
高分求助中
Mass producing individuality 600
Разработка метода ускоренного контроля качества электрохромных устройств 500
A Combined Chronic Toxicity and Carcinogenicity Study of ε-Polylysine in the Rat 400
Advances in Underwater Acoustics, Structural Acoustics, and Computational Methodologies 300
Treatise on Process Metallurgy Volume 3: Industrial Processes (2nd edition) 250
Cycles analytiques complexes I: théorèmes de préparation des cycles 200
The Framed World: Tourism, Tourists and Photography (New Directions in Tourism Analysis) 1st Edition 200
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3825602
求助须知:如何正确求助?哪些是违规求助? 3367793
关于积分的说明 10447822
捐赠科研通 3087205
什么是DOI,文献DOI怎么找? 1698538
邀请新用户注册赠送积分活动 816805
科研通“疑难数据库(出版商)”最低求助积分说明 769973