已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

TaxoNN: ensemble of neural networks on stratified microbiome data for disease prediction

微生物群 计算机科学 人工智能 机器学习 卷积神经网络 人工神经网络 数据挖掘 模式识别(心理学) 生物信息学 生物
作者
Divya Sharma,Andrew D. Paterson,Wei Xu
出处
期刊:Bioinformatics [Oxford University Press]
卷期号:36 (17): 4544-4550 被引量:36
标识
DOI:10.1093/bioinformatics/btaa542
摘要

Abstract Motivation Research supports the potential use of microbiome as a predictor of some diseases. Motivated by the findings that microbiome data is complex in nature, and there is an inherent correlation due to hierarchical taxonomy of microbial Operational Taxonomic Units (OTUs), we propose a novel machine learning method incorporating a stratified approach to group OTUs into phylum clusters. Convolutional Neural Networks (CNNs) were used to train within each of the clusters individually. Further, through an ensemble learning approach, features obtained from each cluster were then concatenated to improve prediction accuracy. Our two-step approach comprising stratification prior to combining multiple CNNs, aided in capturing the relationships between OTUs sharing a phylum efficiently, as compared to using a single CNN ignoring OTU correlations. Results We used simulated datasets containing 168 OTUs in 200 cases and 200 controls for model testing. Thirty-two OTUs, potentially associated with risk of disease were randomly selected and interactions between three OTUs were used to introduce non-linearity. We also implemented this novel method in two human microbiome studies: (i) Cirrhosis with 118 cases, 114 controls; (ii) type 2 diabetes (T2D) with 170 cases, 174 controls; to demonstrate the model’s effectiveness. Extensive experimentation and comparison against conventional machine learning techniques yielded encouraging results. We obtained mean AUC values of 0.88, 0.92, 0.75, showing a consistent increment (5%, 3%, 7%) in simulations, Cirrhosis and T2D data, respectively, against the next best performing method, Random Forest. Availability and implementation https://github.com/divya031090/TaxoNN_OTU. Supplementary information Supplementary data are available at Bioinformatics online.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
十三完成签到 ,获得积分10
2秒前
糊涂的雪旋完成签到 ,获得积分10
4秒前
4秒前
花陵完成签到 ,获得积分10
6秒前
琳琅发布了新的文献求助10
7秒前
研友_850aeZ完成签到,获得积分10
8秒前
雪碧呀发布了新的文献求助10
10秒前
居蓝完成签到 ,获得积分10
11秒前
李月完成签到 ,获得积分10
12秒前
华仔应助金艺声采纳,获得10
17秒前
可靠发布了新的文献求助10
21秒前
雪碧呀完成签到,获得积分10
25秒前
26秒前
ssssbbbb完成签到,获得积分10
37秒前
研友_gnv61n完成签到,获得积分10
38秒前
40秒前
nichun发布了新的文献求助10
42秒前
金艺声发布了新的文献求助10
47秒前
一只熊完成签到 ,获得积分10
50秒前
54秒前
Hello应助琳琅采纳,获得10
54秒前
Solomon应助子枫采纳,获得10
55秒前
陶醉觅夏发布了新的文献求助10
56秒前
ssslls完成签到,获得积分10
57秒前
ssslls发布了新的文献求助10
59秒前
沐风发布了新的文献求助10
1分钟前
1分钟前
1分钟前
1分钟前
lerrygg发布了新的文献求助20
1分钟前
领导范儿应助ssslls采纳,获得10
1分钟前
沐风完成签到,获得积分20
1分钟前
琳琅发布了新的文献求助10
1分钟前
EE完成签到 ,获得积分10
1分钟前
CodeCraft应助林子博采纳,获得10
1分钟前
1分钟前
ddddduan完成签到 ,获得积分10
1分钟前
陶醉觅夏完成签到,获得积分20
1分钟前
晓晓鹤完成签到,获得积分10
1分钟前
晓晓鹤发布了新的文献求助10
1分钟前
高分求助中
Sustainable Land Management: Strategies to Cope with the Marginalisation of Agriculture 1000
Corrosion and Oxygen Control 600
Yaws' Handbook of Antoine coefficients for vapor pressure 500
Python Programming for Linguistics and Digital Humanities: Applications for Text-Focused Fields 500
Love and Friendship in the Western Tradition: From Plato to Postmodernity 500
行動データの計算論モデリング 強化学習モデルを例として 500
Johann Gottlieb Fichte: Die späten wissenschaftlichen Vorlesungen / IV,1: ›Transzendentale Logik I (1812)‹ 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2556433
求助须知:如何正确求助?哪些是违规求助? 2180296
关于积分的说明 5623540
捐赠科研通 1901633
什么是DOI,文献DOI怎么找? 949927
版权声明 565607
科研通“疑难数据库(出版商)”最低求助积分说明 504846