亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Breed identification using breed-informative SNPs and machine learning based on whole genome sequence data and SNP chip data

繁殖 单核苷酸多态性 鉴定(生物学) SNP公司 人口 支持向量机 生物 SNP基因分型 人工智能 模式识别(心理学) 计算生物学 计算机科学 遗传学 基因型 医学 基因 植物 环境卫生
作者
Chunli Zhao,Dan Wang,Jun Teng,Cheng Yang,Xinyi Zhang,Xianming Wei,Qin Zhang
出处
期刊:Journal of animal science and biotechnology [Springer Nature]
卷期号:14 (1)
标识
DOI:10.1186/s40104-023-00880-x
摘要

Abstract Background Breed identification is useful in a variety of biological contexts. Breed identification usually involves two stages, i.e., detection of breed-informative SNPs and breed assignment. For both stages, there are several methods proposed. However, what is the optimal combination of these methods remain unclear. In this study, using the whole genome sequence data available for 13 cattle breeds from Run 8 of the 1,000 Bull Genomes Project, we compared the combinations of three methods (Delta, F ST , and I n ) for breed-informative SNP detection and five machine learning methods (KNN, SVM, RF, NB, and ANN) for breed assignment with respect to different reference population sizes and difference numbers of most breed-informative SNPs. In addition, we evaluated the accuracy of breed identification using SNP chip data of different densities. Results We found that all combinations performed quite well with identification accuracies over 95% in all scenarios. However, there was no combination which performed the best and robust across all scenarios. We proposed to integrate the three breed-informative detection methods, named DFI, and integrate the three machine learning methods, KNN, SVM, and RF, named KSR. We found that the combination of these two integrated methods outperformed the other combinations with accuracies over 99% in most cases and was very robust in all scenarios. The accuracies from using SNP chip data were only slightly lower than that from using sequence data in most cases. Conclusions The current study showed that the combination of DFI and KSR was the optimal strategy. Using sequence data resulted in higher accuracies than using chip data in most cases. However, the differences were generally small. In view of the cost of genotyping, using chip data is also a good option for breed identification.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
sci来完成签到,获得积分10
刚刚
6秒前
dbb发布了新的文献求助30
12秒前
dbb完成签到,获得积分20
25秒前
快乐的纸飞机完成签到 ,获得积分10
55秒前
xinran完成签到,获得积分10
1分钟前
科研通AI2S应助辛勤的万恶采纳,获得10
1分钟前
苏78完成签到,获得积分20
1分钟前
突突突兔完成签到 ,获得积分10
3分钟前
伊斯坦堡的喵完成签到,获得积分10
3分钟前
oncoma完成签到 ,获得积分10
4分钟前
kkk完成签到 ,获得积分10
4分钟前
搜集达人应助皮皮采纳,获得10
5分钟前
5分钟前
皮皮发布了新的文献求助10
5分钟前
无言完成签到 ,获得积分10
5分钟前
6分钟前
sino-ft完成签到,获得积分10
6分钟前
7分钟前
somebodyzou发布了新的文献求助20
7分钟前
7分钟前
wuhzh发布了新的文献求助10
7分钟前
7分钟前
7分钟前
王燚欣发布了新的文献求助10
7分钟前
7分钟前
烟花应助王燚欣采纳,获得10
7分钟前
Hu发布了新的文献求助10
8分钟前
墨mo完成签到 ,获得积分10
8分钟前
隐形曼青应助Hu采纳,获得10
8分钟前
Echo发布了新的文献求助10
8分钟前
子翱完成签到 ,获得积分10
8分钟前
任雨婷完成签到,获得积分10
9分钟前
骆十八完成签到,获得积分10
9分钟前
高源伯完成签到 ,获得积分10
9分钟前
Echo完成签到,获得积分10
10分钟前
斯文的天奇完成签到 ,获得积分10
10分钟前
科研小白鼠完成签到 ,获得积分20
10分钟前
10分钟前
Echo发布了新的文献求助10
10分钟前
高分求助中
Formgebungs- und Stabilisierungsparameter für das Konstruktionsverfahren der FiDU-Freien Innendruckumformung von Blech 1000
IG Farbenindustrie AG and Imperial Chemical Industries Limited strategies for growth and survival 1925-1953 800
The Illustrated History of Gymnastics 800
The Bourse of Babylon : market quotations in the astronomical diaries of Babylonia 680
Sustainable Land Management: Strategies to Cope with the Marginalisation of Agriculture 600
[Echocardiography and tissue Doppler imaging in assessment of haemodynamics in patients with idiopathic, premature ventricular complexes] 600
Prochinois Et Maoïsmes En France (et Dans Les Espaces Francophones) 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2513749
求助须知:如何正确求助?哪些是违规求助? 2161675
关于积分的说明 5536295
捐赠科研通 1881722
什么是DOI,文献DOI怎么找? 936481
版权声明 564300
科研通“疑难数据库(出版商)”最低求助积分说明 499931