Mixing genome annotation methods in a comparative analysis inflates the apparent number of lineage-specific genes

注释 基因组 生物 谱系(遗传) 基因 克莱德 基因注释 遗传学 DNA测序 基因组计划 计算生物学 进化生物学 比较基因组学 基因组学 系统发育学
作者
Caroline M. Weisman,Andrew W. Murray,Sean R. Eddy
标识
DOI:10.1101/2022.01.13.476251
摘要

Summary Comparisons of genomes of different species are used to identify lineage-specific genes, those genes that appear unique to one species or clade. Lineage-specific genes are often thought to represent genetic novelty that underlies unique adaptations. Identification of these genes depends not only on genome sequences, but also on inferred gene annotations. Comparative analyses typically use available genomes that have been annotated using different methods, increasing the risk that orthologous DNA sequences may be erroneously annotated as a gene in one species but not another, appearing lineage-specific as a result. To evaluate the impact of such “annotation heterogeneity,” we identified four clades of species with sequenced genomes with more than one publicly available gene annotation, allowing us to compare the number of lineage-specific genes inferred when differing annotation methods are used to those resulting when annotation method is uniform across the clade. In these case studies, annotation heterogeneity increases the apparent number of lineage-specific genes by up to 15-fold, suggesting that annotation heterogeneity is a substantial source of potential artifact.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
文与武完成签到,获得积分10
刚刚
玛卡巴卡发布了新的文献求助10
1秒前
娃哈哈发布了新的文献求助10
1秒前
呱呱呱呱呱呱完成签到,获得积分10
1秒前
luyunxing完成签到,获得积分10
2秒前
Ming完成签到,获得积分10
2秒前
小懒完成签到,获得积分20
2秒前
Owen应助ZAJsci采纳,获得10
3秒前
3秒前
波波完成签到 ,获得积分10
3秒前
3秒前
小李叭叭完成签到,获得积分10
3秒前
3秒前
共享精神应助只爱LJT采纳,获得10
4秒前
4秒前
孤独听荷发布了新的文献求助10
4秒前
5秒前
沉默诗兰完成签到,获得积分10
5秒前
7秒前
Owen应助絔梦采纳,获得10
7秒前
走走走发布了新的文献求助10
7秒前
NexusExplorer应助欢喜板凳采纳,获得10
7秒前
bkagyin应助Liang采纳,获得200
7秒前
hehe完成签到,获得积分10
8秒前
yunjian1583完成签到,获得积分10
8秒前
8秒前
8秒前
XIN发布了新的文献求助10
8秒前
XH_L完成签到,获得积分10
8秒前
8秒前
非也的非也完成签到,获得积分20
9秒前
yang完成签到,获得积分10
9秒前
钱塘珺珵发布了新的文献求助10
9秒前
何raven发布了新的文献求助10
9秒前
10秒前
我不会乱起名字的完成签到,获得积分10
10秒前
木木完成签到 ,获得积分10
10秒前
11秒前
sun完成签到,获得积分10
11秒前
肥肥完成签到 ,获得积分10
11秒前
高分求助中
Encyclopedia of Quaternary Science Third edition 2025 12000
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
HIGH DYNAMIC RANGE CMOS IMAGE SENSORS FOR LOW LIGHT APPLICATIONS 1500
Constitutional and Administrative Law 1000
The Social Work Ethics Casebook: Cases and Commentary (revised 2nd ed.). Frederic G. Reamer 800
Holistic Discourse Analysis 600
Vertébrés continentaux du Crétacé supérieur de Provence (Sud-Est de la France) 600
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5348684
求助须知:如何正确求助?哪些是违规求助? 4482689
关于积分的说明 13952502
捐赠科研通 4381558
什么是DOI,文献DOI怎么找? 2407415
邀请新用户注册赠送积分活动 1400065
关于科研通互助平台的介绍 1373295