清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Missing genes in the annotation of prokaryotic genomes

开放式参考框架 基因组 生物 基因 遗传学 基因注释 基因预测 计算生物学 注释 参考文献 打开阅读框 肽序列
作者
Andrew Warren,Jeremy Archuleta,Wu-chun Feng,João Carlos Setúbal
出处
期刊:BMC Bioinformatics [BioMed Central]
卷期号:11 (1) 被引量:115
标识
DOI:10.1186/1471-2105-11-131
摘要

Protein-coding gene detection in prokaryotic genomes is considered a much simpler problem than in intron-containing eukaryotic genomes. However there have been reports that prokaryotic gene finder programs have problems with small genes (either over-predicting or under-predicting). Therefore the question arises as to whether current genome annotations have systematically missing, small genes. We have developed a high-performance computing methodology to investigate this problem. In this methodology we compare all ORFs larger than or equal to 33 aa from all fully-sequenced prokaryotic replicons. Based on that comparison, and using conservative criteria requiring a minimum taxonomic diversity between conserved ORFs in different genomes, we have discovered 1,153 candidate genes that are missing from current genome annotations. These missing genes are similar only to each other and do not have any strong similarity to gene sequences in public databases, with the implication that these ORFs belong to missing gene families. We also uncovered 38,895 intergenic ORFs, readily identified as putative genes by similarity to currently annotated genes (we call these absent annotations). The vast majority of the missing genes found are small (less than 100 aa). A comparison of select examples with GeneMark, EasyGene and Glimmer predictions yields evidence that some of these genes are escaping detection by these programs. Prokaryotic gene finders and prokaryotic genome annotations require improvement for accurate prediction of small genes. The number of missing gene families found is likely a lower bound on the actual number, due to the conservative criteria used to determine whether an ORF corresponds to a real gene.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
3秒前
Jessie完成签到,获得积分10
4秒前
勤奋青寒完成签到,获得积分10
8秒前
拼搏向上发布了新的文献求助10
14秒前
19秒前
拼搏向上完成签到,获得积分10
37秒前
43秒前
48秒前
量子星尘发布了新的文献求助10
54秒前
57秒前
orezot发布了新的文献求助10
1分钟前
1分钟前
美好灵寒完成签到 ,获得积分10
1分钟前
1分钟前
1分钟前
最最最发布了新的文献求助10
1分钟前
orezot完成签到 ,获得积分10
1分钟前
1分钟前
1分钟前
量子星尘发布了新的文献求助10
2分钟前
Akim应助科研通管家采纳,获得10
2分钟前
gexzygg应助科研通管家采纳,获得10
2分钟前
gexzygg应助科研通管家采纳,获得10
2分钟前
2分钟前
3分钟前
vbnn完成签到 ,获得积分10
3分钟前
苏楠发布了新的文献求助30
3分钟前
3分钟前
量子星尘发布了新的文献求助30
3分钟前
gzf完成签到 ,获得积分10
3分钟前
Virtual应助科研通管家采纳,获得10
4分钟前
4分钟前
淡淡乐巧完成签到 ,获得积分10
4分钟前
4分钟前
量子星尘发布了新的文献求助10
4分钟前
lod完成签到,获得积分10
4分钟前
5分钟前
苏楠完成签到 ,获得积分10
5分钟前
紫熊发布了新的文献求助10
5分钟前
神经蛙完成签到,获得积分10
6分钟前
高分求助中
(应助此贴封号)【重要!!请各位详细阅读】【科研通的精品贴汇总】 10000
Organic Chemistry 1500
The Netter Collection of Medical Illustrations: Digestive System, Volume 9, Part III - Liver, Biliary Tract, and Pancreas (3rd Edition) 600
Introducing Sociology Using the Stuff of Everyday Life 400
Conjugated Polymers: Synthesis & Design 400
Picture Books with Same-sex Parented Families: Unintentional Censorship 380
Metals, Minerals, and Society 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 4262031
求助须知:如何正确求助?哪些是违规求助? 3794880
关于积分的说明 11899387
捐赠科研通 3441839
什么是DOI,文献DOI怎么找? 1888793
邀请新用户注册赠送积分活动 939521
科研通“疑难数据库(出版商)”最低求助积分说明 844593