DNA Matching Using k - mer Derived Spatial Features

水准点(测量) 计算机科学 匹配(统计) 算法 序列(生物学) 计算复杂性理论 DNA测序 DNA 数学 生物 统计 大地测量学 遗传学 地理
作者
Md. Sayeed Iftekhar Yousuf,Machbah Uddin,Mohammad Khairul Islam,Md. Rakib Hassan,Aysha Siddika Ratna,Farah Jahan
标识
DOI:10.1109/ncim59001.2023.10212654
摘要

DNA sequence analysis has enormous applications including gene modification, gene therapy, new variety development, etc., due to which, the size of the genome datasets is increasing exponentially, and it is propagating more computational challenges. Existing DNA sequence analysis algorithms are two types, e.g., alignment-based (AB) and alignment-free (AF). AB is effective for short and homologous sequences, but time and memory complexity is extremely high where AF algorithms can solve the major limitations. Existing AF algorithms use different relative information, but these techniques lose spatial information. Therefore, this research proposes a novel AF algorithm by introducing two brand new features standard deviation and zero count which is efficient in terms of memory, time, and accuracy. At first, it generates a k - mer count matrix and a position vector for each cell of the count matrix. Later, it calculates the standard deviation of the first-order difference and the number of zero counts of the second-order difference of positions. The method is tested in several benchmark datasets and the performance is compared with existing studies and tools. For all datasets, it shows 1.217 to 354 times less memory complexity and top accuracy. In the case of time complexity, it is 20 to 5768 times faster than the MEGA tool. Therefore, this system can be an effective platform for DNA matching.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
凯撒的归凯撒完成签到 ,获得积分10
3秒前
liyu完成签到 ,获得积分20
3秒前
shirley要奋斗完成签到 ,获得积分10
9秒前
袁翰将军完成签到 ,获得积分10
14秒前
18秒前
狮子卷卷完成签到,获得积分10
26秒前
czzlancer完成签到,获得积分10
33秒前
陶醉书包完成签到 ,获得积分10
33秒前
超级向薇完成签到 ,获得积分10
35秒前
荼白完成签到 ,获得积分10
35秒前
有点鸭梨呀完成签到 ,获得积分10
44秒前
47秒前
47秒前
cq_2完成签到,获得积分0
48秒前
标致耷完成签到 ,获得积分10
49秒前
ivyjianjie发布了新的文献求助10
54秒前
lhy12345完成签到 ,获得积分10
55秒前
NexusExplorer应助科研通管家采纳,获得10
56秒前
laber应助科研通管家采纳,获得80
56秒前
猫的毛完成签到 ,获得积分10
1分钟前
白桃完成签到 ,获得积分10
1分钟前
Micheallee完成签到,获得积分10
1分钟前
晚街听风完成签到 ,获得积分10
1分钟前
sunsunsun完成签到,获得积分10
1分钟前
1分钟前
吨吨完成签到,获得积分10
1分钟前
风不尽,树不静完成签到 ,获得积分10
1分钟前
zyw完成签到 ,获得积分10
1分钟前
田様应助ivyjianjie采纳,获得10
1分钟前
谭凯文完成签到 ,获得积分10
1分钟前
1分钟前
优雅含灵完成签到 ,获得积分10
1分钟前
wang完成签到,获得积分10
1分钟前
碗在水中央完成签到 ,获得积分0
1分钟前
蛋挞完成签到 ,获得积分10
1分钟前
1分钟前
lxqd1完成签到,获得积分0
1分钟前
roundtree完成签到 ,获得积分10
2分钟前
牛奶面包完成签到 ,获得积分10
2分钟前
杜景婷完成签到 ,获得积分10
2分钟前
高分求助中
Encyclopedia of Mathematical Physics 2nd edition 888
Technologies supporting mass customization of apparel: A pilot project 600
Chinesen in Europa – Europäer in China: Journalisten, Spione, Studenten 500
Arthur Ewert: A Life for the Comintern 500
China's Relations With Japan 1945-83: The Role of Liao Chengzhi // Kurt Werner Radtke 500
Two Years in Peking 1965-1966: Book 1: Living and Teaching in Mao's China // Reginald Hunt 500
材料概论 周达飞 ppt 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3808162
求助须知:如何正确求助?哪些是违规求助? 3352794
关于积分的说明 10360437
捐赠科研通 3068774
什么是DOI,文献DOI怎么找? 1685251
邀请新用户注册赠送积分活动 810395
科研通“疑难数据库(出版商)”最低求助积分说明 766095