Retrieval and on-the-fly alignment of sequence fragments from the HIV database

Perl公司 脚本语言 多序列比对 成对比较 序列数据库 计算机科学 序列比对 序列(生物学) 集合(抽象数据类型) 序列分析 数据库 情报检索 生物 人工智能 遗传学 万维网 程序设计语言 肽序列 基因
作者
Brian Gaschen,Carla Kuiken,Bette Korber,Brian Foley
出处
期刊:Bioinformatics [Oxford University Press]
卷期号:17 (5): 415-418 被引量:84
标识
DOI:10.1093/bioinformatics/17.5.415
摘要

The amount of HIV-1 sequence data generated (presently around 42000 sequences, of which more than 22000 are from the V3 region of the viral envelope) presents a challenge for anyone working on the analysis of these data. A major problem is obtaining the region of interest from the stored sequences, which often contain but are not limited to that region. In addition, multiple alignment programs generally cannot deal with the large numbers of sequences that are available for many HIV-1 regions. We set out to provide our users with a tool that will retrieve and create an initial alignment of the HIV sequences that are available for a given genomic region.The MPAlign (Multiple Pairwise Alignment) web interface is a collection of Perl scripts that retrieves sequences from the Los Alamos HIV sequence database based on a number of search parameters. All sequences were pairwise-aligned to a model sequence using the Hidden Markov Model-based program HMMER. The HMMER model is general enough to accommodate virtually all HIV-1 sequences stored in the database. To create a multiple sequence alignment, gaps were inserted into the sequences during retrieval, so that they are aligned to one another. Retrieving and aligning the almost 560 gp120 sequences (approximately>1500 nt) stored in the database is at least 1500 times faster than a similar Clustal alignment.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
假装新疆人烤大串儿完成签到,获得积分10
刚刚
冷艳的班完成签到,获得积分10
1秒前
ajiduo发布了新的文献求助10
2秒前
水泥完成签到,获得积分10
2秒前
噜噜啦噜完成签到,获得积分10
3秒前
thwj完成签到,获得积分10
3秒前
木子李完成签到 ,获得积分10
3秒前
舒适尔容完成签到,获得积分10
3秒前
活力蘑菇完成签到 ,获得积分10
3秒前
苏紫梗桔完成签到,获得积分10
3秒前
4秒前
莫飞完成签到,获得积分10
4秒前
汤柏钧完成签到 ,获得积分10
4秒前
lcsw发布了新的文献求助10
4秒前
11111111111完成签到,获得积分10
4秒前
ant完成签到,获得积分10
4秒前
雪白的以寒完成签到 ,获得积分10
4秒前
123456qi发布了新的文献求助30
4秒前
蔡姬发布了新的文献求助10
5秒前
执着期待完成签到,获得积分10
5秒前
飞儿发布了新的文献求助10
5秒前
rainbow完成签到,获得积分10
5秒前
小谭完成签到 ,获得积分10
6秒前
leishenwang完成签到,获得积分10
7秒前
aDou完成签到 ,获得积分10
7秒前
池鱼完成签到,获得积分10
7秒前
yunwen完成签到,获得积分10
7秒前
duj发布了新的文献求助10
8秒前
zxcvbnm完成签到 ,获得积分10
8秒前
朱允扬关注了科研通微信公众号
8秒前
清脆晓曼完成签到,获得积分10
8秒前
小J完成签到,获得积分10
8秒前
bettersy完成签到,获得积分0
8秒前
warmen完成签到,获得积分10
9秒前
桐桐应助参也采纳,获得10
9秒前
9秒前
科研通AI6.2应助飞儿采纳,获得10
10秒前
小鱼冻干完成签到,获得积分10
10秒前
10秒前
高分求助中
Adhesion Science: Principles & Practice 1234
Signals, Systems, and Signal Processing 610
Burger's Medicinal Chemistry and Drug Discovery 400
A Step-by-Step Guide to Qualitative Data Coding 2nd Edition 400
Impact of Storage Orientation and Duration on Prefilled Syringe Performance: Break-Loose and Glide Forces, and Injection Time Across Multiple Time Points 360
Programming for Chemical Engineers Using C, C++, and MATLAB 300
Upland Kenya wild flowers and ferns: a flora of the flowers, ferns, grasses, and sedges of highland Kenya 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6664434
求助须知:如何正确求助?哪些是违规求助? 8414206
关于积分的说明 17986334
捐赠科研通 5869625
什么是DOI,文献DOI怎么找? 2975436
邀请新用户注册赠送积分活动 1951357
关于科研通互助平台的介绍 1877831