conogasi logo

Ensamblado de secuencias

Conocimientos previos

 

Descripción

El ensamblado es un procedimiento bioinformático cuya finalidad es reconstruir la secuencia original de una muestra fragmentada por cualquier método de secuenciación. Este proceso depende fuertemente de realizar una secuenciación profunda, pues los algoritmos dedicados a esto trabajan bajo la suposición de que fragmentos similares de lecturas se originan de una misma posición en el genoma. Esto se traduce en que el software utilizado necesita identificar empalmes entre las lecturas obtenidas.

El ensamblado de secuencias sirve tanto para generar digitalmente secuencias nuevas (de novo) como para comparar con secuencias similares (ensamblado por alineamiento).

 

Entrada/Muestra

Lecturas en formato FASTA (aunque también pueden ser FASTQ, SAM, BAM, etc.).

 

Recursos/Material

 

Requisitos previos

 

Procedimiento

Se proporciona el(los) archivos con las lecturas en el formato correspondiente (normalmente FASTA) al programa utilizado para el ensamblado (por ejemplo, Velvet), junto con información respecto a las características del procedimiento de secuenciación que se usón (Illumina, 454, etc.).

 

Salida/Resultado

Archivo de texto con contig [1]s (lecturas ensambladas en fragmentos de mayor tamaño), normalmente en formato FASTA.

 

Fuentes de error más frecuentes

 

Aplicaciones

 

Temas relacionados