Ensamblado de secuencias

Interligado
total de vistas
Visitas
Nivel intermedio
AAumentar texto
ADisminuir texto


Conocimientos previos Genoma Secuenciación Lectura Descripción El ensamblado es un procedimiento bioinformático cuya finalidad es reconstruir la secuencia original de…
Conocimientos previos

 

Descripción

El ensamblado es un procedimiento bioinformático cuya finalidad es reconstruir la secuencia original de una muestra fragmentada por cualquier método de secuenciación. Los algoritmos dedicados a esto trabajan bajo la suposición de que fragmentos similares de lecturas se originan de una misma posición en el genoma. Esto se traduce en que el software utilizado necesita identificar empalmes entre las lecturas obtenidas para poder unir lecturas independientes en una de mayor longitud (de ahí el término ‘ensamblar’).

El ensamblado de secuencias sirve tanto para generar digitalmente secuencias nuevas (de novo) como para comparar con secuencias similares (ensamblado por alineamiento).

 

Entrada/Muestra

Lecturas en formato FASTA (aunque también pueden ser FASTQ, SAM, BAM, etc.).

 

Recursos/Material

Software de ensamblado (Ej. Velvet, SOAPdenovo, Bowtie, ABySS, MetaVelvet, Trinity, CLC workbench)
Computadoras con alta capacidad de procesamiento y memoria.

 

Requisitos previos

Secuenciación con cobertura apropiada

Filtrado por calidad de las lecturas, preferentemente en formato FASTA

 

Procedimiento

Se proporciona el (los) archivos con las lecturas en el formato correspondiente (normalmente FASTA) al programa utilizado para el ensamblado (por ejemplo, Velvet), junto con información respecto a las características del procedimiento de secuenciación que se usaron (Illumina, 454, etc.).

De acuerdo a la información proveída, el software generará lecturas extendidas, llamadas contigs, a partir de fragmentos cortos que se empalmen.

 

Salida/Resultado

Archivo de texto con contigs, normalmente en formato FASTA.

 

Fuentes de error más frecuentes
  • Contaminación de secuencias por falta de filtrado por calidad
  • Baja cobertura en la secuenciación
  • Ensamblado quimérico

 

Aplicaciones

 

Temas relacionados

 

Referencias:

Nagarajan, N. et.al.(2013) Sequence assembly demystified. Nature Reviews Genetics 14, 157-167 Ekblom, R. et. al. (2014) A field guide to whole-genome sequencing, assembly and annotation. Evolutionary Applications 7(9), 1026-1042
Ver más


Cómo citar: Jiménez Marín, B. (2017, 25 de Mayo ) Ensamblado de secuencias. Conogasi, Conocimiento para la vida. Fecha de consulta: Septiembre 20, 2018

Esta obra está disponible bajo una licencia de Creative Commons Reconocimiento-No Comercial Compartir Igual 4.0

Deja un comentario

1 Comentario en "Ensamblado de secuencias"

Ordenar por:   Más recientes | Más antiguos | Más votados
Julio Collado Vides
Hola, Si bien debemos suponer que por su naturaleza este artículo es de nivel intermedio o más avanzado, considero que sería fácil agregar en el inicio alguna descripción para que cualquiera entienda la idea básica, por ejemplo con la analogía de un rompecabezas lineal, analogía muy certera. Esto por un lado, por el otro, la frase inicial creo puede mejorarse, dice: "El ensamblado es un procedimiento bioinformático cuya finalidad es reconstruir la secuencia original de una muestra fragmentada por cualquier método de secuenciación." Una forma de entender es que el método de secuenciación es el responsable de haber fragmentado la… Leer más »
wpDiscuz