Conocimientos previos
- Genoma
- Secuenciación
- Lectura
Descripción
El ensamblado es un procedimiento bioinformático cuya finalidad es reconstruir la secuencia original de una muestra fragmentada por cualquier método de secuenciación. Los algoritmos dedicados a esto trabajan bajo la suposición de que fragmentos similares de lecturas se originan de una misma posición en el genoma. Esto se traduce en que el software utilizado necesita identificar empalmes entre las lecturas obtenidas para poder unir lecturas independientes en una de mayor longitud (de ahí el término ‘ensamblar’).
El ensamblado de secuencias sirve tanto para generar digitalmente secuencias nuevas (de novo) como para comparar con secuencias similares (ensamblado por alineamiento).
Entrada/Muestra
Lecturas en formato FASTA (aunque también pueden ser FASTQ, SAM, BAM, etc.).
Recursos/Material
Software de ensamblado (Ej. Velvet, SOAPdenovo, Bowtie, ABySS, MetaVelvet, Trinity, CLC workbench)
Computadoras con alta capacidad de procesamiento y memoria.
Requisitos previos
Secuenciación con cobertura apropiada
Filtrado por calidad de las lecturas, preferentemente en formato FASTA
Procedimiento
Se proporciona el (los) archivos con las lecturas en el formato correspondiente (normalmente FASTA) al programa utilizado para el ensamblado (por ejemplo, Velvet), junto con información respecto a las características del procedimiento de secuenciación que se usaron (Illumina, 454, etc.).
De acuerdo a la información proveída, el software generará lecturas extendidas, llamadas contigs, a partir de fragmentos cortos que se empalmen.
Salida/Resultado
Archivo de texto con contigs, normalmente en formato FASTA.
Fuentes de error más frecuentes
- Contaminación de secuencias por falta de filtrado por calidad
- Baja cobertura en la secuenciación
- Ensamblado quimérico
Aplicaciones
- Caracterización de especies
- Anotación de genomas
Temas relacionados
- Caracterización de especies
- Anotación de genomas
- Identificación de SNPs
- Estudio de asociación del genoma completo (GWAS)
Cómo citar: Jiménez Marín, B. (2017, 25 de Mayo ) Ensamblado de secuencias. Conogasi, Conocimiento para la vida. Fecha de consulta: Febrero 5, 2025
Esta obra está disponible bajo una licencia de Creative Commons Reconocimiento-No Comercial Compartir Igual 4.0
Deja un comentario
1 Comentario en "Ensamblado de secuencias"