Conocimientos previos
- Secuenciación de alto rendimiento [1]
- Ensamblado de genoma [2]
- Alineamiento [3]
- SNP [4]
Descripción
El método de SNP calling tiene el objetivo de determinar en qué posiciones del genoma existe al menos una base nitrogenada distinta a la de un genoma de referencia [3].
Para lograr esto, se analiza a las secuencias cortas (llamadas lecturas o reads) pertenecientes a fragmentos de ADN secuenciados. Después se realiza un proceso de control de calidad de las secuencias y éstas se alinean a un genoma de referencia. Posteriormente, los valores de calidad asociados a cada una de las bases nitrogenadas son corregidos.
Entrada/Muestra
Alineamiento de lecturas en formato utilizable para el software de SNP calling (SAM o BAM) que haya sido filtrado por control de calidad.
Recursos/Material
Software para realizar el SNP calling: SOAPsnp, MAQ, Samtools, GATK, Beagle, IMPUTE2, etc.
Requisitos previos
Alineamiento de lecturas contra un genoma de referencia.
Procedimiento
Se proporciona el alineamiento en formato BAM/SAM al programa utilizado para la determinación de SNPs (por ejemplo, Beagle). En términos generales, el programa realizará una predicción sobre la variación en un locus [3]. Basándose en dicha predicción es posible realizar otras, por ejemplo, sobre la potencial función de ese SNP.
Salida/Resultado
Archivo de texto con SNPs determinados (en formato VCF -variant calling format).
Fuentes de error más frecuentes
- Errores asociados a la tecnología de secuenciación (contaminación de adaptadores en el proceso de amplificación).
- Omitir filtrado de calidad de las secuencias cortas antes del alineamiento contra el genoma de referencia.
Métodos alternativos
- Variant calling
Aplicaciones
- Estudio de asociación del genoma completo (GWAS) [5]
- Genética de poblaciones
Temas relacionados
- Base calling
- Ensamblado de genoma
- Genotype calling