Conocimientos previos
Descripción
Para poder utilizar la información dentro de la secuencia de un genoma es fundamental anotarla con datos biológicos relevantes. Las anotaciones de un genoma ayudan a los científicos a entender qué significa su secuencia, cómo está estructurado y cómo funciona. Además, dan sustento y recursos al trabajo de una gran variedad de laboratorios en todo el mundo. Gracias al desarrollo de la secuenciación masiva se ha vuelto más fácil obtener ensambles de genomas; sin embargo, la anotación de estos se ha vuelto un gran reto debido a la variedad de los genomas secuenciados y a la gran cantidad de datos manejados.
La parte fundamental de los métodos de anotación es la localización de genes en un genoma, así como la determinación de su estructura y de las proteínas que producen. Las herramientas de anotación intentan realizar esto a través de análisis computacionales y enfoques experimentales. A pesar de que existe una gran diversidad de procedimientos para anotar un genoma, todos comparten un conjunto de características esenciales. Al final, el mejor enfoque depende del tiempo y recursos disponibles.
Entrada/Muestra
- Ensamble de genoma. Se necesita un ensamble de alta calidad, cuya secuencia esté determinada al menos en un 90% y que tenga la menor cantidad de huecos posible
- Bases de datos de genes y/o de genomas similares. Datos de información genética. Información biológica de expresión de genes proveniente de tecnologías como RNA-seq
- Computadora con alta capacidad de almacenamiento y procesamiento. Se requiere de equipo de cómputo con alta capacidad de memoria y procesamiento, ya que se maneja una gran cantidad de datos biológicos.
- Programas computacionales de anotación. El conjunto de programas que se utilizarán depende en gran medida en la naturaleza del genoma, en el tipo de datos que serán utilizados, el objetivo de la anotación y de los recursos disponibles.
Procedimiento
- Preparación del genoma. Antes de iniciar se necesita preparar el ensamble identificando y descartando las partes del genoma que no contienen genes. Estas regiones suelen complicar el proceso y pueden generar anotaciones erróneas
- Fase computacional. La primera fase consta de un proceso computacional donde se identifican los elementos del genoma con base en información de experimentos de expresión y en genes de otros genomas. Esta información es mapeada a la secuencia del genoma de referencia y utilizada de manera conjunta para predecir genes. Una alternativa complementaria es la predicción ab initio (mediante modelos matemáticos), sobre todo cuando no se cuenta con evidencia externa
- Fase de anotación. En esta fase el objetivo es combinar los elementos mapeados, adjuntarles información biológica y finalmente definir un conjunto óptimo de anotaciones. Es una tarea difícil, por lo que se necesitan combinaciones de distintos procedimientos computacionales para abordarla con precisión; también se suele utilizar la curación manual
- Validación. Las dos primeras fases dan buenos resultados, mas es necesario validar las anotaciones cualitativamente. Esto se logra mediante inspecciones manuales, comprobaciones experimentales y medidas de calidad
- Publicación del genoma. Para la publicación de la anotación en una base de datos es posible crear una propia, enviarla a una de las más importantes o a alguna temática. Hacer públicos los datos incentiva el mejoramiento del ensamble y la anotación.
Salida/Resultado
Un conjunto diverso de datos biológicos localizados a lo largo de nuestro genoma de interés. Al principio se cuenta con una simple secuencia y al final podemos saber qué genes hay en ella, qué hacen y en dónde se encuentran.
Fuentes de error más frecuentes
- No filtrar las regiones en el genoma que no contienen genes
- Fallas al elegir los programas computacionales
- Los datos de referencia contienen errores
- Se utiliza un genoma de referencia con anotaciones erróneas
Aplicaciones
- Predicción de genes
- Predicción de funciones de genes
Temas relacionados
- Secuenciación de ADN
- Ensamblado de genoma
- Análisis de RNA-seq
Notas
La anotación de genomas tiene numerosas aplicaciones en la investigación biológica, ya sea en el desarrollo de hipótesis o en los análisis de genómica comparativa. Además, son un medio importante para la anotación de otros genomas.
Cómo citar: Alvarado Valverde, J. (2016, 22 de Junio ) Anotación de genoma. Conogasi, Conocimiento para la vida. Fecha de consulta: Noviembre 21, 2024
Esta obra está disponible bajo una licencia de Creative Commons Reconocimiento-No Comercial Compartir Igual 4.0
Deja un comentario
Sé el primero en comentar!