Se presenta el mapa genético más completo de la historia
Un consorcio internacional de científicos acaba de publicar en la revista 'Nature' el mapa más completo de la historia sobre los genes de los seres humanos porque, por primera vez, incluye material genético de 47 personas de diferentes orígenes
Madrid
El primer pangenoma de la historia contiene el mapa genético de 47 genomas, y no de uno solo, y permitirá a los científicos encontrar y comprender las diferencias del ADN de las diferentes poblaciones a nivel mundial de los seres humanos. El borrador del primer pangenona añade 19 millones de bases (es decir, las "letras" en las secuencias de ADN), al mapa del genoma que se tenía hasta ahora y, por primera vez, proporciona una representación de la diversidad genética humana, que no había sido posible obtener con la secuenciación de un solo genoma.
Además, es altamente preciso, más completo y aumenta drásticamente la detección de variantes en el genoma humano, como se muestra en una colección de artículos innovadores publicados este miércoles en las revistas Nature, Genome Research , Nature Biotechnology y Nature Methods .
El pangenoma ha sido realizado por el Consorcio de Referencia del Pangenoma Humano (HPRC) y este proyecto continuará hasta 2024, cuando los investigadores planean publicar un pangenoma final con información genómica de 350 individuos. “Estamos introduciendo más diversidad y equidad en la referencia mediante el muestreo de diversos seres humanos e incluyéndolos en esta estructura que todos pueden usar”, explica Benedict Paten, quien es el autor principal del documento y que trabaja en la Universidad de California, en Estados Unidos. Un genoma no es suficiente para representar a todos. Por esa razón, el pangenoma será, en última instancia, algo inclusivo y representativo.
Grandes ventajas
El genoma de cada persona varía ligeramente (en promedio, alrededor de un 0,4% en comparación con la siguiente persona) y comprender estas diferencias puede brindar información sobre su salud, ayudar a diagnosticar enfermedades, predecir resultados médicos y guiar tratamientos.
Por lo general, cuando los científicos y los médicos estudian el genoma de un individuo para buscar variaciones, comparan el ADN de ese individuo con el de una referencia estándar para determinar dónde hay diferencias de uno o más pares de bases.
Hasta ahora, el genoma de referencia ha estado representado principalmente por una sola secuencia para cada cromosoma humano, en su mayoría procedente de un individuo. Pero esta referencia tiene casi 20 años y es fundamentalmente limitada porque no puede representar la riqueza de variaciones genéticas presentes en la población humana. Esto introduce un problema llamado sesgo de referencia en el análisis del genoma.
Avance
Por el contrario, el nuevo pangenoma es una referencia que combina los genomas de 47 individuos de diversos orígenes ancestrales. El pangenoma parece una referencia lineal en las áreas donde las secuencias tienen las mismas bases y se expande para mostrar las áreas donde hay diferencias. Representa muchas versiones diferentes de la secuencia del genoma humano al mismo tiempo y brinda a los científicos un punto de comparación más preciso para la variación que está presente en algunas poblaciones pero no en otras.
“Un genoma no puede representar toda la rica variación que sabemos que se puede observar y estudiar en todo el mundo”, dijo Karen Miga, del Centro de Producción HPRC de la Universidad de California.
La variación genómica puede ser pequeña, consistiendo en diferencias de solo una o unas pocas bases de ADN, o puede ser variantes estructurales grandes, clasificadas como variantes que tienen 50 pares de bases o más. Estas variantes estructurales más grandes pueden tener importantes implicaciones para la salud. Hasta ahora, los investigadores no han podido identificar más del 70% de las variantes estructurales que existen en los genomas humanos debido a tecnologías limitadas y al sesgo de usar una sola secuencia de referencia.
De los 119 millones de nuevas bases añadidas a la referencia con el pangenoma, aproximadamente 90 millones de ellas se derivan de la variación estructural. Las variantes estructurales son complejas y pueden ser inversiones de secuencias, inserciones, eliminaciones o repeticiones en tándem: un segmento de dos o más bases repetidas numerosas veces. Estas nuevas bases ayudarán a los investigadores a estudiar regiones del genoma para las que antes no había referencia y, potencialmente, podrán asociar variantes estructurales con enfermedades en estudios futuros.
“Ahora, podemos mapear a más variantes estructurales, por lo que estamos encontrando características y áreas en el genoma que simplemente no estaban allí antes”, dijo Miga. "Es emocionante porque nos permite observar la regulación genética de una manera única que no podíamos estudiar antes, porque esas áreas probablemente se habrían mapeado de manera inapropiada o simplemente se habrían ignorado por completo".
Esto también significa que la referencia actual en realidad incluye 94 secuencias genómicas distintas, con el objetivo de llegar a 700 para 2024.
Creando el pangenoma
El pangenoma fue posible gracias al desarrollo de técnicas computacionales avanzadas para alinear las múltiples secuencias del genoma en una sola referencia utilizable en una estructura llamada gráfico de pangenoma. Paten y los investigadores del laboratorio de genómica computacional de la UCSC ayudaron a liderar los esfuerzos de HPRC para desarrollar los métodos algorítmicos necesarios para crear esta estructura gráfica de pangenoma.
Debido a los métodos utilizados en este proyecto, todos los genomas dentro de la referencia del pangenoma son de una calidad y precisión extremadamente altas, cubriendo más del 99% de cada genoma humano con más del 99 por ciento de precisión.
Con los avances recientes, estas técnicas ahora pueden decodificar de miles a millones de pares de bases del genoma a la vez. Luego, los largos tramos de lecturas de ADN se ensamblan a través de algoritmos especializados en secuencias genómicas más completas. Idealmente, cada secuencia ensamblada debería representar la secuencia de un cromosoma.
Corrección de errores
Las lecturas largas contienen errores alrededor del uno por ciento del tiempo y los algoritmos de ensamblaje actuales no son perfectos, lo que puede causar que las secuencias ensambladas sean erróneas en algunas ubicaciones. Para verificar y corregir estos errores, los genomas individuales que se han secuenciado y ensamblado se mueven a través de múltiples herramientas, incluida una canalización de confiabilidad desarrollada por Asri. Una vez que han sido procesados por estas herramientas, los investigadores pueden garantizar que los ensamblajes sean precisos y completos.
Después de pasar por la tubería de Asri, los diversos genomas se compilan a través de métodos algorítmicos complejos en la estructura gráfica del pangenoma. Visualmente, el genoma gráfico permite a los investigadores ver las diferencias en las diversas secuencias de referencia como áreas divergentes en caminos que de otro modo serían compartidos.
Recurso accesible
Los primeros 47 genomas diploides en el borrador del pangenoma se obtuvieron de personas que participaron en el Proyecto 1000 Genomas (1000G), un esfuerzo influyente que creó un catálogo de variación genética humana común a partir de muestras consentidas abiertamente y se completó en 2015.
El estado de consentimiento de estas muestras permite que cualquier investigador acceda al recurso sin las barreras de privacidad que normalmente acompañan a la investigación del genoma, con el objetivo de hacer que el pangenoma sea accesible para la mayor cantidad de personas posible. “Convertirse en un recurso común es algo fundamental para el éxito de una referencia del pangenoma humano”, dijo Miga. "Tiene que tener la capacidad de ser accesible y abierto en todo el mundo a todos los investigadores para que podamos usarlo como base".
El equipo de HPRC se centra en la divulgación para garantizar que el pangenoma sea un recurso útil que se utilizará en clínicas de todo el mundo. Esto significa facilitar las anotaciones, los comentarios y las aportaciones de los investigadores que realizan estudios utilizando la referencia del pangenoma.
Junto con un enfoque en la accesibilidad, el proyecto HPRC tiene un equipo de ética dedicado centrado en las implicaciones sociales y legales de este proyecto. Están trabajando para anticipar problemas desafiantes y ayudar a guiar el consentimiento informado, priorizar el estudio de diferentes muestras, explorar posibles problemas regulatorios relacionados con la adopción clínica y trabajar con comunidades internacionales e indígenas para incorporar sus secuencias genómicas en estos esfuerzos más amplios.
Javier Gregori
Periodista especializado en ciencia y medio ambiente....