El Genoma Humano
Christiane Dosne Pasqualini.
Instituto de Investigaciones Hematológicas Academia Nacional de Medicina, Buenos Aires.
A diez años del lanzamiento del Proyecto Genoma Humano por James Watson, la presentación simultánea de dos versiones del primer borrador de la secuencia casi completa del genoma humano es un acontecimiento sin precedente y de indudable importancia.
Christiane Dosne Pasqualini.
Instituto de Investigaciones Hematológicas Academia Nacional de Medicina, Buenos Aires.
A diez años del lanzamiento del Proyecto Genoma Humano por James Watson, la presentación simultánea de dos versiones del primer borrador de la secuencia casi completa del genoma humano es un acontecimiento sin precedente y de indudable importancia.
El 15 de febrero de 2001 la revista Nature publicaba el artículo titulado “Initial sequencing and analysis of the human genome”, con los resultados de una colaboración entre 20 centros de EE.UU., Inglaterra, Japón, Francia, Alemania y China, involucrando un enorme cantidad de participantes (alrededor de 2500). El grupo se denomina “The International Human Sequencing Consortium” y trata de un emprendimiento de gran envergadura con fondos públicos a partir del Proyecto Genoma Humano originado en los Institutos Nacionales de la Salud de EE.UU. [NIH (National Institutes of Health , Bethesda, USA)] y liderado actualmente por Francis Collins.
Un día después, aparecía en la revista Science con el título de “The sequence of the human genome”, el trabajo de Craig Venter de la empresa Celera Genomics en Rockville, MD, USA y sus múltiples colaboradores (274 autores), esta vez totalmente con fondos privados.
Se llegaba así a un final feliz de lo que representó una costosa y a veces muy agresiva disputa entre los dos grupos, una verdadera carrera contra el tiempo ya que inicialmente la meta estaba fijada para el año 2005. Hace tres años, la entrada en esta carrera de Craig Venter con fondos privados y una tecnología sofisticada conocida en inglés como “whole genome shot-gun sequencing method” obligó a los demás grupos a conseguir todavía mas fondos para poder acelerar el paso con el fin de llegar a esta publicación simultánea. Esto es una prueba de la importancia que tiene la competitividad en investigación, como bien lo expresa el Editorial de Science “... Thus, we can salute what has become, in the end, not a contest but a marriage (perhaps encouraged by shotgun) between public funding and private entrepreneurship”.
Queda implícito que todos los datos que componen estos dos trabajos están a disposición mundial y en forma gratuita a través del Internet. En el futuro Celera Genomics tiene la intención de comercializar sus nuevos descubrimientos al perfeccionar el mapeo cromosómico.
En investigación, todo emprendimiento es siempre la resultante de muchos experimentos anteriores, es decir, del conocimiento previo adquirido a través de los años. En este caso se puede remontar al principio del siglo XX con el redescubrimiento de las leyes de Mendel, luego el descubrimiento de la estructura del ADN, el advenimiento de la citogenética y la clasificación de los cromosomas, seguido del surgimiento de la biología molecular (de la mano de las enzimas de restricción), las técnicas de amplificación por PCR, y finalmente las técnicas modernas de secuenciación con la indispensable ayuda de sofisticadas computadoras. Sin todos estos conocimientos y todas estas técnicas nunca se hubiera podido emprender el Proyecto Genoma Humano.
Para los que no están familiarizados con la biología molecular, Ridley, en su excelente libro de divulgación titulado Genoma: autobiografía de una especie en 23 capítulos, (ver pág. 251) emplea una ingeniosa comparación. Se imagina el genoma como un libro, con los 23 capítulos que representan los cromosomas; cada capítulo contiene miles de historias llamadas genes; cada historia contiene párrafos llamados exones con anuncios intercalados llamados intrones; cada párrafo está compuesto de palabras llamadas codones y cada palabra está escrita con letras llamadas bases o nucleótidos. Cada palabra esta compuesta de 3 letras ensambladas en las 64 variaciones posibles de las cuatro letras que forman el ADN, es decir los nucleótidos A C G T (adenina, citosina, guanina, timina). La secuencia completa del genoma humano -de ambas fuentes- contiene alrededor de 2.9 mil millones de letras. Lo asombroso es que todo este documento gigantesco (equivalente en extensión a 800 Biblias) cabe en la cromatina del núcleo microscópico de una célula diminuta que a su vez cabe holgadamente en la punta de un alfiler.
Hasta ahora, el genoma más grande que se había secuenciado en forma completa era el de la mosca de la fruta (Drosophila melanogaster) con 180 Mb (megabases) y alrededor de 13.000 genes, recientemente secuenciado por Celera Genomics. El genoma humano –el primer genoma secuenciado de un vertebrado- tiene un tamaño de 3000 Mb (se espera que todos los mamíferos tengan un genoma de tamaño similar) conteniendo alrededor de 35.000 genes, un número sorpresivamente inferior a los 50.000-100.000 calculados con anterioridad.
Llama también la atención el hecho de que el genoma humano es aproximadamente 30 veces más grande que el de la mosca pero no llega a tres veces el número de genes. Tanto en el hombre como en la mosca (o el pequeño nematode terrestre Caenorhabditis elegans), cada región codificante de cada gen tiene aproximadamente el mismo tamaño, por lo cual se sabe que en el hombre, contrariamente a lo pensado originalmente, cada gen puede codificar para más de una proteína usando diferentes combinaciones de sus exones. También es sorprendente el hecho que solamente entre el 1.1 al 1.5% del genoma codifica propiamente para las proteínas. Otra curiosidad del genoma humano, difícil de explicar en términos evolutivos, es el hecho que compartimos 223 genes con las bacterias que no existen ni en la mosca, el nematode o la levadura.
Además, se encuentran en el genoma humano grandes regiones de secuencias repetidas y “desiertos” de ADN no codificante (en otra época llamado junk DNA) que componen del 40 al 46% del genoma.
También se ubicaron transposones (genes saltarines) y amplias regiones copiadas y re-ubicadas por ARN retrotransposones (de los retrovirus endógenos) que ocuparían alrededor del 10% del genoma. Existe un 99.9% de homología genómica entre un individuo y otro. Sin embargo, cada uno de nosotros tiene un fenotipo diferente y cada individuo es único como puede comprobarse con el estudio de las secuencias repetidas del genoma conocido como fingerprinting de ADN. Con respecto al análisis de la función de los genes, lo que se denominó en inglés Functional Genomics, va a ser muy importante la comparación entre diversos genomas de vertebrados, en particular mamíferos, entre los cuales se espera contar en 2001 o, a lo sumo, en 2002 con el genoma completo del ratón.
¿En que consistió la secuenciación del genoma humano? Se emplearon varios dadores que proporcionaron semen y sangre de la cual se obtuvieron cultivos de linfocitos inmortalizados con EBV (virus Epstein-Barr). De estas dos fuentes se obtuvo ADN que fue tratado con enzimas de restricción para obtener miles de fragmentos que luego fueron incorporados por medio de un vector en bacterias y amplificados para luego ser secuenciados. Así se fueron alineando las letras, ubicándolas en los distintos cromosomas y mapeando sus regiones. Se ha comparado este estudio a un enorme rompecabezas con piezas que faltan y otras que no encajan perfectamente y necesitan ser ajustadas.
El proyecto financiado con fondos públicos adoptó una metodología llamada shotgun jerarquizado o clon-por-clon, que incluye el previo clonado del ADN genómico en vectores de alta capacidad (cromosomas artificiales bacterianos o BACs y cromosomas artificiales derivados del virus bacteriófago P1 o PACs), la construcción de contigs (colección de clones superpuesta en sus extremos que forman parches de información) y finalmente la secuenciación por shotgun de cada uno de estos grandes clones que forman los contigs ya «anclados» al genoma (lo que se denomina mapa físico). El método de shotgun consiste en la secuenciación de clones pequeños (500-700 pb) que representan al azar un segmento definido de ADN y posterior ensamblado de esas lecturas individuales por análisis de superposición de secuencia. Este abordaje de shotgun jerarquizado confina el problema de ensamblado de secuencias a la complejidad presente en segmentos de clonados de 100-200 kb.
Por otra parte, el abordaje utilizado por Celera Genomics, llamado shotgun generalizado o genómico total, se basó en la aplicación directa de la secuenciación shotgun sobre el total del ADN genómico humano (a partir de clones pequeños de 2, 10 y 50 kb), obteniendo una casi infinita cantidad de lecturas de secuencia (aproximadamente 550 pb) que necesitan ser ensambladas y ubicadas en el genoma. Este problema de ensamblado y ubicación resultó particularmente difícil considerando el gran tamaño y el alto porcentaje cubierto por secuencias repetidas del genoma humano. Sin embargo, para superar este problema específico y permitir el armado de contigs y su anclado al genoma, Celera se valió de información proveniente de dos fuentes: (a) de los marcadores ubicados como mojones sobre cada una de las bandas cromosómicas del genoma humano y (b) de las secuencias que fueron siendo publicadas como resultados parciales por el proyecto público (en las bases de datos GenBank y otros).
Muchas innovaciones tecnológicas desarrolladas dentro y fuera del Proyecto Genoma Humano posibilitaron no sólo la aceleración de la fase de secuenciación del ADN, sino también la automatización de los procedimientos de clonado, el manejo de la información y ensamblado de secuencias con paquetes de software diseñados especialmente. Entre los adelantos en el proceso de secuenciación, merece la pena citar algunos puntos de crítica importancia: el desarrollo de la secuenciación automática de ADN con nucleótidos terminales marcados con distintos colores de fluorescencia (los mismos son captados por una luz láser que excita el producto fluorescente, es leído por una célula fotoeléctrica y registrado en una computadora), la alta calidad de esos marcadores fluorescentes, el diseño de polimerasas especializadas para reacciones de secuenciación y el desarrollo de sofisticados equipos de electroforesis capilar asociados a complejos programas de computación.
De esta primera mirada sobre el genoma humano, con más de 100 páginas entre las publicaciones originales de las revistas Science y Nature, sólo se puede concluir que apenas se ha empezado a conocer su contenido en genes e inferir sus funciones; se lo ha comparado a un libro en un idioma extranjero donde lo primero es aprender el idioma.
¿Que aporta el Proyecto Genoma Humano a la medicina? Si bien los genes no tienen como función causar enfermedades, fueron los defectos genéticos asociados a distintas enfermedades los que principalmente sirvieron de marcadores para catalogar los genes correspondientes. Así en los mapas cromosómicos de los artículos de Science y Nature se aprecian fácilmente, por ejemplo, el gen de la fibrosis quística en el cromosoma 7 y el gen BCRA2 asociado al cáncer de mama en el cromosoma 13.
Desde 1980 hasta el año 2000, empleando técnicas cada vez mas sofisticadas de mapeo cromosómico, se ubicaron 1430 mutaciones asociadas a enfermedades monogénicas, sin incluir las neoplasias causadas por translocaciones y fusiones de genes6. Este catálogo de genes asociados a enfermedades y neoplasias se encuentra por Internet con una actualización diaria. Sin embargo, ningún gen opera en un vacío; cada gen interactúa directamente o indirectamente a través de las proteínas que codifica con muchos otros genes y sus productos. Esto explicaría las marcadas variaciones en los síntomas de pacientes con la misma enfermedad. Más aún, existen factores epigenéticos y ambientales que participan en el diseño del fenotipo de cada individuo. Curiosamente, estos últimos están tomando cada vez mas importancia y explicarían la variabilidad en cuanto a enfermedades y la susceptibilidad a ciertos tipos de cáncer que se observa aún en gemelos monocigotas que son verdaderos clones humanos.
La mayoría de las enfermedades representan la culminación de múltiples interacciones entre el genoma y el ambiente a lo largo de la vida. Predecir tanto la contribución de los genes como la participación de los factores ambientales en enfermedades como la hipertensión, la insuficiencia cardíaca, los trastornos psiquiátricos, es la meta final de muchos de los que emprendieron el estudio del genoma humano pero no será tarea fácil. Lo que sí puede llegar a perfeccionarse rápidamente es el diagnóstico genético de alteraciones monogénicas tanto en la vida uterina como adulta. En cuanto a las neoplasias se tratará de perfeccionar el estudio de los distintos genes oncogénicos, los genes supresores de tumores, los genes de susceptibilidad y sus interrelaciones, dentro del marco del Cancer Genome Project 8. Además, de las comparaciones a gran escala entre el genoma normal y el genoma de células cancerosas surgirán muchas pistas sobre los genes involucrados en el proceso neoplásico.
Los proyectos para el futuro incluyen el estudio de la función de los genes con la determinación de las proteínas que codifican y su mapeo en la forma de lo que se conoce como “proteoma”. Se espera que esto permitirá eventualmente profundizar el mecanismo molecular de las enfermedades e individualizar las reacciones de cada paciente frente a diversos tratamientos.
Sin entrar en los problemas éticos, sociales y legales que surgirán en el futuro, se puede concluir que esta presentación duplicada del primer borrador de la secuencia completa de los cromosomas humanos tiene un significado enorme, según algunos comparable en importancia con la llegada del hombre a la luna en 1969. Sin embargo, sólo estamos al comienzo de una fascinante etapa que se completará seguramente más pronto de lo previsto dado el enorme número de investigadores involucrados y el cada vez más abultado aporte de fondos públicos y privados.
Dirección electrónica:Christiane Dosne Pasqualini. Instituto de Investigaciones Hematológicas Academia Nacional de Medicina, Buenos Airese-mail: chdosne@otmail.com
Bibliografía
1. Lander ES, Linton LM, Birren B, el al. Initial sequencing and analysis of the human genome. Nature 2001;409: 860-914.
2. Venter JC, Adams MD, Myers EW, et al. The sequence of the human genome Science 2001; 291: 1304-48.
3. Jasny BR, Kennedy D. The Human Genome (Editorial) Science 2001; 291: 1153.
4. Ridley M. Genome: the autobiography of a species in 23 chapters. New York: Harper-Collins, 1999. (Genoma: autobiografía de una especie en 23 capítulos. Trad. Irene Cifuentes. Buenos Aires: Taurus, 2000). (ver pág. 251).
5. Benavides F, Guénet JL. Modelos murinos de enfermedades humanas. Medicina (Buenos Aires) 2001; 61: 215-231.
6. Peltonen L, McKusick VA. Dissecting human disease in the postgenomic era. Science 2001; 291: 1224-9.
7. OMIM: www ncbi.nlm.nih.gov/omim.
8. Interview. Richard Wooster on Cancer and the Human Genome Project. Lancet Oncol 2001; 2: 176-8.
Este Editorial no podría haberse concluido sin la ayuda del Dr. Fernando Benavides y de los biólogos Marcelo de Campos Nebel y Carlos De Brasi con quienes fue un placer aprender y discutir.
No comments:
Post a Comment