La Real Academia Sueca de las Ciencias otorgó el Premio Nobel de Química 2024 al estadounidense David Baker, por sus fundamentales contribuciones “para el diseño computacional de proteínas”, y -la otra mitad del premio- al británico Demis Hassabis y al norteamericano John M. Jumper, por su aporte clave para la predicción de la estructura de las proteínas.
El comunicado publicado hoy por la Academia destaca que Baker logró construir proteínas completamente nuevas, mientras que Hassabis y Jumper desarrollaron un modelo de inteligencia artificial (IA) que permite predecir las complejas estructuras de las proteínas, algo que se intentaba lograr desde hacía medio siglo. Ambos descubrimientos tienen aplicaciones potenciales enormes.
Las proteínas son las herramientas responsables de controlar e impulsar todas las reacciones químicas que constituyen la base de la vida. Estas moléculas suelen estar formadas por bloques de aminoácidos (existen 20 diferentes), que pueden ser considerados como los componentes básicos de la vida.
“El ADN contiene la información para sintetizar las proteínas y estas son, esencialmente, las moléculas que llevan a cabo las funciones de las células”, señala Maximiliano Juri Ayub, investigador del CONICET en el Instituto Multidisciplinario de Investigaciones Biológicas de San Luis (IMBIO-SL, CONICET-UNSL), para dar una idea del nivel de importancia de estas moléculas y del impacto que pueden tener descubrimientos revolucionarios en este campo.
En 2003, Baker consiguió utilizar los bloques de aminoácidos para diseñar una nueva proteína distinta a todas las otras que se conocían en la naturaleza. Desde ese momento, su equipo de investigación ha producido numerosas proteínas, incluidas algunas que pueden usarse como fármacos, vacunas, nanomateriales y sensores diminutos.
“El diseño computacional de proteínas es una estrategia que involucra distintas metodologías que nos permiten, basados en estructuras proteicas conocidas, diseñar nuevas proteínas o modificar las que ya existen. Baker no solo es el pionero, sino que también es el principal referente en este terreno. Las herramientas que ha desarrollado son utilizadas hoy en todo el mundo”, señala Laura Mascotti, investigadora del CONICET en el Instituto de Histología y Embriología de Mendoza (IHEM, CONICET-UNCUYO).
Respecto de los posibles usos del diseño computacional de proteínas, Mascotti destaca que “las aplicaciones que esto tiene son increíbles y súper amplias, y van desde el diseño de vacunas o fármacos que inhiban proteínas con fines terapéuticos, al desarrollo de sensores o el diseño de biocatalizadores”.
El segundo descubrimiento premiado hace referencia a la predicción de las estructuras proteicas. En las proteínas, los aminoácidos se unen en extensas cadenas que se pliegan para formar una estructura tridimensional, que es decisiva para el cumplimiento de sus funciones. Desde los años 70 del siglo pasado, los especialistas buscaron predecir estas estructuras a partir de secuencias de aminoácidos.
“Desde hace tiempo se sabe que la secuencia lineal de aminoácidos ‘determina’ la estructura tridimensional de las proteínas. Sin embargo, la estructura tridimensional de las proteínas debía ser determinada por métodos experimentales -principalmente difracción de rayos X- muy costosos, difíciles y que no podían ser masificados”, explica Juri Ayub.
Finalmente, hace cuatro años Hassabis y Jumper presentaron un modelo de IA llamado AlphaFold, con el que se han podido predecir la estructura de prácticamente los 200 millones de proteínas conocidas.
“Esta nueva herramienta nos permite predecir la estructura de proteínas para las que no tenemos datos experimentales con un alto grado de precisión y certeza”, explica Mascotti.
Desde 2020, AlphaFold ha sido utilizado por más de dos millones de personas de 190 países. Entre sus infinitas aplicaciones, los investigadores pueden ahora comprender mejor la resistencia a los antibióticos y crear imágenes de enzimas capaces de descomponer el plástico.
“Antes, para conocer la estructura de una proteína dependíamos de la cristalografía de rayos X, pero no todas las proteínas se pueden cristalizar. O bien generar un modelo, pero para eso era necesario contar con una proteína similar ya disponible. Esto ahora ya no es necesario gracias AlphaFold. Acceder a esta información nos permite conocer precisamente cómo se estructura en el espacio una proteína, cómo interactúa con sus dianas, saber si podemos diseñar mutaciones ‘a medida’, o si podemos alterar sus funciones, o rediseñarla para que se comporte de una u otra manera”, explica Mascotti.
La investigadora del CONICET destaca que en los últimos años se ha producido una gran sinergia en torno a estas dos herramientas, “porque ahora podemos diseñar computacionalmente proteínas completamente nuevas, que no existen en la naturaleza, y predecir qué estructura van a tener con gran precisión, y así estimar también cómo se van comportar cuando las obtengamos experimentalmente “. En este sentido, Mascotti señala que el propio Baker ha incorporado el uso de AlphaFold a su trabajo.
“Yo creo que esta premiación es histórica. Me alegra que la relevancia de estos descubrimientos sea tenida en cuenta hoy, porque es algo que está pasando en este momento, no es un descubrimiento que ocurrió hace tiempo y que se resignifica. Personalmente, me llena de entusiasmo que esto ocurra”, agrega la investigadora del CONICET.
El investigador del CONICET en el Instituto de Investigaciones Bioquímicas de Buenos Aires (IIBBA, CONICET-Fundación Instituto Leloir) Julio Caramelo explica que la mayor parte de lo que sucede en las células es mediada por alguna proteína. La información para fabricarlas está en segmentos de nuestro ADN denominados genes. “En principio nuestro ADN tiene información para fabricar más de 21 mil proteínas distintas, cada una con una secuencia de aminoácidos característica. Lo interesante es que una vez fabricada muchas cadenas proteicas se pliegan en el espacio de una forma muy definida, que es necesaria para que pueda cumplir con su función biológica. Cambios en la secuencia de aminoácidos, por ejemplo, por una mutación adquirida luego de nacer o por una mutación genética, pueden hacer que una proteína no se pliegue de forma correcta y llevar a que su actividad biológica se pierda o esté descontrolada.”, afirma Caramelo.
Desde que en 1972 el estadounidense Christian Anfinsen obtuvo el Nobel por haber demostrado que la información para que una proteína se pliegue correctamente está codificada en su secuencia de aminoácidos, miles de investigadores trataron de predecir la estructura de una proteína a partir de su secuencia.
“Conocer el código podría permitir abrir un mundo de posibilidades. Por una parte, permitiría explicar a nivel molecular el funcionamiento de miles de procesos biológicos, y consecuentemente comprender miles de enfermedades. Asimismo, el manejo de este código nos permitiría diseñar proteínas que nunca existieron en la naturaleza. Esto abre un mundo de posibilidades en numerosos campos como la salud humana, la tecnología de alimentos o los materiales”, señala Caramelo.
De acuerdo con el investigador, una particularidad del código de plegado proteico es que es muy indirecto, a diferencia del código del ADN que se emplea para fabricar las proteínas que funciona de una forma bastante lineal. “Es por eso que los avances en este campo fueron relativamente lentos durante más de 40 años”, afirma.
Aunque claramente había un patrón de información, era demasiado complejo como para encontrarlo usando las técnicas tradicionales. Esto cambió dramáticamente hace unos pocos años cuando se comenzaron a usar las herramientas de aprendizaje profundo. “Hoy por hoy uno puede predecir con bastante certeza la estructura de una proteína a partir de su secuencia de aminoácidos. La velocidad de estos avances ha sido impresionante, y en muy poco tiempo este conocimiento demostró su validez y utilidad, siendo realmente revolucionarios”, concluye Caramelo.