La inteligencia artificial resuelve casi por completo uno de los grandes enigmas de la biología

Las proteínas son moléculas complejas compuestas por cadenas de aminoácidos y las funciones que desempeñan dependen en gran medida de su estructura en tres dimensiones, que es única para cada proteína.

Por ello, averiguar cómo adquieren su forma tridimensional ha sido uno de los anhelos de los biólogos desde hace 50 años. Un enigma que se conoce como el problema del plegamiento de la proteína (protein folding problem, en inglés) y que ahora la inteligencia artificial parece haber resuelto casi totalmente.

La compañía Deepmind señaló que la última versión del software de inteligencia artificial AlphaFold consiguió descifrar cómo las proteínas adquieren su forma, por medio del deep learning (aprendizaje profundo).

«Este hito demuestra el impacto que la inteligencia artificial puede tener en los descubrimientos científicos y su potencial para acelerar el progreso en algunos de los campos más importantes que explican y modelan nuestro mundo», destacó la compañía DeepMind, fundada en 2010 y adquirida por Google hace seis años.

Las proteínas juegan un papel esencial en muchos procesos, desde el desarrollo de una enfermedad y por tanto en el descubrimiento de tratamientos médicos para combatirlas, a la búsqueda de enzimas que destruyan desechos industriales. Por eso, conocer cómo adquieren su forma, afirmaron los ingenieros de DeepMind, puede ayudar a acelerar el desarrollo de fármacos para tratar enfermedades, incluyendo la Covid-19, y a mejorar procesos industriales. Pero también a conocer mejor cómo funciona el cuerpo humano y el mundo.

«Esto va a cambiar la medicina, va a cambiar la investigación y la bioingeniería. Lo va a cambiar todo», aseguró Andrei Lupas, biólogo en el Instituto Max Planck de Biología del Desarrollo en Tübingen, Germany. Tal y como declaró a la revista Nature, el programa AlphaFold le ha ayudado ya a descubrir la estructura de una proteína en su laboratorio con la que trabajaba desde hace una década.

El éxito de la proteína

La función biológica que desempeña una proteína depende de su correcto plegamiento. Se trata de un proceso espontáneo y termodinámicamente irreversible: si una proteína no se pliega correctamente, no será funcional y, por lo tanto, no podrá cumplir con su función biológica.

El problema del doblamiento de la proteína surgió en los años 60, con la aparición de las primeras estructuras de proteínas con resolución atómica. Algunas tenían una forma interna esperada, pero otras no. Así que se planteó este enigma, que a su vez encierra tres puzzles relacionados para averiguar tres interrogantes: qué es el código de doblamiento, cuál es el mecanismo de doblamiento y si se puede predecir la estructura original de una proteína a partir de su secuencia de aminoácidos.

En los últimos años ha habido avances para resolver este enigma y en la actualidad las estructuras de pequeñas proteínas se pueden predecir con varias técnicas complejas de análisis de materiales como la criomicroscopía electrónica, la resonancia magnética nuclear o la cristalografía de rayos-X. Se trata de métodos complejos que requieren largos y laboriosos experimentos y equipos tecnológicos caros para llevarlos a cabo.

Machine learning

El programa de DeepMind ha aprendido a reconocer cómo se forman estas estructuras y es capaz de averiguar la forma tridimensional de la proteína en cuestión de horas.

«Se trata de algo muy importante. En cierto modo, el problema ha sido resuelto», ha declarado John Moult, biólogo computacional en la Universidad de Maryland y uno de los fundadores del concurso CASP para mejorar los métodos computacionales que permiten predecir de forma correcta las estructuras de las proteínas.

Los ingenieros de DeepMind explicaron que su programa AlphaFold ha sido entrenado con una base de datos pública que contiene 170.000 estructuras de proteínas, a partir de las cuales aprendió a identificar su forma tridimensional. La primera versión del programa de inteligencia artificial AlphaFold participó en el concurso CASP en 2018, logrando predecir la estructura de las proteínas con una fiabilidad de 60 (en una escala de 100 puntos). En la edición celebrada ahora, la nueva versión de AlphaFold ha logrado una puntuación de 90 sobre 100.

Los ingenieros de DeepMind esperan que su programa les ayude a identificar proteínas que han funcionado de manera incorrecta y a averiguar por qué, lo que podría ayudar a desarrollar de forma más precisa y más rápida nuevos fármacos. La IA complementaría a los métodos experimentales actuales para el desarrollo de medicamentos.

La predicción de la estructura de una proteína, añaden, podría ser útil también para responder ante futuras pandemias como la del coronavirus. A principios de año, fueron capaces de predecir las estructuras de varias proteínas del coronavirus SARS-CoV-2, entre ellas la ORF3a y la ORF8.

 

Compartir este artículo

Artículos relacionados