La inteligencia artificial resuelve casi por completo uno de los grandes enigmas de la biología

Las proteínas son moléculas complejas compuestas por cadenas de aminoácidos y las funciones que desempeñan dependen en gran medida de su estructura en tres dimensiones, que es única para cada proteína.

Por ello, averiguar cómo adquieren su forma tridimensional ha sido uno de los anhelos de los biólogos desde hace 50 años. Un enigma que se conoce como el problema del plegamiento de la proteína (protein folding problem, en inglés) y que ahora la inteligencia artificial parece haber resuelto casi totalmente.

La compañía Deepmind señaló que la última versión del software de inteligencia artificial AlphaFold consiguió descifrar cómo las proteínas adquieren su forma, por medio del deep learning (aprendizaje profundo).

«Este hito demuestra el impacto que la inteligencia artificial puede tener en los descubrimientos científicos y su potencial para acelerar el progreso en algunos de los campos más importantes que explican y modelan nuestro mundo», destacó la compañía DeepMind, fundada en 2010 y adquirida por Google hace seis años.

Las proteínas juegan un papel esencial en muchos procesos, desde el desarrollo de una enfermedad y por tanto en el descubrimiento de tratamientos médicos para combatirlas, a la búsqueda de enzimas que destruyan desechos industriales. Por eso, conocer cómo adquieren su forma, afirmaron los ingenieros de DeepMind, puede ayudar a acelerar el desarrollo de fármacos para tratar enfermedades, incluyendo la Covid-19, y a mejorar procesos industriales. Pero también a conocer mejor cómo funciona el cuerpo humano y el mundo.

«Esto va a cambiar la medicina, va a cambiar la investigación y la bioingeniería. Lo va a cambiar todo», aseguró Andrei Lupas, biólogo en el Instituto Max Planck de Biología del Desarrollo en Tübingen, Germany. Tal y como declaró a la revista Nature, el programa AlphaFold le ha ayudado ya a descubrir la estructura de una proteína en su laboratorio con la que trabajaba desde hace una década.

El éxito de la proteína

La función biológica que desempeña una proteína depende de su correcto plegamiento. Se trata de un proceso espontáneo y termodinámicamente irreversible: si una proteína no se pliega correctamente, no será funcional y, por lo tanto, no podrá cumplir con su función biológica.

El problema del doblamiento de la proteína surgió en los años 60, con la aparición de las primeras estructuras de proteínas con resolución atómica. Algunas tenían una forma interna esperada, pero otras no. Así que se planteó este enigma, que a su vez encierra tres puzzles relacionados para averiguar tres interrogantes: qué es el código de doblamiento, cuál es el mecanismo de doblamiento y si se puede predecir la estructura original de una proteína a partir de su secuencia de aminoácidos.

En los últimos años ha habido avances para resolver este enigma y en la actualidad las estructuras de pequeñas proteínas se pueden predecir con varias técnicas complejas de análisis de materiales como la criomicroscopía electrónica, la resonancia magnética nuclear o la cristalografía de rayos-X. Se trata de métodos complejos que requieren largos y laboriosos experimentos y equipos tecnológicos caros para llevarlos a cabo.

Machine learning

El programa de DeepMind ha aprendido a reconocer cómo se forman estas estructuras y es capaz de averiguar la forma tridimensional de la proteína en cuestión de horas.

«Se trata de algo muy importante. En cierto modo, el problema ha sido resuelto», ha declarado John Moult, biólogo computacional en la Universidad de Maryland y uno de los fundadores del concurso CASP para mejorar los métodos computacionales que permiten predecir de forma correcta las estructuras de las proteínas.

Los ingenieros de DeepMind explicaron que su programa AlphaFold ha sido entrenado con una base de datos pública que contiene 170.000 estructuras de proteínas, a partir de las cuales aprendió a identificar su forma tridimensional. La primera versión del programa de inteligencia artificial AlphaFold participó en el concurso CASP en 2018, logrando predecir la estructura de las proteínas con una fiabilidad de 60 (en una escala de 100 puntos). En la edición celebrada ahora, la nueva versión de AlphaFold ha logrado una puntuación de 90 sobre 100.

Los ingenieros de DeepMind esperan que su programa les ayude a identificar proteínas que han funcionado de manera incorrecta y a averiguar por qué, lo que podría ayudar a desarrollar de forma más precisa y más rápida nuevos fármacos. La IA complementaría a los métodos experimentales actuales para el desarrollo de medicamentos.

La predicción de la estructura de una proteína, añaden, podría ser útil también para responder ante futuras pandemias como la del coronavirus. A principios de año, fueron capaces de predecir las estructuras de varias proteínas del coronavirus SARS-CoV-2, entre ellas la ORF3a y la ORF8.

 

Compartir este artículo

Artículos relacionados

Según explicó, la agencia sanitaria conocía la situación del paciente, un hombre mayor de 65 años que había ingresado en el hospital a mediados de diciembre contagiado por el virus H5N1 y con patologías previas. En esta línea, Harris destacó que "el riesgo siempre ha estado ahí", razón por la que el trabajo conjunto de organizaciones y expertos en salud animal es "fundamental".
Saber quién puede progresar a lo largo del proceso de la enfermedad es fundamental para el diagnóstico y la intervención tempranos, un mejor tratamiento y un mejor manejo de la enfermedad, según un equipo dirigido por investigadores de la Facultad de Medicina de Penn State que ha desarrollado un nuevo método para predecir la progresión de la enfermedad autoinmune entre aquellos con síntomas preclínicos.
Una nueva investigación de la Universidad de Colorado en Boulder sugiere otra herramienta sorprendente que podría ayudarlas a lograr su propósito: la exposición a bacterias beneficiosas. El estudio, publicado en la revista Brain, Behavior, and Immunity, muestra que los animales inyectados semanalmente con un microorganismo encontrado en la leche de vaca y el suelo fueron esencialmente inmunes al aumento de peso debido a una dieta rica en grasas y azúcar.
Un nuevo estudio del grupo ha identificado 13 genes, denominados "genes de riesgo de alta probabilidad", que contribuyen directamente a la pérdida de tejido articular y aumentan en gran medida las probabilidades de que una persona desarrolle osteoartritis. Sus resultados, que se publicaron en Cell Genomics, han llenado un vacío de conocimiento considerable en el esfuerzo por definir objetivos genéticos para terapias.