Una proteína que tardaría 500 millones de años en aparecer de forma natural es creada por una Inteligencia Artificial en tan solo unos meses
Una IA crea una proteína fluorescente que habría tardado 500 millones de años en surgir de forma natural, marcando un hito en la biología sintética.
Microscopio, medusa y proteína. Fuente: ChatGPT / Science
Eugenio M. Fernández Aguilar
Físico, escritor y divulgador científico. Director de Muy Interesante Digital
Creado: 29.01.2025
Pocas cosas han cambiado el curso de nuestra relación con la naturaleza como los avances tecnológicos. Hoy, un nuevo hito marca esa evolución: una Inteligencia Artificial ha diseñado una proteína fluorescente que, de otro modo, habría tardado 500 millones de años en surgir mediante los procesos evolutivos naturales. Este logro podría impresionar tan solo por su rapidez, pero en este caso también lo hace por lo que implica para la ciencia, la medicina y el entendimiento de la biología misma.
La proteína, llamada esmGFP, ha sido desarrollada gracias al modelo de IA ESM3, que utiliza principios de los lenguajes generativos para "predecir" estructuras biológicas. Según el artículo publicado en Science, este modelo trabajó con un conjunto masivo de datos y logró crear una proteína funcional completamente inédita, abriendo puertas a una nueva era en la biología sintética. Pero, ¿cómo es posible que una máquina haya logrado en meses lo que la evolución necesita eones para conseguir?
Los fundamentos de una proteína diseñada por IA
Para entender el impacto de esmGFP, primero debemos conocer qué son las proteínas. Las proteínas son cadenas de aminoácidos que desempeñan funciones esenciales en los organismos vivos, desde la formación de tejidos hasta la defensa contra enfermedades. El modelo ESM3 creó una versión única de proteína fluorescente, similar a las que permiten que las medusas y corales brillen, pero con una secuencia genética que no existe en la naturaleza.
El secreto del éxito de ESM3 radica en su capacidad para trabajar con datos masivos. Entrenado con información de 2.780 millones de proteínas naturales y una red neuronal que aprende sobre las propiedades biológicas fundamentales, este modelo utiliza estrategias similares a cómo una IA completa textos. Según los investigadores, "la IA rellena huecos en las secuencias de proteínas de la misma manera que completa frases conocidas en un texto".
Lo fascinante de esmGFP es que su estructura es un 58 % diferente de las proteínas fluorescentes naturales conocidas. Para alcanzar este diseño, serían necesarias 96 mutaciones genéticas, un proceso que la evolución necesitaría más de 500 millones de años para realizar, según los autores.
La imagen muestra cómo ESM3 utiliza datos para diseñar proteínas con alta precisión, combinando información sobre sus características químicas y estructurales. Fuente: Science
Las aplicaciones de esmGFP
La creación de esta proteína tiene un potencial increíble para la investigación científica. Las proteínas fluorescentes ya son herramientas clave en laboratorios, ya que permiten rastrear procesos celulares y estudiar cómo funcionan genes y proteínas. EsmGFP, al ser completamente nueva, podría mejorar estas técnicas y llevarlas a niveles que aún no hemos imaginado.
Más allá de la investigación básica, esmGFP también podría influir en la creación de nuevos medicamentos. Según los autores del artículo, el modelo ESM3 puede acelerar los procesos de diseño de proteínas para aplicaciones terapéuticas. Esto incluye diseñar proteínas específicas para tratar enfermedades genéticas o mejorar la eficacia de tratamientos como las terapias dirigidas al cáncer.
Además, esta tecnología representa un avance en nuestra comprensión de la evolución misma. Aunque la IA no sigue las mismas "reglas" que la evolución natural, imita su creatividad explorando posibilidades que no ocurrirían de forma espontánea. Como señaló uno de los investigadores, "hemos descubierto que ESM3 aprende biología fundamental y puede generar proteínas funcionales fuera del espacio explorado por la evolución".
La imagen muestra cómo ESM3 crea proteínas únicas siguiendo indicaciones sobre secuencia, estructura y función. El modelo combina motivos atómicos con instrucciones avanzadas, logrando soluciones novedosas que se alejan de los datos de entrenamiento y de las proteínas naturales. Fuente: Science
Controversias y limitaciones
Aunque el avance es impresionante, no está exento de críticas y dudas por parte de la comunidad científica. Algunos expertos, como Tiffany Taylor, han señalado que, aunque la IA puede diseñar proteínas individuales, esto no es lo mismo que simular todo el proceso de evolución natural. Según ella, "la ingeniería de proteínas impulsada por IA es intrigante, pero puede ser que estemos subestimando los complejos procesos afinados por millones de años de selección natural".
Otro desafío importante es la aplicabilidad real de estas proteínas en organismos vivos. Aunque esmGFP existe como código genético y ha sido probado en entornos controlados, su funcionalidad en sistemas biológicos más complejos aún necesita ser validada. Por otra parte, la dependencia de datos masivos y potentes infraestructuras computacionales limita el acceso a estas tecnologías para muchos laboratorios del mundo.
Pese a estas limitaciones, la creación de esmGFP abre una discusión fascinante sobre el papel de la inteligencia artificial en el estudio de la biología y sobre cómo definimos el progreso científico.
La imagen muestra cómo ESM3 diseña esmGFP a partir de instrucciones de secuencia y estructura, logrando una fluorescencia comparable a las GFP comunes pero con un diseño único y altamente divergente. Fuente: Science
_____________
Referencias
Thomas Hayes et al. Simulating 500 million years of evolution with a language model. Science,eads0018 DOI:10.1126/science.ads0018
_________
Fuente: