La IA acelera la evolución y crea una proteína fluorescente con aplicaciones revolucionarias
Imagina poder acelerar la evolución natural en millones de años con solo unas pocas líneas de código. Algo que parecía imposible hasta hace poco, ahora es una realidad gracias a la inteligencia artificial.
Investigadores de la empresa EvolutionaryScale han logrado diseñar, con la ayuda de un modelo de IA, una nueva proteína fluorescente que la naturaleza, por sí sola, podría haber tardado 500 millones de años en desarrollar. Este avance, publicado en la revista Science, abre las puertas a nuevas aplicaciones en bioingeniería, desde el desarrollo de fármacos hasta la creación de proteínas con funciones optimizadas para la investigación médica.
La revolución de ESM3: inteligencia artificial aplicada a la biología
El motor detrás de este logro es ESM3, un modelo de inteligencia artificial diseñado para comprender la estructura y la función de las proteínas con un nivel de precisión sin precedentes. Su entrenamiento es similar al de los modelos de lenguaje avanzados, como los que generan texto o traducen idiomas, pero aplicado al mundo de la biología.
Para lograrlo, ESM3 procesó un conjunto de datos con 2.78 mil millones de proteínas de toda la diversidad natural de la Tierra. Gracias a esta información y a su capacidad de aprendizaje profundo, el modelo fue capaz de predecir y diseñar nuevas secuencias proteicas, sin necesidad del largo proceso evolutivo natural que tradicionalmente da forma a estas moléculas.
«Hemos descubierto que ESM3 no solo aprende biología fundamental, sino que también puede generar proteínas funcionales que la evolución aún no ha explorado«, explicó Alexander Rives, cofundador y científico jefe de EvolutionaryScale.
De las medusas a la IA: una nueva proteína fluorescente
Uno de los resultados más sorprendentes de este experimento fue la creación de esmGFP, una proteína fluorescente diseñada completamente por inteligencia artificial. Esta molécula es una versión mejorada de la proteína fluorescente verde (GFP), la misma responsable del brillo de las medusas y los colores fluorescentes de algunos corales.
La GFP ha sido utilizada durante décadas en laboratorios como marcador biológico para visualizar procesos celulares, permitiendo a los científicos rastrear cómo funcionan genes y proteínas dentro de los organismos vivos. Ahora, esmGFP abre la posibilidad de desarrollar nuevas variantes con propiedades optimizadas, que podrían mejorar la investigación médica y la bioingeniería.
¿Cómo aprende la IA a diseñar proteínas?
El proceso de entrenamiento de ESM3 es comparable a cómo los modelos de lenguaje completan frases en un texto. Rives lo explica con un ejemplo sencillo:
«De la misma manera que alguien puede completar los espacios en blanco en la frase ‘to _ or not to _’, podemos entrenar un modelo para que complete los espacios en blanco en las proteínas.”
Lo que parece un ejercicio simple en realidad permite que el modelo descubra patrones estructurales y funcionales ocultos en la biología de las proteínas, generando nuevas variantes que podrían tener usos en medicina, biotecnología y otras áreas.
Un futuro prometedor para la biología sintética
Este avance marca un antes y un después en la forma en que se diseñan las proteínas. Con la ayuda de la IA, los científicos ahora pueden crear moléculas con funciones específicas en cuestión de días o semanas, un proceso que en la naturaleza llevaría millones de años.
El potencial de esta tecnología es enorme: desde nuevas terapias médicas hasta materiales biocompatibles diseñados a medida. A medida que la IA sigue evolucionando, la biología sintética podría convertirse en una de las áreas de mayor impacto en la ciencia, permitiendo a los investigadores diseñar desde cero las moléculas del futuro.