Los científicos desarrollaron un enfoque novedoso para registrar y analizar secuencias virales utilizando IA
Proclorococo es una de las especies de bacterias marinas con proteínas que los investigadores revelaron gracias a la IA. / CRÉDITOS: ANNE THOMPSON/CHISHOLM LAB, MIT VÍA FLICKR.
Pablo Javier Piacente
Los virus son una fuerza misteriosa y poco comprendida: se sabe que pueden infectar, matar y manipular células humanas y bacterianas en casi todos los entornos, desde los océanos hasta nuestros intestinos. Sin embargo, aún no se tiene una idea completa de cómo los virus afectan el entorno que los rodea, en gran parte debido a su extraordinaria diversidad y capacidad para evolucionar rápidamente: ahora, la Inteligencia Artificial (IA) podría aportar nueva luz sobre este tema.
Un grupo de investigadores liderado por la profesora Libusha Kelly, de la Escuela de Medicina Albert Einstein de Nueva York, en Estados Unidos, diseñó una nueva metodología para anotar y estudiar secuencias virales mediante Inteligencia Artificial (IA). De acuerdo al nuevo estudio, publicado recientemente en la revista Nature Microbiology, el enfoque podría revelar profundos enigmas existentes sobre la actividad de los virus en múltiples contextos, desde el fondo de los océanos hasta los intestinos humanos.
Grandes cantidades de datos
Según explica Kelly en un artículo de su autoría que aparece en The Conversation, las comunidades de microbios son difíciles de estudiar en un laboratorio. Muchos microbios no se pueden cultivar fácilmente, y su entorno natural tiene muchas más características que influyen en su éxito o fracaso de las que los científicos pueden replicar en un laboratorio.
Frente a esto, los especialistas secuencian todo el ADN presente en una muestra y separan las secuencias de ADN viral, anotando las secciones del genoma viral que codifican proteínas. Estas anotaciones sobre la ubicación, estructura y otras características de los genes ayudan a los investigadores a comprender las funciones que los virus pueden desempeñar en el medio ambiente, además de permitir identificar diferentes tipos de virus.
Sin embargo, la identificación de secuencias virales en el ADN recolectado del medio ambiente crece a un ritmo que supera notablemente la capacidad de los científicos para anotar esos genes. Esto provoca que muchos investigadores tengan que publicar hallazgos sobre virus en ecosistemas microbianos utilizando fracciones demasiado pequeñas de los datos disponibles. Aquí es donde la IA puede marcar la diferencia, brindando un volumen de datos mucho mayor y en plazos de tiempo mucho más cortos.
Modelos de IA para secuencias virales
Kelly y sus colegas han desarrollado un enfoque novedoso para anotar secuencias virales utilizando Inteligencia Artificial. A través de modelos de lenguaje de proteínas, similares a modelos de lenguaje de gran tamaño (LLM) como ChatGPT pero específicos de proteínas, lograron clasificar secuencias virales nunca antes identificadas. El avance abre un nuevo camino para que los investigadores no solo aprendan más sobre los virus, sino también para abordar cuestiones biológicas que son difíciles de responder con las técnicas actuales.
Aunque el estudio se centró en los virus presentes en los océanos globales, identificando y caracterizando variedades desconocidas hasta hoy por la ciencia y que podrían cumplir un papel clave en estos ecosistemas, el nuevo enfoque también podría ser fundamental para comprender mejor el papel que desempeñan los virus en la salud y las enfermedades del cuerpo humano. Por ejemplo, podría permitir avanzar en la definición del impacto que tiene la actividad viral en el microbioma intestinal humano, y cómo logra alterarlo en distintas patologías.
20240518
________________
Referencia
Large language models improve annotation of prokaryotic viral proteins. Zachary N. Flamholz, Steven J. Biller and Libusha Kelly. Nature Microbiology (2024). DOI:https://doi.org/10.1038/s41564-023-01584-8
__________
Fuente: