Un nuevo modelo de aprendizaje profundo supera los algoritmos predictivos que anticipan enfermedades y la mortalidad hospitalaria
La IA codifica la información de una persona y puede anticipar su probable futuro, incluso el momento de su muerte, / Generador de imágenes de la IA de BING para T21/Prensa Ibérica, desarrollada con tecnología de DALL·E.
Eduardo Martínez de la Fe
La inteligencia artificial puede analizar datos de registro sobre la residencia, la educación, los ingresos, la salud y las condiciones laborales de una persona y predecir acontecimientos de su vida con gran precisión, incluso el momento probable de su muerte.
Los modelos propios de la Inteligencia Artificial (IA), como el que usa ChatGPT, son una poderosa herramienta para procesar el lenguaje natural, pero también pueden aplicarse a otros tipos de datos secuenciales, como las series temporales.
Las series temporales son registros de observaciones ordenadas en el tiempo, que pueden provenir de diversas fuentes, como la economía, la medicina, la meteorología o la ingeniería.
Estas series temporales contienen información valiosa sobre el pasado, el presente y el futuro de los fenómenos que las generan, y, por lo tanto, es importante poder analizarlas y usarlas como métodos predictivos de acontecimientos previsibles.
Modelos de supervivencia
Una forma de predecir la evolución de las series temporales es usar modelos de supervivencia, que estiman la probabilidad de que ocurra un evento de interés (como la muerte, el fallo de un sistema o la compra de un producto) en función del tiempo y de otras variables explicativas.
Sin embargo, estos modelos tradicionales de supervivencia tienen algunas limitaciones, como la dificultad para capturar las relaciones no lineales y complejas entre las variables, o la necesidad de hacer supuestos restrictivos sobre la forma de la distribución.
Para superar estas limitaciones, se han propuesto modelos de supervivencia basados en el aprendizaje profundo (una forma avanzada de aprendizaje automático propio de la IA) que usan redes neuronales recurrentes profundas y redes neuronales convolucionales para aprender de las representaciones de los datos y modelar la distribución de supervivencia de forma flexible y adaptativa.
Modelo transformador
Entre estos modelos de supervivencia, los basados en el sistema Transformador (un modelo de aprendizaje automático) son especialmente prometedores, ya que pueden aprovechar las ventajas de su arquitectura, como la capacidad de captar las dependencias a largo plazo, la paralelización eficiente y la atención selectiva, para ofrecer resultados más amplios y precisos.
El transformador es un modelo basado en un mecanismo de auto-atención, que permite que cada elemento de una secuencia se relacione con todos los demás, sin importar su posición.
El modelo Transformador incluye también un codificador y un decodificador, que procesan la secuencia de entrada y generan la secuencia de salida, respectivamente. Cada uno de estos módulos está formado por varias capas de auto-atención y por redes neuronales feed-forward (sin retroalimentación) que se conectan mediante conexiones residuales y normalización de capas.
El transformador también usa mecanismos de enmascaramiento y codificación posicional para preservar la información temporal y evitar el acceso a información futura. Este modelo representa una de las grandes proezas tecnológicas de la IA.
Tecnología de los modelos de la IA para predecir secuencias futuras de una persona. / Generador de imágenes de la IA de BING para T21/Prensa Ibérica, desarrollada con tecnología de DALL·E.
Función de supervivencia
Los modelos de supervivencia basados en el sistema Transformador pueden usar el codificador para extraer características de las series temporales, y el decodificador para generar la función de riesgo o la función de supervivencia, que son las que determinan la probabilidad de que ocurra el evento de interés en cada instante de tiempo.
Estos modelos pueden entrenarse mediante la maximización de la verosimilitud de los datos observados y censados, o mediante la minimización de alguna función de pérdida adecuada.
Estos modelos transformadores han demostrado su eficacia y superioridad frente a otros modelos de supervivencia en diversos conjuntos de datos, tanto sintéticos como reales.
Además, pueden incorporar fácilmente información adicional, como variables estáticas, categóricas o espaciales, que pueden mejorar el rendimiento y la interpretación de los modelos.
Por último, estos modelos pueden usarse para hacer predicciones probabilísticas sobre los eventos futuros en la vida de las personas, e incluso estimar el momento probable de muerte, lo que puede tener aplicaciones en la medicina, la biología, la sociología o la psicología.
Nueva aproximación
Un proyecto de investigación de DTU, la Universidad de Copenhague, la UIT y la Universidad Northeastern de EE. UU. ha dado ahora un paso adelante en la historia de esta tecnología: ha diseñado un modelo transformador más rápido y eficiente que puede entrenar grandes modelos de lenguaje en grandes conjuntos de datos, según se informa en un comunicado.
Los autores de esta investigación, que publican sus resultados en la revista Nature Computational Science, han denominado a su modelo Life2Vec y lo han especializado en representaciones numéricas del comportamiento social: analiza lo que se llama secuencias de vida, es decir, eventos que han sucedido en la vida humana.
El modelo es capaz de resumir la vida de una persona en función de la secuencia de los acontecimientos pasados y de predecir su futuro en un plazo de cuatro años con un alto nivel de fiabilidad. Como modelo transformador que es, incluso puede estimar el momento probable de su fallecimiento.
Datos de 6 millones de daneses
Los investigadores han testado Life2Vec analizando los datos de salud y la vinculación al mercado laboral de 6 millones de daneses, planteándole al modelo las posibilidades de morir en el plazo de cuatro años.
Life2vec codifica la información sobre la vida de una persona en un gran sistema de vectores, una estructura matemática que organiza los diferentes datos. El modelo decide por sí solo dónde colocar los datos sobre el momento de nacimiento, escolaridad, educación, salario, vivienda y salud.
Los resultados obtenidos con la combinación y proyección de estos datos son consistentes con los hallazgos obtenidos por las ciencias sociales: por ejemplo, en igualdad de condiciones, las personas en una posición de liderazgo o con altos ingresos tienen más probabilidades de sobrevivir, mientras que ser hombre, estar capacitado o tener un trastorno mental se asocia con un mayor riesgo de morir.
Amplio espectro social
Germans Savcisens, primer autor de esta investigación, añade algo significativo al respecto: que en el ámbito de la atención sanitaria el aprendizaje automático ya ha demostrado que el uso de datos de salud puede generar modelos potentes para predecir resultados futuros relacionados con la salud, como la detección temprana de enfermedades, insuficiencia cardíaca, efectos secundarios de la medicación prescrita y mortalidad hospitalaria.
Life2vec, sin embargo, va mucho más allá: incorpora acontecimientos de la vida conceptualmente similares a los de registros médicos, pero mucho más interesantes, ya que contienen información sobre los acontecimientos más importantes de la vida humana más allá de la salud.
El modelo puede incluir datos sobre educación, impuestos, interacciones con los servicios municipales, etc. y construir representaciones numéricas del comportamiento de una persona. Esas representaciones se pueden utilizar para predecir su edad de jubilación, identificar fraudes fiscales, prever delitos, etc.
Según los investigadores, el siguiente paso de su trabajo será incorporar al modelo más parámetros de información, como texto e imágenes, e incluso la información reflejada en las redes sociales. Este uso de datos abre una interacción completamente nueva entre las ciencias sociales y las ciencias de la salud, entre otros aspectos de la vida de las personas.
Cuestiones éticas
Los investigadores reconocen que el modelo life2vec plantea numerosas cuestiones éticas, como la protección de datos confidenciales, la privacidad y el papel del sesgo en los datos.
Estos desafíos deben entenderse más profundamente antes de que el modelo pueda usarse, por ejemplo, para evaluar el riesgo de un individuo de contraer una enfermedad u otros acontecimientos vitales previsibles, concluyen los autores de esta investigación.
___________
Referencias
Using sequences of life-events to predict human lives. Germans Savcisens et al. Nature Computational Science (2023). DOI:https://doi.org/10.1038/s43588-023-00573-5
______
Fuente: