LA INTELIGENCIA ARTIFICIAL TAMBIÉN VE EL MUNDO, PERO NO LO ENTIENDE COMO NOSOTROS

No llega al nivel semántico, sino que se queda en una percepción visual que explica sus limitaciones

La IA y nosotros vemos el mismo mundo, pero no de la misma forma. / ChatGPT/T21

EDUARDO MARTÍNEZ DE LA FE/T21

Madrid 26 JUN 2025

Aunque la IA puede imitar el rendimiento humano en tareas complejas, su "visión del mundo" es intrínsecamente diferente: la nuestra es semántica y la suya es visual. Un sesgo que explica por qué los modelos inteligentes a veces cometen errores ilógicos, o son vulnerables a manipulaciones sutiles.

Un estudio publicado en la revista Nature Machine Intelligence ha desarrollado un innovador marco para comparar cómo los humanos y la inteligencia artificial (IA) interpretan el mundo, revelando diferencias fundamentales en sus estrategias de representación a pesar de las similitudes superficiales en su comportamiento. Esta investigación no solo profundiza en nuestra comprensión de la cognición humana, sino que también ofrece claves para desarrollar sistemas de IA más seguros y fiables.

Históricamente, la comparación entre la inteligencia humana y la artificial se ha basado en medidas globales que cuantifican el grado de similitud entre ambas, pero sin explicar las causas de sus diferencias. La irrupción de la IA generativa ha intensificado el debate sobre su uso y regulación en todos los ámbitos, desde la ciencia hasta la vida cotidiana. Con herramientas de IA cada vez más presentes, resulta crucial entender no solo qué hacen, sino cómo "piensan".

Para abordar este desafío, los investigadores diseñaron un experimento basado en una tarea cognitiva simple llamada "el elemento discordante" (odd-one-out). En esta prueba, se presentan tres imágenes y el participante —ya sea un humano o una IA— debe seleccionar la que menos se parece a las otras dos. Este método permite inferir los criterios de similitud que cada sistema utiliza para organizar la información del mundo.

Los científicos aplicaron esta tarea tanto a un extenso conjunto de datos de juicios humanos como a una red neuronal profunda (DNN) del tipo VGG-16, un modelo comúnmente utilizado en el campo de la neurociencia computacional por su buena correspondencia con el comportamiento humano y la actividad neuronal.

El hallazgo clave: sesgo visual frente a sesgo semántico

Al analizar los resultados, el estudio extrajo las "dimensiones representacionales" latentes, es decir, las propiedades fundamentales (como el color, la forma o la función) que tanto humanos como la IA utilizan para categorizar las imágenes.

Los resultados revelaron una divergencia estratégica fundamental: la representación humana está dominada por un sesgo semántico. Es decir, las personas tendemos a agrupar los objetos basándonos en su significado, función o categoría conceptual (por ejemplo, "es comida", "es un animal", "es tecnología"). Sin embargo, la representación de la IA muestra un claro sesgo visual. La red neuronal agrupa las imágenes principalmente por sus atributos perceptivos, como la textura, la forma o el color (por ejemplo, "es redondo", "es metálico", "tiene una textura fibrosa").

Aunque la IA identificó dimensiones que parecían semánticas, como "relacionado con la comida", una comparación directa con las dimensiones humanas expuso que estas eran solo aproximaciones. Por ejemplo, en una dimensión relacionada con los "animales", los humanos agrupaban coherentemente a los animales. En cambio, la IA, aunque también identificaba a los animales, incluía en la misma categoría objetos no animales que compartían características visuales, como jaulas o texturas naturales. Esta diferencia demuestra que, aunque el comportamiento final pueda parecer similar, el "razonamiento" subyacente es distinto.

¿Son coherentes las representaciones de la IA?

Para verificar si las dimensiones de la IA eran internamente coherentes, los investigadores utilizaron técnicas de interpretabilidad avanzadas. Mediante métodos como Grad-CAM, lograron visualizar qué regiones de una imagen eran más importantes para activar una dimensión específica (por ejemplo, los trastes de una guitarra para la dimensión "fibrosa"). Además, utilizando modelos generativos (StyleGAN-XL), consiguieron crear imágenes nuevas que maximizaban la activación de una dimensión concreta, generando con éxito imágenes que se alineaban con las etiquetas asignadas por los humanos, como "metálico y oxidado".

Estos experimentos demostraron que las representaciones de la IA son coherentes dentro de su propia lógica visual, pero también que esta lógica es fundamentalmente diferente de la base semántica que rige la percepción humana.

Implicaciones para el futuro de la IA

Las conclusiones de este estudio tienen profundas implicaciones en un momento en que la sociedad debate cómo integrar y regular la inteligencia artificial, señalan los autores del artículo.

El "sesgo visual" puede explicar por qué los modelos de IA a veces cometen errores que a los humanos nos parecen ilógicos, o son vulnerables a manipulaciones sutiles. Comprender este sesgo es el primer paso para corregirlo y crear sistemas más alineados con la intuición humana y así conseguir una IA más robusta y segura.

Por otro lado, al actuar como un espejo, la IA y sus diferencias nos permiten entender mejor las características únicas de la cognición humana, como nuestro profundo anclaje en el significado. Estos modelos nos ayudan a entender mejor la mente humana.

Por último, en un mundo donde la industria domina el desarrollo de modelos de IA cada vez más potentes, en el que la comunidad científica establece normas estrictas sobre su uso, entender cómo "piensan" estos sistemas es esencial. El llamado "dilema de control" advierte que los efectos de una tecnología no son evidentes hasta que su control se vuelve costoso y difícil. Estudios como este ofrecen una mirada "bajo el capó" que resulta indispensable para guiar el desarrollo tecnológico de manera responsable y mitigar riesgos antes de que se generalicen. Ofrece un contexto para la regulación y la ética de la IA.

Esta investigación concluye que superar la mera similitud entre la percepción humana y de la IA es el mayor desafío de esta tecnología para lograr una verdadera alineación en la representación del mundo.

________

Referencia

Dimensions underlying the representational alignment of deep neural networks with humans. Florian P. Mahner et al. Nature Machine Intelligence, volume 7, pages848–859 (2025)

__________

Fuente:

https://www.epe.es/es/tendencias21/20250626/inteligencia-artificial-ve-mundo-entiende-119075841

A TONO CON LA FRACTURA DE LA GLOBALIZACIÓN Y LOS DILEMAS DE LA DESDOLARIZACIÓN

BRICS I Y II: BRICS I: A TONO CON LA FRACTURA DE LA GLOBALIZACIÓN RESUMEN La guerra conta Irán apunta contra los BRICS y modifica la agenda de una coalición, que sustituyó la reforma de los organismos mundiales por la gestación de instituciones propias. La incautación de activos rusos precipitó ese giro que empalma con la multipolaridad. China apuntala su expansión económica y Rusia sus defensas geopolíticas, mientras que India, Brasil y Sudáfrica amplían su autonomía, manteniendo los puentes con Occidente. La atracción del quinteto converge con el rebrote general del desarrollismo. _______ Claudio Katz 1 La próxima cumbre de los BRICS en Río de Janeiro se desenvolverá en un escenario crítico. El bloque incorporará nuevos integrantes y discutirá repuestas económicas a la agresión tarifaria de Trump. Pero también la guerra de Ucrania, el genocidio de Palestina y el bombardeo a Irán estarán en la agenda. Los BRICS concentran los grandes cambios de la época y su evaluación permite ...

Sponsor

Recent

LA INTELIGENCIA ARTIFICIAL TAMBIÉN VE EL MUNDO, PERO NO LO ENTIENDE COMO NOSOTROS

Sin comentarios

LO MÁS VISTO

EMANCIPACIÓN N° 996

LA OTAN FRENTE A LA RECONFIGURACIÓN GLOBAL

A TONO CON LA FRACTURA DE LA GLOBALIZACIÓN Y LOS DILEMAS DE LA DESDOLARIZACIÓN

ENTRADA DESTACADA

TRUMP SE DESDOBLA ENTRE SU PULSIÓN EXTERMINADORA Y SU YO MESIÁNICO

Biblioteca Emancipación

Libro N° 6244. Genghis Khan. Lamb, Harold.

Libro N° 6243. Ciro El Grande. Lamb, Harold.

Libro N° 6242. La Mujer En Tiempo De Las Catedrales. Pernoud, Regine.

LIBROS PARA LEER O DESCARGAR N°24

LIBROS PARA LEER O DESCARGAR N°23

LIBROS PARA LEER O DESCARGAR N°22

LIBROS PARA LEER O DESCARGAR N°21

Emancipación N° 996 - 995 - 994

GRILLA DE CANALES GRATIS: NOTICIAS, ENTRETENIMIENTO

Vistas de página en total

INDICE DE ARTÍCULOS Y ENTRADAS

PÁGINAS

RADIO NUEVA JUVENTUD

Etiquetas

Revista Pedagógica Nueva Escuela

LA NEUROCIENCIA CONFIRMA QUE DISTRAERSE NO ES PERDER EL TIEMPO, SINO UNA FORMA DE APRENDER

EL DÍA DEL MAESTRO Y LA URGENCIA DEL SOCIALISMO PARA SALVAR LA EDUCACIÓN Y LA VIDA

LA EMERGENCIA SOCIOEDUCATIVA Y EL PAPEL DE LOS PADRES HOY

¿EN QUÉ LABORAN LOS TRABAJADORES DE LA EDUCACIÓN?

KANT Y MARX

FILÓSOFOS DESTRUCTORES Y CONSTRUCTORES