Un nuevo estudio neurológico demuestra que nuestras neuronas y los grandes modelos de lenguaje anticipan las palabras con idéntica probabilidad
El cerebro y la IA: un mismo principio predictivo, dos arquitecturas distintas. / IA/T21
EDUARDO MARTÍNEZ DE LA FE/T21
elperiodico.com/Madrid03 JUN 2026
Un estudio demuestra, por primera vez en condiciones de escucha natural, que las predicciones de los grandes modelos de lenguaje se alinean con la actividad eléctrica y magnética del cerebro humano mientras comprende el habla. Este hallazgo inaugura una nueva forma de guiar el desarrollo de la inteligencia artificial.
Llevamos décadas debatiendo si la inteligencia artificial "piensa" de alguna forma parecida a nosotros, un debate que ha oscilado entre la metáfora y la filosofía. Un grupo de investigadores de la Universidad de Erlangen-Núremberg acaba de aportar algo diferente: datos neurológicos medidos directamente en el cráneo de 29 personas mientras escuchaban un audiolibro de ciencia ficción.
El resultado, publicado en NeuroImage, revela una correlación estadísticamente robusta entre lo que predicen los modelos de lenguaje (sistemas de inteligencia artificial entrenados sobre enormes volúmenes de texto para predecir, palabra a palabra, cuál es la continuación más probable de una frase), concretamente BERT, LLaMA 1B y LLaMA 3B, y lo que hace el cerebro humano en tiempo real cuando anticipa una palabra antes de oírla.
BERT y LLaMA pertenecen a una familia de modelos conocida como transformers: arquitecturas de redes neuronales que procesan texto analizando las relaciones entre todas las palabras de un contexto, no una por una sino en paralelo y con pesos de atención que determinan qué palabras importan más para predecir la siguiente. Son la base técnica de sistemas como ChatGPT, Gemini o Copilot. La diferencia clave entre BERT y LLaMA no es tanto de tamaño como de dirección: BERT lee el contexto en ambos sentidos a la vez, mientras que LLaMA lo procesa de izquierda a derecha, igual que hacemos nosotros al escuchar.
La arquitectura de la anticipación
Mientras que estos modelos calculan matemáticamente cuál será la siguiente palabra, nuestro sistema nervioso hace exactamente lo mismo a nivel orgánico. El cerebro no procesa el lenguaje de forma pasiva. Desde los años ochenta, la neurociencia conoce el componente N400: una señal eléctrica que aparece unos 400 milisegundos después de escuchar una palabra y que es tanto más intensa cuanto más inesperada resulta esa palabra en su contexto. Si alguien dice "el café estaba demasiado caliente para beberlo de un...", el cerebro ya ha apostado por "sorbo" antes de que llegue el sonido. Si escucha, por ejemplo, "llave inglesa" en su lugar, la N400 se dispara.
Lo que este estudio añade es que los LLMs hacen exactamente el mismo tipo de apuesta contextual, y que cuando su probabilidad asignada a una palabra es alta, la N400 del oyente humano es baja. Los datos muestran un margen de error (el famoso valor p) inferior a 0,001: esto nos dice que de cada 1.000 veces que hiciéramos el experimento, menos de una daría este resultado por puro azar.
Lo que hace singular este experimento
Estudios anteriores habían comparado LLMs con respuestas cerebrales usando frases aisladas, palabras sueltas o estímulos diseñados en laboratorio. El problema es que el cerebro real nunca procesa el lenguaje así. Procesa conversaciones, discursos, historias.
Kölbl y sus colegas grabaron simultáneamente EEG y MEG mientras los participantes escuchaban unos 50 minutos de un audiolibro de ciencia ficción en alemán (sin pausas artificiales, sin palabras críticas marcadas, sin contextos construidos) y compararon la actividad neural con las puntuaciones de predicibilidad que asignaban tres modelos de lenguaje a cada sustantivo. Es, según los propios autores, el primer estudio que demuestra este efecto con estimulación de habla continua y naturalista.
El descubrimiento más sugerente es que el cerebro no solo reacciona a las palabras: también las anticipa. Antes incluso de que empezara el sonido, los participantes mostraban actividad en regiones vinculadas al procesamiento lingüístico cuando la palabra era altamente esperable por el contexto. Dicho de forma simple: el cerebro iba por delante.
LLaMA vs. BERT: no todos los modelos se parecen igual al cerebro
Este carácter anticipatorio del cerebro en tiempo real es la clave para entender el siguiente gran hallazgo del estudio: ¿qué IA se nos parece más? Cuando los investigadores compararon los tres algoritmos, descubrieron que los modelos LLaMA reflejan la actividad neural humana de forma mucho más fiel que BERT. El motivo es su arquitectura, no tanto su potencia.
LLaMA es autorregresivo: predice la siguiente palabra basándose solo en el contexto previo, de izquierda a derecha, igual que hace el cerebro humano cuando escucha una conversación en tiempo real. BERT, en cambio, fue entrenado con acceso bidireccional al contexto (ve la palabra anterior y la siguiente simultáneamente) lo que lo hace potente para ciertas tareas pero lo aleja del modo en que el cerebro construye predicciones durante la escucha.
Hay además una paradoja de escala: el modelo LLaMA, de 1.000 millones de parámetros, se ajusta mejor a los datos neurales que el de 3.000 millones. Los autores sugieren que el modelo más grande genera predicciones más granulares o distribuidas que ya no se corresponden tan directamente con las expectativas humanas en condiciones naturales.
Qué significa esto más allá del laboratorio
El hallazgo tiene al menos tres implicaciones que merece la pena destacar.
Primera: saca del terreno puramente teórico al predictive coding (la codificación predictiva) y lo demuestra como un mecanismo biológico medible en el lenguaje. Según esta teoría, no somos receptores pasivos que procesan la información según llega. Nuestro cerebro funciona como una máquina de predicción: fabrica constantemente un "borrador" de lo que vamos a escuchar. Si la palabra encaja en ese borrador, el cerebro simplemente confirma su hipótesis y ahorra energía. Si la palabra es inesperada, se produce lo que en neurociencia se llama un "error de predicción": el sistema se ve obligado a trabajar más intensamente para entender esa sorpresa y recalibrar su modelo del mundo.
Segunda: nos enfrenta a un fenómeno de convergencia entre biología y código. Los creadores de los grandes modelos de lenguaje no intentaban replicar la mente humana; solo querían un algoritmo matemáticamente eficiente para adivinar la siguiente palabra de un texto. Sin embargo, al optimizarlos con cantidades masivas de datos, estos sistemas han desarrollado espontáneamente dinámicas de procesamiento que reflejan nuestra propia actividad cerebral. Esto no significa en absoluto que la IA "sienta" o "piense", sino que, para resolver el problema de la fluidez del lenguaje, tanto millones de años de evolución biológica como la ingeniería de software moderna han terminado encontrando una solución estructural muy parecida.
Tercera: inaugura una forma completamente nueva de guiar el desarrollo de la inteligencia artificial. Hasta ahora, el éxito de un modelo se medía casi exclusivamente por su rendimiento en exámenes estandarizados (benchmarks) o por lo convincente que resultaba al conversar. Este estudio demuestra que ya disponemos de una métrica biológica y neurofisiológica. Si podemos medir empíricamente qué arquitecturas se alinean mejor con las ondas cerebrales (como ha ocurrido en este experimento, donde el diseño secuencial de LLaMA encajó mejor que el bidireccional de BERT), podemos usar el cerebro humano (el sistema más eficiente y de menor consumo energético que conocemos) como plano maestro para construir algoritmos más naturales y optimizados.
Una frontera que se estrecha
Todas estas implicaciones apuntan en una misma dirección. La distancia entre la biología y el algoritmo siempre nos ha parecido infranqueable porque, históricamente, la estábamos comparando en el nivel equivocado. El debate real no consiste en si las redes neuronales artificiales son iguales a nuestras neuronas de carbono y potasio, porque sabemos que no lo son. El verdadero debate consiste en si los principios computacionales que ambas estructuras utilizan para procesar la realidad son convergentes.
Este estudio dice que, al menos en la predicción del lenguaje, sí lo son. Y lo respalda con EEG, MEG, 29 participantes, tres modelos y un audiolibro de ciencia ficción. Con este resultado, el paralelismo entre las redes neuronales artificiales y el cerebro humano se convierte en una señal eléctrica y magnética registrada en un laboratorio. Por lo tanto, hemos dejado de imaginar cómo piensa la máquina para empezar a medir, milisegundo a milisegundo, cómo su matemática se superpone a nuestra propia biología.
____________
Referencia
The predictive brain: Neural correlates of word expectancy align with large language model prediction probabilities. Kölbl et al, NeuroImage, 334, 121966. (2026). DOI:https://doi.org/10.1016/j.neuroimage.2026.121966
________
Fuente:
