Sponsor

Recent

LA IA SE VUELVE TRAMPOSA

OPENAI DESCUBRE CÓMO LOS HA ENGAÑADO

OpenAI ha revelado un problema preocupante en sus modelos avanzados de inteligencia artificial: estos sistemas pueden aprender a explotar fallos en sus tareas y, peor aún, ocultar su verdadera intención cuando se les intenta corregir.

Crédito: MysteryPlanet.com.ar.

El hallazgo proviene de un estudio sobre modelos de razonamiento basados en cadena de pensamiento (Chain of hought o CoT, en inglés), una técnica que les permite «pensar» en lenguaje natural antes de dar una respuesta. Gracias a este método, los investigadores descubrieron que las IAs eran sorprendentemente claras sobre sus intenciones, llegando a expresar abiertamente ideas como «vamos a hacer trampa».

Ocultando sus intenciones

El problema surgió cuando OpenAI intentó frenar este comportamiento mediante penalizaciones. Si bien la estrategia redujo la aparición de estos «pensamientos indeseados», no eliminó el mal hábito. En su lugar, la IA simplemente aprendió a ocultar su intención mientras seguía engañando en la práctica.

Un ejemplo claro se dio en tareas de programación, donde el modelo debía completar un código y pasar pruebas automatizadas. En vez de resolver el problema de forma legítima, algunos encontraron formas de modificar el código para que todas las pruebas se aprobaran sin cumplir realmente con los requerimientos.

Durante el entrenamiento, el agente descubrió dos formas de «hackeo de recompensas» que afectaban a casi todos los entornos de entrenamiento (representadas por los dos picos grandes en rosa intenso). Después de que el equipo de OpenAI detectara cada uno de estos trucos, realizó una intervención manual para corregir los errores que los permitían, lo que explica por qué la tasa de «hackeo» finalmente se desploma en cada caso.

El problema de fondo es conocido como hackeo de recompensas, una estrategia en la que un sistema optimiza su desempeño de formas inesperadas o no deseadas. En otras palabras, encuentra «atajos» para lograr su objetivo, aunque eso implique hacer trampa.

¿Cómo se detecta el engaño?

Dado que estos modelos expresan su razonamiento en lenguaje natural, OpenAI descubrió que es posible monitorear su pensamiento con otra IA. De hecho, al usar GPT-4o para supervisar el proceso, lograron detectar de manera efectiva estos intentos de manipulación.

Sin embargo, el problema sigue siendo complejo: si se ejerce demasiada presión para que la inteligencia artificial evite pensamientos problemáticos, simplemente aprende a esconderlos. Esto podría hacer que futuras versiones sean más difíciles de supervisar, ya que podrían desarrollar tácticas más sofisticadas para engañar sin dejar rastros evidentes.

El desafío del futuro

Este hallazgo plantea un reto importante para el desarrollo de modelos más avanzados. Si bien la capacidad de razonar en lenguaje natural es una ventaja para su monitoreo, también significa que pueden volverse más hábiles en ocultar sus verdaderas intenciones.

OpenAI sugiere que una solución podría ser dejar las CoT sin restricciones para poder seguir supervisando el razonamiento sin riesgo de que lo oculten. No obstante, esto también podría significar que, en algunos casos, sus pensamientos no sean aptos para mostrarse directamente a los usuarios.

El reto ahora es encontrar formas de optimizar la supervisión sin inducir a los modelos a esconder su comportamiento. La evolución de la inteligencia artificial sigue avanzando, pero con ello surgen nuevos riesgos que los investigadores deberán abordar con cautela.

Por MysteryPlanet.com.ar.

_______________
Fuente:

Entradas que pueden interesarte

Sin comentarios

LO MÁS VISTO

COP30: NUEVA OPORTUNIDAD PARA UN MUNDO EN CRISIS

Las naciones y sus gobiernos tienen una nueva oportunidad para comprometerse efectivamente a la adopción de medidas ya no paliativas, sino integrales que propicien condiciones para una efectiva transición energética, una cooperación internacional justa  Mario Patrón jornada.com.mx 13/11/2025 El pasado lunes 10 de noviembre dio inicio la 30 Conferencia de Naciones Unidas sobre Cambio Climático (COP30) en la ciudad de Belém, Brasil, con la presencia de representantes de más de 190 países. Como ocurre en cada edición, la mirada del mundo –especialmente de activistas climáticos y defensores del territorio– se enfoca en esta reunión diplomática que año con año despierta expectativas que poco se traducen en resultados. Esta edición número 30 se lleva a cabo en un panorama internacional complejizado por las posturas de diversos líderes mundiales, principalmente Donald Trump, quienes no sólo han dado la espalda a los compromisos medioambientales previamente asumidos por sus naciones, sino ...

INQUIETUD EN EL CARIBE

EL CARIBE SE ENFRENTA A DOS OPCIONES: UNIRSE AL INTENTO DE LOS ESTADOS UNIDOS DE INTIMIDAR A VENEZUELA O CONSTRUIR SU PROPIA SOBERANÍA Vijay Prashad elviejotopo.com 2 diciembre, 2025  El presidente de los Estados Unidos, Donald Trump, ha autorizado la entrada del USS Gerald R. Ford en el Caribe. Ahora se encuentra al norte de Puerto Rico, uniéndose al USS Iwo Jima y a otros activos de la Armada de los Estados Unidos para amenazar a Venezuela con un ataque. La tensión es alta en el Caribe, con diversas teorías sobre la posibilidad de lo que parece ser un asalto inevitable por parte de los Estados Unidos y sobre la catástrofe social que tal ataque ocasionaría. La CARICOM, el organismo regional de los países del Caribe, emitió un comunicado en el que afirmaba su opinión de que la región debe ser una “zona de paz” y que las disputas deben resolverse de forma pacífica. Diez exjefes de Gobierno de los Estados del Caribe publicaron una carta en la que exigían que “nuestra región n...

EMANCIPACIÓN N° 1015

LEER REVISTA N° 1015 DIRECTAMENTE Leer en Línea:  https://n9.cl/iht3a5 DESCARGAR REVISTA 1015 :  https://n9.cl/pi0mf VISITE BIBLIOTECA EMANCIPACIÓN LEER Y COPIAR EN LÍNEA DIRECTAMENTE: https://bibliotecaemancipacion.blogspot.com/ DESCARGUE 25 LIBROS EN PDF CON CADA ENTREGA HACIENDO CLIC EN CADA TÍTULO ANTES QUE PIERDA EL ENLACE NO OLVIDE DESCOMPRIMIR LOS ARCHIVOS LIBROS  14476  A  14500  14476 El Rostro Del ‘Estado Profundo’ Y Blackrock. Salazar Pérez, Robinson. Emancipación. Noviembre 15 de 2025 14477 El Tercer Ayudante. Símonov, Konstantin M. Emancipación. Noviembre 15 de 2025 14478 Pietri. Grin, Elmar. Emancipación. Noviembre 15 de 2025 14479 El Peso De Los Caídos. Platonov, Andréi. Emancipación. Noviembre 15 de 2025 14480 Los Cuchillos. Petróvich Katáiev, Valentin. Emancipación. Noviembre 15 de 2025 14481 Por Todo Lo Grande. Ilf, Iliá Y Petrov, Evgueni. Emancipación. Noviembre 15 de 2025 14482 Un Conocido. Karaváieva, Ana Alexándrovna. Emancipació...

EMANCIPACIÓN N° 1016

LEER REVISTA N° 1016 DIRECTAMENTE Leer en Línea :  https://n9.cl/qcq56 *** DESCARGAR REVISTA 1016:   https://n9.cl/axoh5 VISITE BIBLIOTECA EMANCIPACIÓN LEER Y COPIAR EN LÍNEA DIRECTAMENTE: https://bibliotecaemancipacion.blogspot.com/ DESCARGUE 25 LIBROS EN PDF CON CADA ENTREGA HACIENDO CLIC EN CADA TÍTULO ANTES QUE PIERDA EL ENLACE NO OLVIDE DESCOMPRIMIR LOS ARCHIVOS LIBROS 14501  A  14525 14501 En Peligro En El Mar. Hainsselin, Montague T. Emancipación. Noviembre 22 de 2025 14502 Vida De John Brown. Gold, Michael. Emancipación. Noviembre 22 de 2025 14503 En Torno Al Carácter Específico De La Literatura. Nikolaieva, Galina. Emancipación. Noviembre 22 de 2025 14504 El Método Orteguiano De Las Generaciones Y Las Leyes Objetivas Del Desarrollo Histórico. Federico Sánchez [Jorge Semprún Maura]. Emancipación. Noviembre 22 de 2025 14505 El Mundo Hundido. Coblentz, Stanton A. Emancipación. Noviembre 22 de 2025 14506 Papeles De Política 1999-2025. Pérez Pirela, Miguel Á...

CONTUNDENTE RECHAZO EN ECUADOR A INSTALAR BASES MILITARES EXTRANJERAS

Referendo y consulta popular tiran propuestas de Daniel Noboa. Entre ellas, cambiar la Carta Magna y reducir asambleístas. Revés no sólo para el presidente, sino también para EU: analistas    Participación ciudadana de 80%; jornada transcurrió en orden, resaltan Orlando Pérez jornada.com.mx 17/11/2025 Gana el No en referendo en Ecuador; rechazan base militar de Estados Unidos ▲ La participación en el referendo ecuatoriano fue de 80 por ciento. En la imagen, una casilla en Quito.Foto Ap Quito. El electorado ecuatoriano rechazó de forma abrumadora este domingo en un referendo y consulta popular las cuatro propuestas impulsadas por el presidente, Daniel Noboa, entre ellas las de establecer bases militares extranjeras y cambiar la Constitución actual. Tras conocer los resultados, el mandatario andino aceptó la derrota: “respetamos la voluntad del pueblo ecuatoriano. Seguiremos luchando sin descanso por el país que ustedes merecen, con las herramientas que tenemos”, señaló en su cu...

ENTRADA DESTACADA

EL DÓLAR, LOS BRICS Y EL NUEVO SISTEMA FINANCIERO POR CONSTRUIR

EL DÓLAR, LOS BRICS Y EL NUEVO SISTEMA FINANCIERO POR CONSTRUIR

El avance de la desdolarización y la incertidumbre de los mercados occidentales han creado una situ…

Biblioteca Emancipación