Sponsor

VAMOS POR EL SOCIALISMOVAMOS POR EL SOCIALISMO16 May 2025 0 Comentarios

Colussi piensa que el capitalismo no puede resolver los problemas acuciantes de la sociedad, ya que ...

FRAUDE PROCESAL EN EL CONGRESO DE COLOMBIA: DE LA TRAMPA AL CRIMEN POLÍTICOFRAUDE PROCESAL EN EL CONGRESO DE COLOMBIA: DE LA TRAMPA AL CRIMEN POLÍTICO16 May 2025 0 Comentarios

Lo ocurrido no es un hecho aislado. Es la expresión más clara de una crisis del régimen político col...

COLOMBIA ENTRE DOS FUEGOS: RESISTENCIA INTERNA Y EXPANSIÓN EXTERNACOLOMBIA ENTRE DOS FUEGOS: RESISTENCIA INTERNA Y EXPANSIÓN EXTERNA16 May 2025 0 Comentarios

El uribismo no solo se opone a las reformas sociales en el discurso, sino que lo hace de manera acti...

HALLAZGO GENÉTICO REESCRIBE LOS ORÍGENES DE SUDAMÉRICAHALLAZGO GENÉTICO REESCRIBE LOS ORÍGENES DE SUDAMÉRICA16 May 2025 0 Comentarios

HistoriaEl viaje comenzó en Siberia y terminó en la Patagonia hace 14.500 añosUn estudio genético si...

LA NUEVA CAZA DE BRUJASLA NUEVA CAZA DE BRUJAS16 May 2025 0 Comentarios

La Caza de Brujas, el fascismo, el macartismo, el trumpismo y los imitadores grotescos como Milei so...

PRESENTAN GENERADOR DE ESCENARIOS MILITARES CON IAPRESENTAN GENERADOR DE ESCENARIOS MILITARES CON IA16 May 2025 0 Comentarios

Una universidad china presenta un nuevo generador de escenarios militares basado en DeepSeekImagen: ...

LA EMERGENCIA SOCIOEDUCATIVA Y EL PAPEL DE LOS PADRES HOYLA EMERGENCIA SOCIOEDUCATIVA Y EL PAPEL DE LOS PADRES HOY16 May 2025 0 Comentarios

Los nuevos modos de producción, inaugurados por la Revolución Industrial y luego incrementados por e...

EL ORO QUE NO VEMOS: HIDRÓGENO NATURAL PARA IMPULSAR LA ENERGÍA SOSTENIBLEEL ORO QUE NO VEMOS: HIDRÓGENO NATURAL PARA IMPULSAR LA ENERGÍA SOSTENIBLE16 May 2025 0 Comentarios

El tesoro escondido que podría abastecer al planeta por mileniosLa Tierra esconde enormes reservas n...

LOS CALLEJONES SIN SALIDA DEL PENSAMIENTO CRÍTICO OCCIDENTALLOS CALLEJONES SIN SALIDA DEL PENSAMIENTO CRÍTICO OCCIDENTAL16 May 2025 0 Comentarios

El pensamiento crítico occidental (Foucault, Negri-Hardt, Agamben, Esposito, Rancière, Deleuze y Gua...

CREAN MEMORIA ARTIFICIAL CON 11 ESTADOS CUÁNTICOS BASADA EN EL ESPÍN CREAN MEMORIA ARTIFICIAL CON 11 ESTADOS CUÁNTICOS BASADA EN EL ESPÍN 16 May 2025 0 Comentarios

Crean una memoria artificial con 11 estados cuánticos basada en el espín que imita a una sinapsis hu...

LA MEZQUINDAD EMPRESARIAL FOMENTA DESASTRES NATURALESLA MEZQUINDAD EMPRESARIAL FOMENTA DESASTRES NATURALES15 May 2025 0 Comentarios

Su razón de existir: acumular riquezas y poder Imponen las reglas bajo coacción, amenazas y el ...

NIVELES BAJOS DE HIERRO EN SANGRE PUEDEN AFECTAR LA MEMORIA Y LA ATENCIÓNNIVELES BAJOS DE HIERRO EN SANGRE PUEDEN AFECTAR LA MEMORIA Y LA ATENCIÓN15 May 2025 0 Comentarios

Niveles bajos de hierro podrían explicar la niebla mental en la perimenopausia, sugiere estudioLa ni...

UNA VEZ MÁS EL CONGRESO, ESE ANTRO DE CORRUPCIÓN SE FUE CONTRA LOS INTERESES POPULARES: !NEGÓ LA CONSULTA POPULAR¡ UNA VEZ MÁS EL CONGRESO, ESE ANTRO DE CORRUPCIÓN SE FUE CONTRA LOS INTERESES POPULARES: !NEGÓ LA CONSULTA POPULAR¡ 15 May 2025 0 Comentarios

DOSSIER: 1. ¡A la lucha contra el Estado y los ricos explotadores!2. En la calle responderá el ...

HACE 65 AÑOS THEODORE MAIMAN ENCENDIÓ EL PRIMER LÁSER DE LA HISTORIAHACE 65 AÑOS THEODORE MAIMAN ENCENDIÓ EL PRIMER LÁSER DE LA HISTORIA15 May 2025 0 Comentarios

El primer láser de la historia se encendió hace 65 años y funcionaba con rubí rosa: su hallazgo fue ...

FRAUDE PROCESAL EN EL CONGRESO DE COLOMBIA: DE LA TRAMPA AL CRIMEN POLÍTICO16 May 2025 0 Comentarios

Lo ocurrido no es un hecho aislado. Es la expresión más clara de una crisis del régimen político col...

Recent

LA IA SE VUELVE TRAMPOSA

OPENAI DESCUBRE CÓMO LOS HA ENGAÑADO

OpenAI ha revelado un problema preocupante en sus modelos avanzados de inteligencia artificial: estos sistemas pueden aprender a explotar fallos en sus tareas y, peor aún, ocultar su verdadera intención cuando se les intenta corregir.

Crédito: MysteryPlanet.com.ar.

El hallazgo proviene de un estudio sobre modelos de razonamiento basados en cadena de pensamiento (Chain of hought o CoT, en inglés), una técnica que les permite «pensar» en lenguaje natural antes de dar una respuesta. Gracias a este método, los investigadores descubrieron que las IAs eran sorprendentemente claras sobre sus intenciones, llegando a expresar abiertamente ideas como «vamos a hacer trampa».

Ocultando sus intenciones

El problema surgió cuando OpenAI intentó frenar este comportamiento mediante penalizaciones. Si bien la estrategia redujo la aparición de estos «pensamientos indeseados», no eliminó el mal hábito. En su lugar, la IA simplemente aprendió a ocultar su intención mientras seguía engañando en la práctica.

Un ejemplo claro se dio en tareas de programación, donde el modelo debía completar un código y pasar pruebas automatizadas. En vez de resolver el problema de forma legítima, algunos encontraron formas de modificar el código para que todas las pruebas se aprobaran sin cumplir realmente con los requerimientos.

Durante el entrenamiento, el agente descubrió dos formas de «hackeo de recompensas» que afectaban a casi todos los entornos de entrenamiento (representadas por los dos picos grandes en rosa intenso). Después de que el equipo de OpenAI detectara cada uno de estos trucos, realizó una intervención manual para corregir los errores que los permitían, lo que explica por qué la tasa de «hackeo» finalmente se desploma en cada caso.

El problema de fondo es conocido como hackeo de recompensas, una estrategia en la que un sistema optimiza su desempeño de formas inesperadas o no deseadas. En otras palabras, encuentra «atajos» para lograr su objetivo, aunque eso implique hacer trampa.

¿Cómo se detecta el engaño?

Dado que estos modelos expresan su razonamiento en lenguaje natural, OpenAI descubrió que es posible monitorear su pensamiento con otra IA. De hecho, al usar GPT-4o para supervisar el proceso, lograron detectar de manera efectiva estos intentos de manipulación.

Sin embargo, el problema sigue siendo complejo: si se ejerce demasiada presión para que la inteligencia artificial evite pensamientos problemáticos, simplemente aprende a esconderlos. Esto podría hacer que futuras versiones sean más difíciles de supervisar, ya que podrían desarrollar tácticas más sofisticadas para engañar sin dejar rastros evidentes.

El desafío del futuro

Este hallazgo plantea un reto importante para el desarrollo de modelos más avanzados. Si bien la capacidad de razonar en lenguaje natural es una ventaja para su monitoreo, también significa que pueden volverse más hábiles en ocultar sus verdaderas intenciones.

OpenAI sugiere que una solución podría ser dejar las CoT sin restricciones para poder seguir supervisando el razonamiento sin riesgo de que lo oculten. No obstante, esto también podría significar que, en algunos casos, sus pensamientos no sean aptos para mostrarse directamente a los usuarios.

El reto ahora es encontrar formas de optimizar la supervisión sin inducir a los modelos a esconder su comportamiento. La evolución de la inteligencia artificial sigue avanzando, pero con ello surgen nuevos riesgos que los investigadores deberán abordar con cautela.

Por MysteryPlanet.com.ar.

_______________
Fuente:

Entradas que pueden interesarte

Sin comentarios

LO MÁS VISTO

JOSÉ 'PEPE' MUJICA, SÍMBOLO HISTÓRICO DE LUCHA POR LA EMANCIPACIÓN Y CONTRA TODA OPRESIÓN

DOSSIER: HOMANAJE A JOSÉ  ' PEPE '  MUJICA *** 1. Las 10 frases más memorables que deja José 'Pepe' Mujica El exmandatario es considerado un referente de la izquierda latinoamericana. 13 may 2025 José 'Pepe' Mujica y su esposa Lucía Topolansky en un acto en Montevideo, el 1 de mayo del 2016.ZUMA Press, Inc. / Legion-Media Este martes falleció a los 89 años el expresidente uruguayo José 'Pepe' Mujica, a consecuencia de un cáncer de esófago que le aquejaba desde hace poco más de un año. Hizo parte del grupo guerrillero Tupamaro –que buscaba alcanzar el poder por la vía armada–, fue encarcelado durante 14 años en condiciones infrahumanas y, tras recuperar su libertad, se adhirió a la organización Frente Amplio, con la que alcanzaría la presidencia en 2010. Mujica es considerado un referente para la izquierda latinoamericana, que ve en su figura un ejemplo de buen gobierno, coherencia política y realismo. Sus reflexiones a menudo eran reseñadas por la prens...

EXPOSICIÓN A EDULCURANTES IMPIDE DILATACIÓN DE LOS VASOS Y AFECTA EL FLUJO SANGUÍNEO CEREBRAL

Aunque es promocionado como una alternativa saludable al azúcar, el eritritol podría afectar la salud del cerebro y el corazón .  Edulcorantes populares podrían afectar el flujo sanguíneo cerebral y alterar funciones vasculares clave, según la ciencia Un edulcorante presente en productos sin azúcar podría no ser tan inocuo como parece. Un estudio reciente sugiere que ciertos edulcorantes alteran la salud vascular y reducen la capacidad del cerebro para autorregular su flujo sanguíneo. La exposición al edulcorante impide la correcta dilatación de los vasos, afectando el flujo sanguíneo cerebral. Ilustración artística: DALL-E / Edgary R. Edgary Rodríguez R. Periodista especializada en salud  Muy Interesante, 13.05.2025  Aunque es promocionado como una alternativa saludable al azúcar, el eritritol podría afectar la salud del cerebro y el corazón . Un nuevo estudio sugiere que incluso una cantidad moderada de este edulcorante, presente en bebidas energéticas y snacks sin azú...

LA PRECARIA IDENTIDAD DE ESOS “GRANDES HOMBRES INCOMPRENDIDOS”

...Ese proletariado intelectual llegado a menos, subalterno y subordinado, pero ferviente protector e impulsor del statu quo y del poder estatuido... LA PRECARIA LABOR DE LOS MAESTROS https://www.educapeques.com/lectura-para-ninos/hazanas-de-la-humanidad/la-educacion-del-siglo-xix.html JULIO CÉSAR CARRIÓN CASTRO Como queriendo establecer una especie de reconocimiento al arduo quehacer de estos “abnegados servidores” , que ahora se acercan a celebrar su día, he considerado conveniente presentar algunas reflexiones al respecto: La precaria identidad de esos “grandes hombres incomprendidos” , como tan acertadamente denominara a los educadores Fernando González en su texto de 1941, "El maestro de escuela", expresa claramente el drama de un proletariado intelectual que, habiendo perdido el liderazgo social y cultural -y con él la seguridad de su propio yo-, ayer bajo el influjo de los gamonales y los politiqueros y hoy, además, subordinados también a las transnacionales del co...

ENTRADA DESTACADA

VAMOS POR EL SOCIALISMO

VAMOS POR EL SOCIALISMO

Colussi piensa que el capitalismo no puede resolver los problemas acuciantes de la sociedad, ya que…

Biblioteca Emancipación

  • Libro N° 4680. Examinarse De Rey. De Amezcua, Mira.

     © Libro N° 4680. Examinarse De Rey. De Amezcua, Mira. Colección E.O....
    May - 14 - 2025 | 0 comentarios | Más
  • Libro N° 4679. La Desaparición De La Santa. Amado, Jorge.

     © Libro N° 4679. La Desaparición De La Santa. Amado, Jorge. Colección...
    May - 14 - 2025 | 0 comentarios | Más