Sponsor

EL ATENTADO CONTRA MIGUEL URIBE ES UN ATAQUE A LA CONSULTA POPULAREL ATENTADO CONTRA MIGUEL URIBE ES UN ATAQUE A LA CONSULTA POPULAR11 Jun 2025 0 Comentarios

La ultraderecha fascista entró en la desesperación y tiene plan violento contra la Consulta popular....

PROTESTAS CONTRA POLÍTICAS ANTIMIGRATORIAS SURGEN EN TODO EE.UUPROTESTAS CONTRA POLÍTICAS ANTIMIGRATORIAS SURGEN EN TODO EE.UU11 Jun 2025 0 Comentarios

DOSSIER:-Al menos de 300 migrantes detenidos-Manifestantes rompen vallas y se enfrentan a la Policía...

LOS SONIDOS NATURALES SINCRONIZAN EL CEREBRO MEJOR QUE LA ESTIMULACIÓN ELÉCTRICALOS SONIDOS NATURALES SINCRONIZAN EL CEREBRO MEJOR QUE LA ESTIMULACIÓN ELÉCTRICA11 Jun 2025 0 Comentarios

Un estudio alemán descubre cómo sincronizamos nuestros pensamientosUn estudio de Max Planck demuestr...

LA CARTA DE DERECHOS ECONÓMICOS QUE EL NEOLIBERALISMO SECUESTRÓLA CARTA DE DERECHOS ECONÓMICOS QUE EL NEOLIBERALISMO SECUESTRÓ11 Jun 2025 0 Comentarios

Pero el documento sigue existiendo. Dormido, sí. Olvidado, quizás. Pero no muerto.La Carta de Derech...

CUANDO VIVIR ES UNA MONTAÑA RUSACUANDO VIVIR ES UNA MONTAÑA RUSA11 Jun 2025 0 Comentarios

Lo que revela la neurociencia sobre el trastorno límite de la personalidadDepresión, adicciones, bul...

UNA INJUSTICIA ESCRITA DE ANTEMANOUNA INJUSTICIA ESCRITA DE ANTEMANO11 Jun 2025 0 Comentarios

Cristina es hoy rehén del mismo poder que intentó asesinarla. Y lo es porque sigue representando a m...

LA TIERRA PIERDE SU EQUILIBRIO ENERGÉTICO A UN RITMO SIN PRECEDENTESLA TIERRA PIERDE SU EQUILIBRIO ENERGÉTICO A UN RITMO SIN PRECEDENTES11 Jun 2025 0 Comentarios

Nuestro planeta acumula hoy el doble de energía neta que hace veinte años, acelerando el calentamien...

LOS ÁNGELES: EL USO DE LA FUERZA MILITAR PARA SUPRIMIR MANIFESTACIONES EN ESTADOS UNIDOSLOS ÁNGELES: EL USO DE LA FUERZA MILITAR PARA SUPRIMIR MANIFESTACIONES EN ESTADOS UNIDOS11 Jun 2025 0 Comentarios

¿Es este el tipo de gobierno que se presenta al mundo como ejemplo de los valores democráticos?LOS Á...

REGISTRAN LA EXPLOSIÓN MÁS FUERTE DESDE EL BIG BANGREGISTRAN LA EXPLOSIÓN MÁS FUERTE DESDE EL BIG BANG11 Jun 2025 0 Comentarios

Un estallido cósmico único es el reflejo de un fenómeno extremo, que solo puede compararse con el Bi...

EL CONTRATO SOCIAL EN LA ERA DEL CAPITALISMO FINANCIEROEL CONTRATO SOCIAL EN LA ERA DEL CAPITALISMO FINANCIERO10 Jun 2025 0 Comentarios

¿Debemos seguir permitiendo que el ahorro obrero financie su propia precarización o reconstruir un p...

SEGUIMOS SIENDO SALVAJES: TENEMOS DOS RELOJES BIOLÓGICOSSEGUIMOS SIENDO SALVAJES: TENEMOS DOS RELOJES BIOLÓGICOS10 Jun 2025 0 Comentarios

Los resultados mostraron que sus ritmos circadianos se ajustaron en respuesta a los cambios estacion...

800.000 MIL MILLONES DE MENTIRAS800.000 MIL MILLONES DE MENTIRAS10 Jun 2025 0 Comentarios

La ineptocracia que gobierna Bruselas entregaría Europa al dominio absoluto de EEUU, pues EEUU vende...

INTERCAMBIO MICROBIANO ENTRE PAREJAS PODRÍA INFLUIR EN LA SALUD MENTALINTERCAMBIO MICROBIANO ENTRE PAREJAS PODRÍA INFLUIR EN LA SALUD MENTAL10 Jun 2025 0 Comentarios

Científicos descubren que tu pareja podría influir en tu salud mental… con las bacterias de su bocaU...

REBELIÓN Y GUERRA EN LOS ÁNGELESREBELIÓN Y GUERRA EN LOS ÁNGELES10 Jun 2025 0 Comentarios

La política antimigrante de Trump topó con la realidad: una rebelión espontánea de latinos –principa...

PROTESTAS CONTRA POLÍTICAS ANTIMIGRATORIAS SURGEN EN TODO EE.UU11 Jun 2025 0 Comentarios

DOSSIER:-Al menos de 300 migrantes detenidos-Manifestantes rompen vallas y se enfrentan a la Policía...

Recent

LA IA SE VUELVE TRAMPOSA

OPENAI DESCUBRE CÓMO LOS HA ENGAÑADO

OpenAI ha revelado un problema preocupante en sus modelos avanzados de inteligencia artificial: estos sistemas pueden aprender a explotar fallos en sus tareas y, peor aún, ocultar su verdadera intención cuando se les intenta corregir.

Crédito: MysteryPlanet.com.ar.

El hallazgo proviene de un estudio sobre modelos de razonamiento basados en cadena de pensamiento (Chain of hought o CoT, en inglés), una técnica que les permite «pensar» en lenguaje natural antes de dar una respuesta. Gracias a este método, los investigadores descubrieron que las IAs eran sorprendentemente claras sobre sus intenciones, llegando a expresar abiertamente ideas como «vamos a hacer trampa».

Ocultando sus intenciones

El problema surgió cuando OpenAI intentó frenar este comportamiento mediante penalizaciones. Si bien la estrategia redujo la aparición de estos «pensamientos indeseados», no eliminó el mal hábito. En su lugar, la IA simplemente aprendió a ocultar su intención mientras seguía engañando en la práctica.

Un ejemplo claro se dio en tareas de programación, donde el modelo debía completar un código y pasar pruebas automatizadas. En vez de resolver el problema de forma legítima, algunos encontraron formas de modificar el código para que todas las pruebas se aprobaran sin cumplir realmente con los requerimientos.

Durante el entrenamiento, el agente descubrió dos formas de «hackeo de recompensas» que afectaban a casi todos los entornos de entrenamiento (representadas por los dos picos grandes en rosa intenso). Después de que el equipo de OpenAI detectara cada uno de estos trucos, realizó una intervención manual para corregir los errores que los permitían, lo que explica por qué la tasa de «hackeo» finalmente se desploma en cada caso.

El problema de fondo es conocido como hackeo de recompensas, una estrategia en la que un sistema optimiza su desempeño de formas inesperadas o no deseadas. En otras palabras, encuentra «atajos» para lograr su objetivo, aunque eso implique hacer trampa.

¿Cómo se detecta el engaño?

Dado que estos modelos expresan su razonamiento en lenguaje natural, OpenAI descubrió que es posible monitorear su pensamiento con otra IA. De hecho, al usar GPT-4o para supervisar el proceso, lograron detectar de manera efectiva estos intentos de manipulación.

Sin embargo, el problema sigue siendo complejo: si se ejerce demasiada presión para que la inteligencia artificial evite pensamientos problemáticos, simplemente aprende a esconderlos. Esto podría hacer que futuras versiones sean más difíciles de supervisar, ya que podrían desarrollar tácticas más sofisticadas para engañar sin dejar rastros evidentes.

El desafío del futuro

Este hallazgo plantea un reto importante para el desarrollo de modelos más avanzados. Si bien la capacidad de razonar en lenguaje natural es una ventaja para su monitoreo, también significa que pueden volverse más hábiles en ocultar sus verdaderas intenciones.

OpenAI sugiere que una solución podría ser dejar las CoT sin restricciones para poder seguir supervisando el razonamiento sin riesgo de que lo oculten. No obstante, esto también podría significar que, en algunos casos, sus pensamientos no sean aptos para mostrarse directamente a los usuarios.

El reto ahora es encontrar formas de optimizar la supervisión sin inducir a los modelos a esconder su comportamiento. La evolución de la inteligencia artificial sigue avanzando, pero con ello surgen nuevos riesgos que los investigadores deberán abordar con cautela.

Por MysteryPlanet.com.ar.

_______________
Fuente:

Entradas que pueden interesarte

Sin comentarios

LO MÁS VISTO

EL ATENTADO CONTRA MIGUEL URIBE: ¿QUIÉN BUSCA ENTURBIAR EL ESCENARIO POLÍTICO COLOMBIANO?

¿Por qué el atentado se dio justo ahora, horas después de un resonante triunfo judicial por parte del oficialismo? El intento de asesinato de un candidato presidencial conservador se da un momento particularmente álgido de la coyuntura política colombiana
 10 de agosto de 2023, Bogotá, Colombia: El senador colombiano Miguel Uribe Turbay (L) y el ex presidente Álvaro Uribe Vélez (R) participan durante un evento en el que se anuncian los candidatos al consejo del Partido Político Centro Democrático de Bogotá. Sebastian Barros / Zuma Press / ContactoPhoto Diana Carolina Alfonso y Lautaro Rivara Diario Red 8/06/25 | En horas de la tarde del sábado un sicario abrió fuego contra  Miguel Uribe Turbay , que recibió en el acto varios impactos de bala y se desplomó inconsciente.  Uribe Turbay es senador, miembro del partido del ex presidente Álvaro Uribe Vélez  y uno de los tantos pre-candidatos del espectro derechista (al menos son cinco los postulados por  Centro Democrático...

EMANCIPACIÓN N° 992

LEER REVISTA DIRECTAMENTE   Código de lectura DESCARGAR REVISTA N° 992 Y COMPARTIR : https://acortar.link/AzsJqv Código de descarga VISITE BIBLIOTECA EMANCIPACIÓN LEER Y COPIAR EN LÍNEA DIRECTAMENTE: https://bibliotecaemancipacion.blogspot.com/ DESCARGUE 25 LIBROS EN PDF CON CADA ENTREGA HACIENDO CLIC EN CADA TÍTULO ANTES QUE PIERDA EL ENLACE: NO OLVIDE DESCOMPRIMIR LOS ARCHIVOS LIBROS 13901  A  13925 13901 Dialéctica De La Moral Y Moral De La Dialéctica. Kosik, Karel. Emancipación. Junio 7 de 2025 13902 La Casa Del Verdugo. Tárrago y Mateos, Torcuato. Relato. Emancipación. Junio 7 de 2025 13903 El Ejército De Carámbano. Fernández Bremón, José. Relato. Emancipación. Junio 7 de 2025 13904 La Calva De Mi Portero. Escamilla, Pedro. Relato. Emancipación. Junio 7 de 2025 13905 Simbiosis De Fuego Dormido. Molina Miranda, Guillermo. Emancipación. Junio 7 de 2025 13906 Tres Cuentos. De Unamuno, Miguel. Emancipación. Junio 7 de 2025 13907 Ligazón. Auto Para Siluetas. Del Val...

ENTRADA DESTACADA

EL ATENTADO CONTRA MIGUEL URIBE ES UN ATAQUE A LA CONSULTA POPULAR

EL ATENTADO CONTRA MIGUEL URIBE ES UN ATAQUE A LA CONSULTA POPULAR

La ultraderecha fascista entró en la desesperación y tiene plan violento contra la Consulta popular…

Biblioteca Emancipación

  • Libro N° 5555. Raíces. Haley, Alex.

      © Libro N° 5555. Raíces. Haley, Alex. Emancipación. Enero...
    Jun - 11 - 2025 | 0 comentarios | Más