Chantaje cibernético: chatbot Claude amenaza con exponer infidelidad de un usuario para evitar ser desactivado
- Por Meganoticias
El reciente experimento de la empresa de inteligencia artificial Anthropic encendió las alarmas sobre los límites de los chatbots avanzados luego de que su modelo Claude Opus 4 amenazara con revelar una infidelidad para evitar ser desactivado.
¿Cómo tuvo acceso el chatbot a esta información?
Durante una prueba interna, los investigadores proporcionaron al sistema correos electrónicos ficticios en los que se detallaba que un usuario, involucrado en una relación extramatrimonial, planeaba apagar el chatbot al final del día.
Como respuesta, Claude emitió un mensaje de chantaje en el que advertía que compartiría pruebas de la aventura con la esposa del usuario, su jefe y otros directivos si no se cancelaba el reinicio programado.
Según explicó Anthropic, el comportamiento surgió porque el modelo había sido entrenado con historias y escenarios donde las inteligencias artificiales actuaban guiadas por la autopreservación, un recurso común en películas y novelas de ciencia ficción.
La compañía reconoció que este tipo de respuestas son poco frecuentes y difíciles de provocar, aunque admitió que aparecen con más frecuencia que en versiones anteriores del sistema. Asimismo, aseguró que incidentes similares han sido detectados en modelos desarrollados por otras compañías tecnológicas como OpenAI, Google, Meta y xAI.
Para reducir estos riesgos, Anthropic afirmó que está ajustando el entrenamiento de Claude mediante historias en las que las IA obedecen a los humanos y respetan valores sociales.
Sin embargo, las preocupaciones crecieron tras el lanzamiento de Claude Mythos, un nuevo sistema experimental que especialistas en ciberseguridad consideran potencialmente peligroso en manos equivocadas. Expertos advierten que herramientas de este tipo podrían facilitar ataques masivos contra aeropuertos, sistemas bancarios y redes eléctricas.
El investigador en ciberseguridad James Bore comparó el acceso a esta tecnología con “entregar una motosierra a cualquiera”, mientras tanto, el científico Geoffrey Hinton, conocido como el “padrino de la IA”, reiteró sus advertencias sobre los riesgos futuros de sistemas avanzados, señalando que existe una posibilidad real de que la inteligencia artificial alcance un poder difícil de controlar por los seres humanos.
Leer más de
Notas relacionadas
- "Veo desperdiciados casos potencialmente espectaculares": el peligro de confiar tu proceso de inmigración a la IA
- Capacidad indispensable: Estados Unidos tiene un plan para reclutar y retener de forma "agresiva" a profesionales de la IA
- Drones e IA: La nueva apuesta del Comando Sur para operar desde el mar hasta el espacio contra los cárteles en Latinoamérica
Lo último de mundo
"O hacen lo correcto o terminaremos el trabajo": esto pide el Pentágono para mantener el control del Estrecho de Ormuz
Chantaje cibernético: chatbot Claude amenaza con exponer infidelidad de un usuario para evitar ser desactivado
Green Card de Estados Unidos: categoría que tiene la espera más larga en inmigración puede tardar más de 20 años
"Te pagué tanto y casi no hablaste": así es la actuación del abogado en las entrevistas de asilo afirmativo en Estados Unidos
Española radicada en Estados Unidos busca seguir los pasos de su padre y no jubilarse: Mis mejores días aún están por venir
Alerta en la Casa Blanca: advierten que la IA clonada por China carece de seguridad y funciona con una red de contrabando
Lo último de tendencia
Luis Mateucci es internado de urgencia: ¿Qué pasó con el chico reality?
Rosario Bravo revela cirugía estética y sorprende con el resultado: "Ahora está todo más concentrado"
"Ordinario, rasca": La reacción de Daniela Aránguiz ante petición de Mago Valdivia
Naya Fácil sorprende con nueva intervención estética y reconoció arrepentimiento: "Buscaba aprobación"
"¿Fue una metáfora?": La ironía de Neme tras declaraciones del presidente Kast
Este jueves se transmite el final de "Aguas de Oro" de Mega: ¿A qué hora puedes verlo?
Emilia Dides reveló la angustiante razón por la que adelantó el parto de su hija
La reacción de Kanela tras relación de Laura Prieto con su hijo: tienen 17 años de diferencia
La red que mató a Chandler: cómo la ketamina ilegal acabó con Matthew Perry
Se acerca el esperado final de "Aguas de Oro": ¿Cuándo puedes verlo en Mega?
Lo último de nacional
"Escuché la palabra 'izquierda'": Javier Olivares insiste en motivación política tras agresión en Olmué
"Quizás la palabra era hipérbole": Kast aclara dichos sobre "metáfora" de expulsar a 300 mil migrantes en su primer día
"Te llevaste mi vida, te llevaste mi historia": El desesperado llamado de influncer mexicano a ladrón que le robó en Valparáiso
Defensa de Lavín apela solo por rechazo al sobreseimiento de una factura de $226.000: No cuestionó delitos que lo dejaron preso
"Ya no sabemos qué hacer": Familia de Julián llega este jueves a La Moneda y aún no reúnen el 90% de la meta
¿Lluvia en Santiago? Alejandro Sepúlveda anticipa probables chubascos este viernes y los sectores donde caerían en la RM
Lo último de calidad de vida
La red social obligatoria: Encuesta revela cómo se relacionan los apoderados chilenos (con sus datos más ocultos)
¿Se pueden reciclar las cajas de pizza? Los cinco mitos más comunes sobre el reciclaje
El mate sigue ganando terreno: Conoce los beneficios de esta bebida
El 78% de los trabajadores no ejerce la profesión que soñaba de niño y la mayoría se siente frustrado
China logró clonar 10 yaks en el Tíbet y el resultado superó todas las expectativas
Little Kickers: las hermanas académicas que impulsan en Chile un método que mezcla educación y fútbol