Fable 5 y Mythos 5 siguen suspendidos: «La pelota está en el tejado de Anthropic»

Anthropic ha deshabilitado sus modelos de inteligencia artificial Fable 5 y Mythos 5 tras una orden del gobierno estadounidense por detectar una vulnerabilidad que permite un ‘jailbreak’ específico. La empresa rechaza la gravedad del problema y la situación abre el debate sobre la seguridad en IA y la intervención estatal.

El pasado viernes por la noche, Anthropic sorprendió al deshabilitar sus últimos modelos estrella, Fable 5 y Mythos 5, después de que el gobierno de Estados Unidos detectara un método para ejecutar un jailbreak específico sobre Fable 5 y emitiera una orden de control de exportación. Esta regulación afecta a todos los usuarios extranjeros, incluidos aquellos dentro del propio territorio estadounidense, lo que llevó a Anthropic a suspender ambos modelos para todos.

A día de hoy, no se conocen con exactitud los detalles técnicos de esta vulnerabilidad que permitió el jailbreak, pero desde Anthropic minimizan el alcance, calificándola como «vulnerabilidades menores, relativamente simples» y sin capacidad mayor que otros modelos de IA públicos.

Cuando Anthropic lanzó Fable 5 y Mythos 5, destacó que Fable 5 había pasado por rigurosos tests de seguridad en colaboración con institutos externos, como el AI Security Institute del Reino Unido. Según las propias pruebas internas de la compañía, el modelo completaba aproximadamente el 5 % de tareas cibernéticas adversariales.

Patrocinado

El documento técnico del modelo Fable 5 especifica que, «en caso de descubrirse un jailbreak universal público, se actualizarán rápidamente las defensas para mantener la solidez frente a ataques conocidos». No obstante, el problema actual no concierne a una brecha universal, sino a un fallo muy concreto.

Hasta la mañana del sábado, Anthropic no había modificado su posicionamiento, calificando todo de «un malentendido».

¿Un simple malentendido?

La situación es compleja, especialmente en 2026. David Sacks, copresidente del Consejo Asesor del Presidente en Ciencia y Tecnología y exresponsable de IA y criptografía de la Casa Blanca, publicó en Twitter la versión oficial del gobierno estadounidense.

Sacks afirmó que un «socio de confianza altamente creíble» para Anthropic y el gobierno informó del jailbreak. La administración pidió al CEO de Anthropic, Dario Amodei, que fortaleciera los sistemas de protección o retirara el modelo. Según Sacks, «Dario se negó».

La intervención de Amazon

Informes independientes del Wall Street Journal y The Information señalan que fue el CEO de Amazon, Andy Jassy, quien dio aviso del jailbreak encontrado por investigadores de su empresa. Según estas fuentes, estos investigadores hallaron maneras de usar Fable 5 para facilitar ciberataques, a pesar de que Anthropic asegura haber incorporado mecanismos para impedir que el modelo ayudara en ataques cibernéticos o en la creación de armas biológicas.

Muchos usuarios ya habían notado que Fable 5 se negaba a responder incluso preguntas inocuas y, en esos casos, automáticamente cambiaba a utilizar el modelo anterior, Opus 4.8.

Dado que Amazon fue quien reportó este fallo, es probable que los investigadores hayan probado Fable 5 en Amazon Bedrock, la plataforma que ofrece servicios con las mismas medidas de seguridad que Anthropic implementa directamente en su modelo Claude.

Sacks considera que la defensa de Anthropic, que minimiza el jailbreak como algo sin gran importancia, contradice el parecer de su socio confiable y del propio gobierno estadounidense, y resulta incoherente con la imagen de empresa dedicada a la seguridad en IA. «Resulta difícil entender cómo pueden calificar un jailbreak que permite el funcionamiento de un arma cibernética como no serio», afirma.

Se recuerda que Anthropic se había negado a liberar Mythos 5 por considerarlo demasiado peligroso, y ha construido su reputación como laboratorio pionero y responsable en seguridad de IA. Ahora, Sacks le reprocha haber priorizado la disponibilidad del modelo para el consumidor frente a garantizar la seguridad.

¿Qué ocurre a partir de ahora?

La solución más plausible es que Anthropic implemente nuevas barreras que bloqueen específicamente esta vulnerabilidad, aunque la naturaleza impredecible de estos sistemas de IA hace posible que surjan otros jailbreaks.

Se espera que la empresa solucione pronto este problema, que se levanten las restricciones de exportación y que los modelos vuelvan a estar disponibles.

Este incidente marca un precedente sobre cómo el gobierno estadounidense podría abordar la seguridad en IA, y otros laboratorios emergentes en Estados Unidos observan con atención el caso. El avance en IA ha sido una constante competencia entre estas compañías, superándose unas a otras, y Fable 5 y Mythos 5, seguramente, no serán el último desarrollo significativo.

Aún está por verse qué impacto tendrá este caso en las futuras versiones de modelos de OpenAI o Google, y si se impondrán protocolos voluntarios de seguridad antes de su lanzamiento, una idea que la administración estadounidense ha apoyado y que ahora podría cobrar mayor relevancia.

No hay que olvidar que Anthropic ha sido una de las voces más activas a favor de la regulación en inteligencia artificial.

«La pelota está en el tejado de Anthropic»

Todo esto se enmarca además en una relación complicada entre Anthropic y la administración Trump, aunque Sacks aclara que, en este caso, la administración valora las capacidades técnicas de Anthropic y considera que, pese a la seriedad del asunto, debería resolverse con facilidad.

En sus palabras, «la responsabilidad ahora recae en Anthropic».

Add a Comment

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Patrocinado