En un movimiento sin precedentes que sacude la industria de la inteligencia artificial, Anthropic ha anunciado la deshabilitación abrupta de sus modelos más avanzados, Claude Fable 5 y Claude Mythos 5, tras recibir una directiva de control de exportaciones del gobierno de los Estados Unidos. La orden prohíbe el acceso a estos modelos a cualquier ciudadano extranjero, tanto dentro como fuera de EE. UU., incluyendo a los propios empleados de Anthropic, lo que ha obligado a la compañía a cerrar el acceso para todos sus clientes para garantizar el cumplimiento legal.
El origen del conflicto: Una vulnerabilidad cuestionada La directiva gubernamental se fundamenta en preocupaciones de seguridad nacional relacionadas con un presunto método de evasión de salvaguardas o «jailbreaking» en Fable 5. Anthropic, tras revisar la demostración de esta técnica, sostiene que se trata de un hallazgo menor y «no universal». Según la empresa, el «jailbreak» detectado consiste esencialmente en pedir al modelo que lea un código y corrija fallos de software, una capacidad que, aseguran, ya está ampliamente disponible en otros modelos de la competencia como GPT-5.5 de OpenAI.
Defensa de la seguridad y «Red-Teaming» Anthropic ha defendido firmemente su estrategia de «defensa en profundidad», señalando que:
- Fable 5 fue sometido a miles de horas de pruebas de ataque (red-teaming) por parte del gobierno de EE. UU., el AISI del Reino Unido y equipos internos antes de su lanzamiento.
- Las pruebas demostraron que sus salvaguardas son sustancialmente más efectivas que las de cualquier modelo desplegado anteriormente.
- Hasta la fecha, ningún evaluador ha logrado encontrar un «jailbreak universal» que permita un uso malintencionado a gran escala.
La compañía enfatizó que la resistencia perfecta al «jailbreak» no es posible actualmente en la industria y que su enfoque se centra en hacer que estas evasiones sean costosas de producir y fáciles de monitorear.
Críticas a la decisión gubernamental La empresa expresó su desacuerdo con la medida, argumentando que la retirada de un modelo comercial utilizado por millones de personas debido a una vulnerabilidad limitada es un estándar que, de aplicarse a toda la industria, paralizaría el despliegue de nuevas tecnologías. Anthropic hizo un llamado a que las intervenciones gubernamentales sean transparentes, justas y basadas en hechos técnicos, sugiriendo que este procedimiento no cumplió con dichos principios.
Estado actual y modelos afectados Anthropic aclaró que el acceso a sus otros modelos, como Opus, Sonnet y Haiku, no se verá afectado por esta medida. La empresa calificó la situación como un «malentendido» y aseguró estar trabajando con las autoridades para restaurar el acceso a Fable 5 y Mythos 5 lo antes posible. Se espera que la compañía publique detalles técnicos adicionales sobre el informe de vulnerabilidad en las próximas 24 horas.
Comentarios