Qué es Fable 5: el nuevo modelo de IA de Anthropic basado en Mythos con fuertes restricciones por seguridad

Anthropic abrió al público una versión de su tecnología más potente, aunque mantiene restricciones en áreas sensibles y nuevas políticas de control. La salida coincide con la salida a bolsa de la empresa.

anthropic

Anthropic abrió por primera vez al público el acceso a Fable 5, una versión derivada de su modelo más avanzado de inteligencia artificial, Mythos, que había generado un fuerte revuelo por su capacidad "en la detección y explotación de vulnerabilidades de software", algo que habían advertido que podía comprometer a los principales "sistemas operativos y navegadores web". Según la empresa, el modelo reducido ofrece mejoras significativas en programación, análisis complejo y visión artificial, aunque mantiene restricciones en áreas sensibles como ciberseguridad, biología y química, donde las respuestas son derivadas automáticamente a otras versiones con mayores salvaguardas.

Hasta ahora, Mythos había permanecido limitado a un grupo reducido de organizaciones debido a preocupaciones vinculadas a la seguridad. Tras una expansión inicial a cientos de entidades de infraestructura crítica en 15 países, Anthropic decidió lanzar Fable 5 a través de su API y de sus planes corporativos.

El acceso será temporalmente gratuito para los usuarios de los planes Pro, Max, Team y Enterprise hasta el 22 de junio. A partir del día siguiente, la compañía exigirá créditos de consumo específicos para utilizar el modelo, aunque adelantó que buscará reincorporarlo a las suscripciones tradicionales lo antes posible.

Embed - https://publish.x.com/oembed?url=https://x.com/claudeai/status/2064394146916229443&partner=&hide_thread=false

En paralelo, Anthropic también comenzó a desplegar Mythos 5, una versión aún más avanzada reservada para organizaciones previamente autorizadas.

Un lanzamiento marcado por las preocupaciones sobre la IA

La presentación de Fable 5 llega en un momento clave para la industria. Coincide con la salida a bolsa de Anthropic y se produce poco después de que la empresa pidiera a los principales laboratorios del sector coordinar límites al desarrollo de sistemas cada vez más potentes.

1e65982497d7d4891219ed0e83141625a291b860-2600x2870
La comparación de Fable 5 con otros modelos del mercado.

La comparación de Fable 5 con otros modelos del mercado.

La firma advirtió recientemente que la inteligencia artificial podría acercarse a escenarios de auto-mejora recursiva, una capacidad mediante la cual los modelos serían capaces de perfeccionarse de manera autónoma sin intervención humana.

Por ese motivo, Anthropic sometió a Fable 5 a extensas pruebas de seguridad antes de su lanzamiento. “Internamente, llevamos a cabo un programa externo de recompensas por la detección de errores que no produjo ninguna vulnerabilidad universal tras más de 1000 horas de pruebas. Posteriormente, colaboramos con organizaciones externas de pruebas de penetración (red teaming) que tampoco lograron encontrar vulnerabilidades universales", detallaron sobre el proceso de corroboración antes de lanzarlo al público.

Los salvaguardas del nuevo modelo de Mythos

Como parte de las nuevas medidas de seguridad, Anthropic implementará una política de retención de 30 días para todo el tráfico generado por Fable 5 y Mythos 5, incluso en organizaciones que previamente contaban con acuerdos de almacenamiento cero.

La empresa aseguró que los datos no serán utilizados para entrenamiento, sino únicamente para detectar intentos sofisticados de evasión de restricciones, identificar nuevos jailbreaks (técnica de seguridad informática en la que un usuario utiliza instrucciones engañosas (prompts) para manipular un modelo de lenguajey reducir falsos positivos en los sistemas de seguridad). La decisión podría marcar un precedente en una industria donde los modelos más avanzados exigen cada vez mayores controles sobre el uso de la información.

Según Anthropic, los casos en los que Fable 5 necesita recurrir a Claude Opus 4.8 son poco frecuentes. Los datos preliminares indican que más del 95% de las sesiones se completan utilizando exclusivamente el nuevo modelo.

Entre las evaluaciones externas destacadas por la compañía figura la realizada por Hex, que aseguró que Fable fue el primer sistema en alcanzar un 90% de precisión en su principal benchmark analítico para tareas complejas y de larga duración.

“En las preguntas más difíciles, demuestra un juicio sólido y atención a los matices”, señalaron desde Hex. Otras compañías también reportaron mejoras en programación, desarrollo de aplicaciones completas, diseño de interfaces y creación de videojuegos.

Sin embargo, el costo podría convertirse en una barrera para su adopción masiva. Anthropic fijó un precio de u$s10 por millón de tokens de entrada y u$s50 por millón de tokens de salida, el doble que Claude Opus 4.8.

Te puede interesar