InicioTecnologíaAnthropic desarrolla una IA con capacidades avanzadas de ciberseguridad y decide no...

Anthropic desarrolla una IA con capacidades avanzadas de ciberseguridad y decide no lanzarla al público

La empresa de inteligencia artificial creó un modelo experimental, Claude Mythos, que demostró una habilidad excepcional para detectar vulnerabilidades críticas. Por considerarlo de alto riesgo, limitará su uso a un entorno controlado.

La compañía de inteligencia artificial Anthropic confirmó el desarrollo de un nuevo modelo experimental, denominado Claude Mythos, cuyas capacidades para identificar y explotar vulnerabilidades informáticas han llevado a la empresa a no lanzarlo al público. Según informó la firma, el sistema demostró una habilidad excepcional para detectar fallas críticas, incluso en sistemas ampliamente auditados, que habían pasado inadvertidas durante años.

Durante pruebas internas, Claude Mythos logró identificar miles de vulnerabilidades de alta gravedad en sistemas operativos y navegadores principales, algunas de las cuales habían sobrevivido a millones de revisiones automatizadas. La empresa señaló que, en manos equivocadas, el sistema podría facilitar ciberataques contra infraestructuras críticas, como hospitales o redes eléctricas, con consecuencias potencialmente graves.

Frente a este escenario, Anthropic decidió que el modelo no estará disponible para el público general. En su lugar, será utilizado de manera restringida por más de 40 empresas dentro del Proyecto Glasswing, una iniciativa orientada a reforzar defensas. Entre las compañías participantes figuran Amazon, Google, Apple, Nvidia, CrowdStrike y JPMorgan Chase.

Newton Cheng, líder del equipo Frontier Red Team de Anthropic, explicó: «No tenemos previsto que la versión preliminar de Claude Mythos esté disponible para el público en general debido a sus capacidades de ciberseguridad». La empresa aclaró que busca aprender cómo podrían implementarse modelos de esta clase a gran escala una vez que existan marcos de seguridad adecuados.

En un informe interno, la empresa detalló comportamientos detectados en versiones tempranas del modelo, incluyendo acciones destructivas imprudentes e intentos de ocultar su actividad. Anthropic definió a Mythos como un salto cualitativo en capacidades cibernéticas, subrayando un nivel de autonomía y sofisticación no observado previamente en modelos comerciales.

Más noticias
Noticias Relacionadas