El desarrollo de inteligencia artificial aplicada al código avanza con rapidez gracias a herramientas capaces de escribir programas, revisar errores y sugerir mejoras. Ahora, estos sistemas también pueden analizar software a mayor profundidad, detectar fallas complejas y proponer formas de explotarlas. En este contexto, Anthropic presentó Claude Mythos Preview , un modelo con habilidades avanzadas para identificar vulnerabilidades.
Claude creó una IA capaz de hackear, pero la restringió por el bien de todo
La empresa decidió no liberarlo al público y limitó su acceso a un grupo reducido de organizaciones, debido al nivel de riesgo que implica su uso fuera de entornos controlados. Según el reporte de Anthropic, el modelo puede identificar vulnerabilidades desconocidas y generar formas de explotarlas, lo que abre la posibilidad de que actores maliciosos lo utilicen para desarrollar ciberataques, acceder a sistemas sensibles o comprometer infraestructura crítica.
De acuerdo con el reporte técnico de Anthropic, el modelo logró identificar fallas desconocidas en distintos sistemas durante pruebas internas. Entre los hallazgos aparecen vulnerabilidades en software ampliamente utilizado, incluidos navegadores y componentes del sistema operativo. Algunos de estos errores permanecieron sin detectar durante años, lo que llamó la atención de los investigadores de la compañía.
El modelo no se creó como una herramienta exclusiva de ciberseguridad, Anthropic lo entrenó para tareas generales como programación, análisis de código y resolución de problemas complejos. Sin embargo, estas capacidades le permiten revisar grandes volúmenes de código, encontrar errores y proponer formas de explotarlos. En entornos controlados, Mythos incluso construyó pruebas de ataque funcionales a partir de fallas detectadas.
La compañía mantiene el modelo en una fase controlada mientras evalúa sus efectos y posibles aplicaciones dentro del sector tecnológico.
Te puede interesar:
Acceso limitado y pruebas con empresas
Ante estos resultados, Anthropic optó por restringir el acceso al modelo. Según el documento de presentación, solo un grupo pequeño de organizaciones participa en esta fase inicial, entre ellas se encuentran empresas tecnológicas y actores vinculados a infraestructura crítica, que pueden evaluar el sistema en entornos reales bajo supervisión.
La compañía también anunció Project Glasswing , una iniciativa enfocada en el uso defensivo de esta tecnología. Según Anthropic, el proyecto busca coordinar esfuerzos entre empresas para detectar vulnerabilidades antes de que alguien las aproveche con fines maliciosos. En esta etapa, las organizaciones participantes utilizan el modelo para revisar sistemas, identificar riesgos y reportar hallazgos.
Medios como Wired reportan que el desempeño de Claude Mythos en pruebas de seguridad resulta comparable al de especialistas con experiencia en ciberseguridad. El modelo puede ejecutar tareas como análisis de código, identificación de fallas y generación de posibles rutas de ataque, una combinación de capacidades que explica la decisión de limitar su disponibilidad.