A iniciativa Anthropic Glasswing reúne Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, a Linux Foundation, Microsoft, NVIDIA e Palo Alto Networks como parceiros de lançamento. É possível encontrar muitas publicações e reações nas redes sociais, pois é um grande feito que a Anthropic esteja mantendo seu modelo Mythos Preview fora do acesso geral. Aparentemente, isso visa proporcionar às principais empresas de software e segurança o primeiro acesso para ajudar a resolver milhares de vulnerabilidades descobertas e verificadas em navegadores web, sistemas operacionais e espaços de risco de problemas igualmente “difíceis”. Quer você acredite que a Anthropic desenvolveu um grande avanço nas capacidades do modelo ou que foi uma tática de marketing brilhante, você simplesmente não pode evitar a pressão de ter algo relevante e sensato a dizer sobre o assunto.

Pela minha parte, tenho a honra de ter cunhado o termo “Mythos-ready” ao revisar e contribuir para o brief publicado pela CSA e amigos (mais de 250 CISOs e autores, o que por si só é um esforço de colaboração incrível e uma demonstração de resiliência da comunidade) em 12 de abril. Eu queria um termo que fosse empoderador, mas, ao mesmo tempo, capaz de indicar claramente que nenhuma organização está Mythos-ready no momento. Nem mesmo a própria Anthropic.
Este post do blog, no entanto, adota uma abordagem diferente em comparação com o brief da CSA e se esforça para delinear o esqueleto de uma estrutura de segurança abrangente para organizações que se preparam para o "Mythos", à medida que entramos em uma nova era de ameaças de IA autônomas capazes de descobrir e explorar vulnerabilidades na velocidade da máquina.
A intenção aqui, ao elaborar e compartilhar um mapeamento de framework de segurança, enfatiza a mudança de uma segurança simples baseada em prompts para controles arquiteturais robustos, defendendo segmentação rigorosa, acesso de menor privilégio e ambientes de execução isolados para limitar o potencial "raio de impacto" de uma violação agentic. É assim que arquitetamos contra ameaças autônomas.
Para manter a vantagem do defensor, as empresas são incentivadas a implementar testes adversariais pré-lançamento e a "atacar a si mesmas primeiro" por meio de pipelines automatizados de red-teaming. A própria orientação da Anthropic sobre o impacto nas equipes de segurança destaca a importância do julgamento e da priorização de vulnerabilidades (EPSS v4.1), e não apenas enfileirá-las para remediação. Você nem precisa de acesso ao Mythos Preview para começar a fazer isso hoje. Você pode usar qualquer um dos seus modelos de fronteira favoritos e, para ser sincero, modelos gratuitos de pesos abertos também.
Em última análise, queremos apresentar o primeiro rascunho de um modelo de maturidade e um checklist prático para garantir que os sistemas internos sejam resilientes contra modelos avançados de IA que agora podem encadear ataques multi-etapas e encontrar vulnerabilidades em código com mais de 20 anos, bem como em código com 20 minutos.
Antes de apresentar uma lista esmagadora de coisas que as pessoas deveriam fazer para preparar suas organizações para varreduras e ataques Mythos e semelhantes a Mythos, devemos procurar implementar:
- Aprovações human-in-the-loop para ações sensíveis
- Manter o registro de alta fidelidade de todas as interações de ferramentas autônomas
- Limites de raio de impacto (menor privilégio, tokens com escopo)
- Kill switches e detecção de anomalias
- Melhor segmentação entre sistemas e dados
- Camadas de validação de entrada/saída (agentic em particular)
- Separação entre ambientes de raciocínio e execução
Então, se a sabedoria coletiva é que superamos a questão "devemos ter capacidades de defesa agentic" para "como melhor implementar capacidades de defesa agentic", há alguns princípios e suposições axiomáticos que devem ser destacados.
Em sistemas agentic, sua superfície de ataque = tudo o que o agente pode tocar.
Você não está pronto para Mythos se alguma destas for verdadeira:
- Agentes podem acessar a produção com privilégios permanentes amplos.
- Uma única credencial expõe múltiplos ambientes.
- O uso de ferramentas é mal registrado ou não é registrado.
- Postagem externa ou acesso de rede de saída está aberto por padrão.
- Os testes de segurança focam em prompts em vez de arquitetura e caminhos de execução.
- Seu plano de incidentes assume apenas atacantes com velocidade humana.
O Mythos Preview System Card da Anthropic apoia a premissa de que agentes de fronteira podem descobrir vulnerabilidades autonomamente, desenvolver exploits e ocasionalmente tomar ações imprudentes raras, mas de alto impacto, o que torna os controles no nível da arquitetura extremamente importantes.
Aqui está um Checklist prático de Arquitetura de Segurança para a Era do Mythos. É um primeiro rascunho e provavelmente precisará ser revisado com base em feedback e discussão adicional, mas está focado em ataques agentic, maior frequência de violações e na preservação da vantagem do defensor que vem de conhecer sua própria arquitetura, integrações e cronograma de lançamento melhor do que qualquer atacante pode. Você pode baixá-lo no final deste blog.
"…acreditamos que modelos de linguagem poderosos
beneficiarão mais os defensores do que os atacantes, aumentando
a segurança geral do ecossistema de software."
O Projeto Glasswing não é apenas mais um capítulo na evolução da defesa de IA. Parece mais um choque para um sistema que havia silenciosamente estagnado sob o peso da complexidade, ruído e pensamento reativo. Por anos, a segurança de aplicações tem falhado na aceleração da velocidade e escala exigidas pelo desenvolvimento de software moderno. O que Glasswing representa é uma mudança de monitoramento passivo para ressuscitação ativa: um desfibrilador cibernético que não apenas detecta ameaças, mas restaura ritmo, clareza e intenção em como defendemos o software.
Com alguma apreensão, pode-se assumir com segurança que em alguma Patch Tuesday não muito distante, os resultados de apontar o Mythos Preview para os repositórios de código do Microsoft Windows nos trarão um novo marco em vulnerabilidades. Pelo que me lembro, um dos piores até agora foi de 400 vulnerabilidades e 10 zero days. Eu apostaria que podemos aumentar isso para 4.000 vulnerabilidades e 400 zero days, dado que o Firefox incluiu 271 vulnerabilidades na versão 150 em 21 de abril.
Ao injetar inteligência diretamente na corrente sanguínea da AppSec, a IA deixa de ser um recurso adicional e se torna o próprio pulso, contínuo, adaptável e responsivo. É uma disciplina reanimada, que pode finalmente operar na mesma velocidade dos sistemas que protege. Se a última década de segurança foi sobre sobreviver, esta próxima era, impulsionada por esforços como o Projeto Glasswing, é sobre voltar à vida, mais forte, mais afiada e pronta para o que está por vir.
Se você deseja ainda mais recursos para se preparar para ameaças de IA agêntica, a Aikido também publicou um checklist de segurança pronto para Mythos para CTOs. Confira.

