Aikido

Full Fathom Five: O contexto do lançamento público da classe Mythos da Anthropic

Escrito por
Mike Wilkes

Esta semana foi palco de alguns acontecimentos e marcos interessantes, com a Anthropic a anunciar a disponibilidade do Claude Fable 5, um descendente do seu modelo Mythos Preview, e a Microsoft a publicar a sua maior «Patch Tuesday» de sempre, com mais de 200 vulnerabilidades. Os dois factos não são independentes um do outro.

Mas vamos esclarecer o que foi lançado, pois a cobertura do novo modelo da Anthropic está, infelizmente, sujeita a mal-entendidos e informações erradas. A Anthropic não lançou o Mythos Preview como um modelo disponível ao público. Esse modelo continua disponível apenas para as empresas da iniciativa Glasswing original e para um segundo grupo de cerca de 150 organizações adicionais que agora podem aceder ao Claude Mythos 5, que é em grande parte idêntico ao Claude Fable 5, mas com algumas das salvaguardas removidas.

O que foi lançado foi um modelo com capacidades semelhantes, mas concebido de forma a encaminhar quaisquer solicitações e discussões relacionadas com a cibersegurança para um modelo Opus 4.8, a fim de o tornar «seguro para uso geral». Isto significa que não faz sentido avaliar o Fable 5 em termos de capacidades de cibersegurança, dado este comportamento de encaminhamento. Já sabemos como o Opus 4.8 se comporta na deteção de vulnerabilidades no código. As consultas sobre como fabricar armas biológicas também são encaminhadas para um modelo mais básico, o que parece ser o compromisso a que a Anthropic chegou ao decidir como continuar a aproveitar a onda de atenção e preocupação que o Mythos Preview gerou em abril.

Para alguns poucos, as suas primeiras interações com o Mythos Preview remontam ao final de março, durante a Conferência RSAC em São Francisco. Eu próprio não tive acesso ao modelo, mas tive o prazer de me encontrar com várias pessoas que *sim* dedicaram tempo a analisar e a examinar os seus repositórios de software para descobrir o que é que aparece. A verdade parece situar-se algures entre uma reação alarmista do tipo «o céu está a cair» e um grande nada (com um impacto de marketing impressionante para uma empresa pré-IPO que, surpreendentemente, não oferece grande transparência sobre o que está a fazer, apesar das adoráveis publicações no blogue que continuam a defender a tautologia de que o seu mais recente modelo é a coisa mais impressionante desde a invenção do pão fatiado). 

Na Aikido pentest autônomo Aikido pentest autônomo no domínio do software auto-protegido e pentest autônomo levou-nos a compreender que não é de todo necessário o Mythos Preview (nem o Fable 5, já agora) para realizar um excelente trabalho na proteção do seu software e na deteção de vulnerabilidades, IDORs (Referências Diretas a Objetos Inseguras) e falhas na lógica de negócio que permaneciam por descobrir (por vezes, há anos). Num teste de penetração recente realizado por um dos nossos clientes, os seus JWTs estavam presentes, mas eram totalmente irrelevantes e não eram utilizados na autenticação das chamadas de API.

«A cinco braças de profundidade repousa o teu pai» 

De William Shakespeare

(uma canção da peça «A Tempestade»)

A cinco braças de profundidade repousa o teu pai;

Os seus ossos são feitos de coral;

Eram pérolas que eram os seus olhos:

Nada nele que se desvaneça,

Mas sofre uma transformação radical

Para algo rico e misterioso.

As ninfas do mar tocam o seu sino a cada hora:

                                             Ding-dong.

Ouçam! Agora ouço-os — ding-dong, o sino.

Os mitos que têm de desaparecer

Ao pensar no que partilhar nesta publicação do blogue, volto sempre a esta conclusão: toda a gente continua a tentar encaixar o Mythos na categoria de «hacker de IA», porque foi essa a primeira imagem que lhes foi apresentada. O viés de ancoragem é uma droga poderosa. O Mythos não foi concebido para a deteção de vulnerabilidades de segurança nem para a pirataria informática, mas, assim que uma narrativa ganha força, começa a correr pela sala, derrubando candeeiros. A verdadeira história da construção de infraestruturas resilientes através da segurança do software é mais aborrecida, mais útil e, por isso, mais difícil de comercializar. Trata-se de compreender onde os sistemas são frágeis, onde as operações são incoerentes e onde as equipas de segurança se afogam em tudo, exceto naquela manchete CVE limpa que faz com que um slide de conferência pareça heróico.

A deteção de vulnerabilidades representa talvez 20% do conjunto de problemas que precisam de ser resolvidos. Os restantes 80% não têm qualquer relação com os CVE: configurações incorretas, serviços expostos, permissões desatualizadas, ativos fantasmas, limites de identidade quebrados, fluxos de trabalho de SaaS remendados e todos aqueles pequenos pecadinhos estranhos que se acumulam porque as organizações são compostas por seres humanos e ciclos de aquisição. Os CVE, enquanto ferramenta prática de priorização, estão, de qualquer forma, praticamente mortos e enterrados. O mesmo se pode dizer do catálogo KEV da CISA. Continuam a ser importantes, mas a fetichização é embaraçosa. Um colega brincou recentemente sobre um CVSS de «11», no sentido de Spinal Tap, e isso está certo: transformámos a pontuação de gravidade num espetáculo, enquanto o verdadeiro raio de impacto reside nos locais que ninguém queria inventariar.

O outro mito que precisa de ser desmascarado é o de que as vulnerabilidades «zero-day» estavam, de alguma forma, limitadas em termos de oferta. Não estavam. Adicionar mais 20 000 vulnerabilidades não cria, por magia, 20 000 compradores. A procura por novas vulnerabilidades é bastante constante, talvez da ordem das 30 por mês, de acordo com uma investigação da Resecurity, porque os compradores têm orçamentos, restrições operacionais, requisitos de segmentação e, ocasionalmente, supervisão de adultos. O mercado não se torna subitamente infinito só porque o Claude Fable 5 ou o Mythos conseguem sacudir mais bugs da árvore. Pode-se inundar o mercado com facas brilhantes, mas se as pessoas que compram facas precisam apenas de algumas muito específicas, o resto torna-se inventário, ruído ou liderança de pensamento no LinkedIn.

O que significa que o futuro provável não é «a IA desencadear o apocalipse ao descobrir mais falhas». O futuro mais provável é que os tokens sejam gastos em análises defensivas, fluxos de trabalho de correção, gestão de exposições e medidas de higiene aborrecidas, mas lucrativas. Os tokens do Mythos e do Fable 5 não irão alimentar milhões de análises e ataques por parte de agentes maliciosos. Os agentes maliciosos são uns sacanas mesquinhos e preguiçosos, e é por isso que a engenharia social continuará a ser a sua forma preferida de ganhar dinheiro. Porquê desperdiçar recursos computacionais e arriscar-se operacionalmente em cadeias de exploração exóticas quando ainda se consegue que alguém aprove uma fatura, redefina a autenticação multifatorial (MFA) ou clique naquela coisa brilhante? Com a iniciativa Glasswing, o Mythos e o Fable 5, a gravidade económica aponta para a defesa, a triagem e a limpeza. Não porque os atacantes se tenham tornado nobres, mas porque o crime, tal como o software empresarial, segue o caminho de menor resistência.

Talvez essa seja, afinal, a verdadeira história do Glasswing: não o nascimento de uma máquina predadora perfeita, mas uma mudança radical na forma como compreendemos os destroços que já se encontram sob os nossos pés. «A cinco braças de profundidade jaz o teu pai», escreveu Shakespeare, e isso parece adequado para a era do CVE. O velho corpo do gerenciamento de vulnerabilidades lá em baixo algures, os seus ossos transformados em corais, os seus olhos em pérolas, ainda reconhecível se apertarmos os olhos, mas já não vivo da forma como as pessoas continuam a fingir que está. Nada disso simplesmente desapareceu. Transformou-se em algo rico e estranho: exposição, identidade, configuração, fluxo de trabalho, incentivo e a economia confusa do que os atacantes realmente se dão ao trabalho de fazer. Estamos tão focados em pensar que a segurança da informação é um problema tecnológico que perdemos de vista os elementos reais com que precisamos de lidar: o quem e o porquê dos atacantes, dos agentes de ameaças, dos Estados-nação e dos adolescentes entediados como Hunters Shiny Hunters a TeamPCP. A segurança da informação é, no fundo, um problema de pessoas.

Crédito da imagem: Google Gemini prompt: uma catedral submersa de antigos controlos de segurança da informação no fundo do mar, com um leviatã de IA luminoso a passar por cima

O sino está a tocar para uma história mais simples: aquela em que a descoberta de mais vulnerabilidades significa automaticamente mais ataques informáticos. Ding-dong. A versão mais complexa e intrigante é que os defensores podem finalmente ter uma máquina suficientemente rápida para mapear o fundo do oceano: as configurações erradas, os recursos abandonados, as permissões desatualizadas, os monstros «não-CVE» que devoram silenciosamente o navio por baixo.

E é aí que acho que os tokens vão parar. Não numa corrida cinematográfica ao armamento de «zero-day», mas sim no trabalho defensivo pouco glamoroso de que as equipas de segurança sempre precisaram. As ninfas do mar podem tocar o sino fúnebre dos velhos mitos. O futuro não é menos estranho, mas talvez seja mais honesto.

Ah, e nem vale a pena perguntar o que aconteceu ao Fable 1, 2, 3 e 4. Provavelmente foram relegados para a cave digital da Anthropic, guardados em formaldeído cibernético como espécimes de ADN de LLM imperfeito que nunca verão a luz do dia.

Compartilhar:

https://www.aikido.dev/blog/fable-5-release-full-fathom

Assine para receber notícias

4.7/5
Cansado de falsos positivos?

Experimente Aikido como 100 mil outros.
Começar Agora
Obtenha um tour personalizado

Confiado por mais de 100 mil equipes

Agende Agora
Escaneie seu aplicativo em busca de IDORs e caminhos de ataque reais

Confiado por mais de 100 mil equipes

Iniciar Escaneamento
Veja como o pentest de IA testa seu aplicativo

Confiado por mais de 100 mil equipes

Iniciar Testes

Fique seguro agora

Proteja seu código, Cloud e runtime em um único sistema centralizado.
Encontre e corrija vulnerabilidades rapidamente de forma automática.

Não é necessário cartão de crédito | Resultados da varredura em 32 segundos.