
A Anthropic abriu uma investigação interna após relatos de que o Claude Mythos, seu modelo de inteligência artificial considerado “perigoso demais” para uso amplo, foi acessado por pessoas não autorizadas. A ferramenta, focada em cibersegurança e capaz de encontrar e explorar falhas em softwares e sistemas operacionais, estava liberada apenas para um grupo seleto de parceiros dentro do programa Project Glasswing.
De acordo com documentos internos e fontes ouvidas pela Bloomberg, usuários de um fórum privado conseguiram acessar o Mythos no mesmo dia em que o modelo foi disponibilizado em versão prévia. O grupo seguiu utilizando a IA com frequência, mas a Anthropic afirma não haver indícios de uso voltado diretamente a pesquisas ou ataques de cibersegurança.
A brecha teria ocorrido por meio de permissões ligadas a um funcionário de uma empresa terceirizada que presta serviços à Anthropic. Usando esse acesso e ferramentas públicas de investigação na internet, os usuários localizaram o ambiente em que o Claude Mythos estava hospedado. Parte deles integra um canal privado no Discord dedicado a encontrar e testar modelos de IA ainda não lançados comercialmente.
Em nota, a Anthropic declarou estar investigando um “acesso não autorizado ao Claude Mythos Preview por meio do ambiente de um fornecedor terceirizado”. A empresa diz não ter evidências de que a atividade tenha ultrapassado os sistemas desse parceiro nem de que seus próprios ambientes internos tenham sido comprometidos. Ainda segundo a startup, não há registros de prompts ligados a cibersegurança executados pelo grupo, o que indica um uso mais exploratório da tecnologia.
O caso reforça preocupações de especialistas sobre o potencial do Mythos. Em testes, o modelo foi capaz de descobrir milhares de vulnerabilidades graves em sistemas operacionais, softwares e navegadores, demonstrando um nível de habilidade em exploração de falhas que supera a maioria dos profissionais humanos. Justamente por isso, governos e órgãos reguladores acompanham de perto a evolução da ferramenta, que já chamou a atenção do governo dos Estados Unidos para uso em agências federais.
Para críticos, o episódio expõe o desafio de manter sob controle modelos de IA extremamente poderosos em ambientes complexos, que envolvem múltiplos fornecedores e camadas de acesso. Para a Anthropic, o desfecho da investigação será crucial para mostrar se medidas adicionais de segurança serão adotadas e como a empresa pretende evitar novos acessos indevidos ao Claude Mythos.

