Início DestaquesAnthropic investiga acesso indevido ao Claude Mythos, IA temida por especialistas

Anthropic investiga acesso indevido ao Claude Mythos, IA temida por especialistas

por Notícia Baré
Interface do Claude Mythos, modelo de IA avançado da Anthropic, que foi acessado por usuários não autorizados em ambiente de fornecedor terceirizado.

A Anthropic abriu uma investigação interna após relatos de que o Claude Mythos, seu modelo de inteligência artificial considerado “perigoso demais” para uso amplo, foi acessado por pessoas não autorizadas. A ferramenta, focada em cibersegurança e capaz de encontrar e explorar falhas em softwares e sistemas operacionais, estava liberada apenas para um grupo seleto de parceiros dentro do programa Project Glasswing.

De acordo com documentos internos e fontes ouvidas pela Bloomberg, usuários de um fórum privado conseguiram acessar o Mythos no mesmo dia em que o modelo foi disponibilizado em versão prévia. O grupo seguiu utilizando a IA com frequência, mas a Anthropic afirma não haver indícios de uso voltado diretamente a pesquisas ou ataques de cibersegurança.

A brecha teria ocorrido por meio de permissões ligadas a um funcionário de uma empresa terceirizada que presta serviços à Anthropic. Usando esse acesso e ferramentas públicas de investigação na internet, os usuários localizaram o ambiente em que o Claude Mythos estava hospedado. Parte deles integra um canal privado no Discord dedicado a encontrar e testar modelos de IA ainda não lançados comercialmente.

Em nota, a Anthropic declarou estar investigando um “acesso não autorizado ao Claude Mythos Preview por meio do ambiente de um fornecedor terceirizado”. A empresa diz não ter evidências de que a atividade tenha ultrapassado os sistemas desse parceiro nem de que seus próprios ambientes internos tenham sido comprometidos. Ainda segundo a startup, não há registros de prompts ligados a cibersegurança executados pelo grupo, o que indica um uso mais exploratório da tecnologia.

O caso reforça preocupações de especialistas sobre o potencial do Mythos. Em testes, o modelo foi capaz de descobrir milhares de vulnerabilidades graves em sistemas operacionais, softwares e navegadores, demonstrando um nível de habilidade em exploração de falhas que supera a maioria dos profissionais humanos. Justamente por isso, governos e órgãos reguladores acompanham de perto a evolução da ferramenta, que já chamou a atenção do governo dos Estados Unidos para uso em agências federais.

Para críticos, o episódio expõe o desafio de manter sob controle modelos de IA extremamente poderosos em ambientes complexos, que envolvem múltiplos fornecedores e camadas de acesso. Para a Anthropic, o desfecho da investigação será crucial para mostrar se medidas adicionais de segurança serão adotadas e como a empresa pretende evitar novos acessos indevidos ao Claude Mythos.

Deixe um comentário

Você também deve gostar

Focus Mode