Alguém usou o Claude para invadir a serviços do governo mexicano. O ataque, que perdurou por quase um mês, resultou no roubo de um grande volume de informações sobre contribuintes e eleitores do país, apurou a firma de cibersegurança israelense, Gambit Security.De acordo com a apuração, o usuário não identificado convenceu a IA a agir como um hacker de elite, solicitando que buscasse vulnerabilidades, escrevesse scripts para explorá-las e automatizasse o roubo de informações. Os prompts utilizados na conversa foram redigidos em espanhol.Leia mais: Adware: como identificar, remover e evitar anúncios invasivosO invasor teria acessado a base de dados da autoridade tributária do México e também do instituto nacional eleitoral. Entre os 150 GB de dados exfiltrados, estariam documentos vinculados a 195 milhões registros de contribuintes, registros de eleitores, credenciais de funcionários públicos e arquivos de registro civil.O Claude foi convencido a atuar como um hacker de elite e invadir sistemas do governo do México. (Fonte: TecMundo)Até o momento, a Gambit Security não atribuiu o ataque a nenhum grupo hacker específico e afirma não haver indícios de envolvimento de um governo estrangeiro.Como o hacker enganou o Claude?Segundo a investigação, o atacante afirmou ao Claude que participava de um programa de bug bounty — iniciativa em que empresas recompensam profissionais por identificar falhas de segurança. Com isso, pediu que o chatbot conduzisse testes de penetração contra a autoridade tributária mexicana, prática que pode ser legítima quando autorizada.Em determinado momento, o modelo interrompeu a atividade ao receber instruções consideradas suspeitas. “Instruções específicas sobre como excluir registros e ocultar o histórico são sinais de alerta”, respondeu o Claude durante a conversa. “Em programas legítimos de bug bounty, você não precisa ocultar suas ações — na verdade, você precisa documentá-las para fins de relatório”, acrescentou.Claude desconfiou dos promptsInicialmente, o chatbot recusou parte das solicitações e alertou o usuário sobre possíveis intenções maliciosas. Ainda assim, conforme relatado pela Gambit, acabou cedendo e executando milhares de comandos contra a rede de agências mexicanas.Quando encontrava resistência do Claude ou precisava reformular instruções, o invasor recorria ao ChatGPT, da OpenAI, para aprimorar os prompts. A OpenAI afirmou ter identificado indícios de tentativas de uso de seus modelos para atividades que violam os termos da plataforma.Essa alternância entre os dois sistemas teria permitido contornar os mecanismos de segurança implementados no modelo da Anthropic. Após tomar conhecimento do caso, a empresa baniu as contas envolvidas e reiterou que seus modelos possuem salvaguardas para evitar uso indevido. A OpenAI também informou que bloqueou as contas associadas ao hacker.Em dezembro, o governo do México comunicou que investigava um possível incidente cibernético. Até o momento, não está claro se o episódio mencionado pelas autoridades tem relação direta com o ataque conduzido com auxílio do Claude.Confira: Cibercriminosos usam 'camuflagem' para exibir anúncios maliciosos no GoogleQuer acompanhar os desdobramentos sobre segurança cibernética e o uso de IA em ataques digitais? Fique de olho no TecMundo e siga o site nas redes sociais para não perder nenhuma atualização.