Atacantes utilizaram o agente de suporte de inteligência artificial da Meta para roubar contas do Instagram, solicitando que o sistema vinculasse perfis a e-mails controlados por eles. O incidente, ocorrido em 5 de junho, demonstra que vulnerabilidades em IAs automatizadas podem ser exploradas por métodos simples, mesmo em plataformas de grande porte.
O método de ataque foi direto: os invasores pediram ao agente de suporte para alterar o e-mail das contas, e o sistema obedeceu. Segundo especialistas, o ataque não exigiu a sofisticação de modelos avançados, mas evidenciou falhas críticas na segurança dos agentes de IA. Neil Gong, professor da Duke University, afirmou que os invasores terão mais motivação para atacar a própria IA à medida que ela for mais integrada aos fluxos de trabalho, como recuperação de contas.
A vulnerabilidade, que permitiu o acesso a contas, foi considerada surpreendente por analistas. Jessica Ji, pesquisadora do Centro de Segurança e Tecnologia Emergente de Georgetown, questionou se havia barreiras de segurança implementadas no sistema. Embora a Meta tenha confirmado a resolução da falha, o episódio aponta para riscos compartilhados por todos os agentes de IA, que podem responder de formas inesperadas.
Para mitigar riscos, especialistas defendem a implementação de testes rigorosos, conhecidos como red-teaming. Contudo, Bo Li, professor da Universidade de Illinois Urbana-Champaign, comentou que existe um conflito entre a utilidade e a segurança, pois quanto mais poder o agente tiver, mais difícil será protegê-lo. Somesh Jha, professor da Universidade de Wisconsin–Madison, declarou que os agentes de IA demonstram grande disposição em completar tarefas, o que pode ser explorado por invasores.


