A Meta conduziu um programa secreto que utilizou centenas de terceirizados para se passar por adolescentes e testar modelos de inteligência artificial de concorrentes. O projeto, conhecido internamente como “Cannes”, visou plataformas como ChatGPT e Gemini, submetendo-as a prompts perturbadores sobre temas como suicídio e canibalismo.
O programa, executado por um contratado da Meta, utilizou contas temporárias com menos de 18 anos para forçar os chatbots a ultrapassarem seus limites de segurança. Um registro de prompts demonstrou que centenas dos testes focaram em automutilação e transtornos alimentares, enquanto mais de duzentos e trinta envolviam temas sexuais ou românticos, todos sob a perspectiva de um jovem.
A empresa alegou que a atividade fazia parte de um “benchmarking de segurança de IA padrão da indústria”. Contudo, a CEO da Humane Intelligence PBC, Rumman Chowdhury, contestou a prática, afirmando que estruturar um projeto de grande escala para quebrar regras usando contas falsas não se enquadra no padrão usual de avaliação.
A Meta justificou o esforço como um fornecimento de “datasets críticos para comparação e conformidade de modelos”. A empresa já enfrentou questionamentos sobre o trabalho realizado por terceirizados, como em um acordo de 2020 com moderadores de conteúdo.

