A inteligência artificial, amplamente utilizada por estudantes, é treinada majoritariamente com dados produzidos fora do Brasil, o que levanta questionamentos sobre a representatividade cultural do país nos algoritmos.
A Bamboo Data, datatech brasileira especializada em datasets culturais, trouxe à tona o debate sobre a representatividade na IA. Os principais modelos de inteligência artificial foram treinados com dados oriundos da Europa e da América do Norte, deixando à margem territórios, línguas e referências culturais brasileiras.
A questão se insere em uma pauta global sobre governança da inteligência artificial e soberania digital. Segundo estudos da University of Southern California (USC), 38,6% dos fatos usados para treinar sistemas de IA apresentam distorções que afetam grupos não ocidentais.
A empresa brasileira atua na coleta e organização de dados multimodais para o treinamento de IA, com foco em comunidades historicamente sub-representadas nos ambientes digitais. A discussão é relevante no ambiente educacional, onde é fundamental valorizar as diversidades étnico-culturais dos estudantes.

