O Wayback Machine, plataforma do Internet Archive, enfrenta uma crise existencial devido a bloqueios impostos por veículos de imprensa. Criado há 30 anos, o archive.org arquiva mais de um bilhão de sites, permitindo acesso a conteúdos originais que foram alterados ou excluídos.
Um número crescente de empresas de comunicação, incluindo o The Guardian, New York Times, Le Monde e USA Today, negou o acesso ao Internet Archive. Segundo a Nieman Foundation for Journalism, pelo menos 241 portais de notícias de nove países já bloquearam a Wayback Machine.
O USA Today, que utiliza a plataforma para reportagens, contradiz sua própria política ao bloquear o acesso. O porta-voz do New York Times, Graham James, afirmou: “O problema é que os conteúdos do New York Times no Internet Archive são utilizados pelas empresas de IA, que infringem direitos autorais para concorrer diretamente conosco”.
Dados indicam que robôs acessam o archive.org em busca de conteúdos jornalísticos para treinar modelos de IA. Mark Graham, diretor do Wayback Machine, revelou que algumas empresas fazem dezenas de milhares de solicitações por segundo, sobrecarregando os servidores.
A organização se apresenta como uma entidade comprometida com a internet aberta, oferecendo acesso gratuito a pesquisadores e ao público. A Electronic Frontier Foundation (EFF) comparou a atitude dos veículos de imprensa a proibir bibliotecas de manter cópias de periódicos.
Mais de 100 jornalistas assinaram uma petição em apoio ao Internet Archive, ressaltando a importância da Wayback Machine para a recuperação de páginas que poderiam estar perdidas. Mark Graham também mencionou que está em conversas com empresas de jornalismo para reaver o acesso.
Martin Fehrensen, especialista em mídia, alertou que a incapacidade do archive.org de cumprir sua função teria consequências graves, dificultando pesquisas e a preservação de evidências digitais. Ele sugere um diálogo com editores e um status jurídico especial para arquivos da web.
O Internet Archive já enfrentou desafios, como um ataque hacker em 2024 que resultou no roubo de 31 milhões de contas de usuário e um processo de direitos autorais que levou à remoção de mais de 500 mil livros. A atual ameaça dos bloqueios representa um risco estrutural mais grave, minando a documentação da internet pública.

