Wayback Machine: bloqueios deixam 'máquina do tempo' da web em risco

Wait 5 sec.

Os bloqueios realizados por veículos de comunicação e plataformas digitais estão colocando em risco a missão de preservar a história da internet assumida pela plataforma Wayback Machine. O projeto, lançado em 1996, possui mais de 1 trilhão de páginas arquivadas.Como destacou a Wired na segunda-feira (13), mais de 20 grandes sites de notícias estão bloqueando o rastreador web utilizado pela organização sem fins lucrativos Internet Archive, que mantém o banco de dados digital, para buscar os conteúdos. Essas restrições acontecem de diferentes maneiras.Por que os bloqueios acontecem?O uso não autorizado de conteúdos protegidos por direitos autorais para o treinamento de modelos de IA é o que motivou os bloqueios de veículos de imprensa. A prática já resultou em processos contra startups de IA, como o aberto pelo The New York Times tendo a OpenAI como alvo.O jornal é uma das empresas que aplicou restrições aos mecanismos de raspagem de dados do Wayback Machine, mesmo que o serviço não tenha envolvimento direto no desenvolvimento das IAs;No grupo que impede o arquivamento de suas notícias pela "máquina do tempo da internet" também está o USA Today;Curiosamente, o jornal usou a plataforma do Internet Archive, recentemente, em uma reportagem sobre o Serviço de Alfândega e Imigração dos Estados Unidos (ICE);Baseando-se em notícias antigas, a matéria mostrou como as estatísticas de detenção do órgão mudaram no governo de Donald Trump.O Wayback Machine possui um acervo gigantesco de páginas antigas. (Imagem: Internet Archive/Reprodução)O relatório aponta, ainda, o The Guardian como outro grande veículo com restrições ao mecanismo. O jornal britânico exclui seu conteúdo da API do Internet Archive e filtra notícias da interface do Wayback Machine, dificultando o acesso às versões arquivadas.Também há menção ao Reddit, que implementou o bloqueio da raspagem de dados e comentários em meados do ano passado. Na ocasião, a rede social alegou que empresas de IA se aproveitavam do banco de dados digital para violar políticas de privacidade e acessar as conversas de usuários.Em busca de acordoTemendo que os bloqueios causem danos históricos ao impedir o arquivamento de páginas, o diretor do Wayback Machine, Mark Graham, disse que a plataforma tenta reverter o cenário. Há conversas em andamento com o Times e outros veículos na tentativa de fazê-los mudar de ideia."Não há dúvida de que o bloqueio generalizado de cada vez mais partes da web pública está afetando a capacidade da sociedade de compreender o que está acontecendo no mundo", afirmou.Enquanto isso, uma coalizão formada por mais de 100 jornalistas divulgou uma carta de apoio ao Internet Archive. O grupo pede que o valor da ferramenta seja reconhecido e o trabalho mantido sem restrições.Siga no TecMundo e conheça mais detalhes sobre o Wayback Machine e outras plataformas que possibilitam visualizar versões antigas de sites e páginas que não existem mais.