A empresa de inteligência artificial (IA) Anthropic, dona do chatbot Claude e do grande modelo de linguagem Sonnet, está no centro de uma polêmica no mercado literário. O caso envolve o treinamento da plataforma e a preservação de livros físicos.De acordo com uma ação judicial nos Estados, a companhia comprou milhões de livros e destruiu todas as cópias com um único objetivo: escanear as páginas para digitalizar o conteúdo e alimentar a base de dados da IA com esse material.O caso foi relatado em um processo movido por um grupo de escritores em San Francisco, na Califórnia, que acusava a Anthropic de infração de direitos autorais ao absorver o conteúdo dos livros sem a devida autorização — um tipo de ação cada vez mais comum contra IAs, mas com decisões que parecem pender para o lado das companhias.Leia também: Dona do ChatGPT diz que é 'impossível' treinar IA só com domínio público; entendaA companhia foi considerada inocente da acusação principal, com o argumento de que o uso dos livros compradas do varejo para treinar uma IA é legal por ela ter respeitado o princípio da aquisição da obra, mesmo sem a devida permissão dos autores. Ela usou na defesa a chamada “doutrina da primeira venda”, um princípio jurídico dos EUA que dá ao consumidor direto uma série de direitos sobre o que fazer com o produto adquirido.O processo de digitalização de livrosDe acordo com os documentos do processo obtidos pelo site Arstechnica, a Anthropic começou o projeto em fevereiro de 2024. O primeiro passo foi a contratação de Tom Turvey, que antes trabalhava como gerente de parcerias no processo de escaneamento de livros do projeto Google Books.Em seguida, ela adquiriu de forma massiva lotes inteiros de livros, a maior parte deles usados. Mesmo sem detalhes específicos do valor, sabe-se que foram gastos “muitos milhões de dólares” no projeto.O Claude é uma das grandes IAs generativas do mercado atual. (Imagem: GettyImages)Saiba mais: ChatGPT: como a IA gera dinheiro para a OpenAI, já que ela é de graça?As obras tiveram as páginas todas retiradas da borda ou lombada do livro, cortadas para ter a dimensão correta do scanner e depois digitalizadas por um sistema que converte os arquivos PDF já com textos reconhecidos e extraídos. Ao fim do processo, todos os originais em papel foram descartados, também sem mais informações sobre o que aconteceu com o material.Por que isso é considerado polêmico?A iniciativa da Anthropic foi recebida com muitas críticas de integrantes do mercado editorial e projetos de preservação literária. Por mais que aparentemente não tenha destruído cópias raras, o descarte massivo de livros inteiros (e de imensas quantidades de papel) é uma ação controversa;Parte do problema está no processo usado pela empresa, que impossibilita a reutilização ou até doação dos livros. Técnicas atuais de escaneamento já são capazes de copiar o conteúdo sem danificar a estrutura da obra, mas elas são mais lentas no processo e, por isso, não foram escolhidas;O Google Livros também usa uma câmera que não danifica as obras, além de emprestar (e devolver) a maior parte do catálogo digitalizado de bibliotecas regionais;A ação ainda é criticada pelo objetivo da companhia: alimentar a IA com o máximo de livros possíveis sobre os mais variados tópicos antes de regularizar essa situação, deixando para tentar resolver a questão mais tarde nos tribunais;A OpenAI, dona do ChatGPT, atualmente enfrenta ações parecidas pelo mesmo motivo. Porém, ela também busca ações mais regulares na área, como em uma parceria com a Universidade de Harvard para usar o acervo digital de obras antigas da instituição;Apesar de ter escapado da principal acusação, a Anthropic ainda precisará responder por baixar ilegalmente 7 milhões de livros piratas para “construir uma biblioteca de pesquisa”, em uma decisão que deve sair no fim de 2025. A Meta também encara acusações parecidas de download de obras ilegais;Ao que tudo indica, a companhia já escapou do que seria o caso mais problemático, além de ter criado um precedente jurídico para outras empresa de IA do mercado.