A pirataria bilionária
Coluna Margens e Livros com Marcos Linhares

Durante anos, a pirataria foi tratada como crime quando vinha de baixo. O estudante que baixava PDF ilegal, o leitor que compartilhava livros escaneados, o camelô que vendia cópias improvisadas em bancas de rua, todos eram apresentados como ameaça à cadeia produtiva da cultura. Agora, o debate ganhou outra dimensão: empresas bilionárias de tecnologia começam a ser acusadas de fazer exatamente a mesma coisa em escala industrial.
No dia 5 de maio, cinco grandes editoras internacionais moveram nova ação judicial contra a Meta, empresa de Mark Zuckerberg, acusando a companhia de utilizar milhões de livros pirateados para treinar seus sistemas de inteligência artificial. Entre os envolvidos estão gigantes como Hachette, Macmillan, Elsevier, Cengage e McGraw Hill. O processo também conta com Scott Turow, escritor consagrado e ex-presidente da Authors Guild, uma das entidades mais importantes de defesa dos autores nos Estados Unidos.
A diferença e$tá no faturamento
As acusações são devastadoras. Segundo o processo, a Meta teria utilizado acervos clandestinos de plataformas conhecidas por hospedar material pirateado, como LibGen e Sci-Hub, para alimentar o treinamento do modelo de IA Llama. A ação afirma ainda que Zuckerberg teria autorizado pessoalmente o uso do material depois do fracasso em negociações de licenciamento com editoras.
A questão deixa de ser apenas tecnológica, afinal, qual é a diferença entre um usuário comum baixando um livro ilegalmente e uma empresa super poderosa utilizando milhões de obras sem autorização para desenvolver produtos comerciais avaliados em bilhões de dólares?
A resposta, aparentemente, depende do tamanho do faturamento.
O mais impressionante é que parte do Vale do Silício tenta enquadrar esse processo dentro da ideia de “uso transformativo”, alegando que a inteligência artificial não copia exatamente os livros, mas aprende padrões de linguagem a partir deles. É uma tese sofisticada no discurso, mas extremamente conveniente na prática, já que cria uma zona cinzenta onde a produção intelectual humana vira matéria-prima gratuita para sistemas privados.
Apagaram os dados de direito autoral. Por que será?
O problema é que os novos processos começam a desmontar essa narrativa. As editoras afirmam que houve remoção deliberada de informações de copyright e ocultação da origem dos arquivos utilizados. Não seria apenas uma discussão filosófica sobre inovação tecnológica, mas uma acusação concreta de uso consciente de material pirateado.
Durante décadas, gigantes da tecnologia se apresentaram como defensoras da legalidade digital. Derrubaram conteúdos, bloquearam perfis, desenvolveram sistemas automatizados de proteção de direitos autorais e pressionaram governos em nome da propriedade intelectual. Agora, parte dessas mesmas empresas é acusada de recorrer justamente à lógica da pirataria para acelerar a corrida da inteligência artificial.
Precarizando a matéria-prima
Mais grave ainda é perceber que a IA depende exatamente do trabalho humano que ela própria ajuda a precarizar. Sem escritores, jornalistas, pesquisadores, tradutores, roteiristas, poetas e editoras, não existe material para treinamento. Os sistemas reorganizam conteúdos produzidos por milhões de pessoas ao longo de décadas.
A tecnologia que prometia independência criativa talvez seja, na verdade, a ferramenta mais dependente da produção intelectual humana já criada.
A lacuna da legislação
Há outro ponto pouco discutido nessa corrida: o treinamento de inteligência artificial exige quantidade colossal de dados. Não bastam alguns livros, são milhões de páginas, artigos, romances, ensaios, reportagens, pesquisas acadêmicas e documentos diversos. Isso cria uma pressão gigantesca por captura indiscriminada de conteúdo. O problema é que a legislação mundial simplesmente não acompanhou essa velocidade.
Governos ainda discutem regras básicas enquanto empresas avançam sobre bibliotecas inteiras.
O caso envolvendo a Meta pode se tornar um divisor histórico porque ele desloca o debate da abstração tecnológica para algo muito concreto: propriedade intelectual, remuneração e concentração de poder. Quando uma empresa desse tamanho utiliza acervos pirateados para desenvolver sistemas comerciais, trata-se de um modelo econômico construído sobre apropriação irregular de conteúdo.
E talvez esteja surgindo uma pergunta que o mercado editorial fará cada vez mais nos próximos anos: quem continuará produzindo conhecimento, literatura e pesquisa se o próprio sistema começar a tratar criação intelectual como recurso infinito, gratuito e descartável?
Durante muito tempo, disseram que o problema da pirataria estava nos usuários comuns. Agora, o mundo começa a descobrir que talvez ela tenha apenas mudado de endereço.
Marcos Linhares é jornalista, escritor, professor e biógrafo. Atua há mais de duas décadas na promoção da leitura, políticas do livro e formação de autores. Foi presidente do Sindicato dos Escritores do DF e já coordenou a Feira do Livro de Brasília, projetos literários no DF e iniciativas educativas. É autor premiado nos Estados Unidos. Criou prêmios, programas e ações voltadas ao direito autoral, ao livro e à democratização da literatura.
linhares@marcoslinhares.com.br
marcoslinhares.com.br
@marcosslinhares



