Coluna Margens e Livros com Marcos Linhares

O Google Books foi só o começo

Coluna Margens e Livros com Marcos Linhares

O Tribunal do Conselho Administrativo de Defesa Econômica (Cade) aprovou, por unanimidade, no dia 23 de abril, a instauração de um processo administrativo contra o Google para investigar possíveis práticas anticompetitivas envolvendo o uso de conteúdo jornalístico e inteligência artificial (IA).

Essa ação contra o Google no Cade motivada pelo uso de conteúdo jornalístico sem remuneração adequada na engrenagem da inteligência artificial, não nasce isolada. 

Ela integra uma disputa mundial que envolve jornais, fotógrafos, editoras, escritores, músicos, artistas visuais e plataformas digitais. 

A pergunta que parecia exagerada há poucos anos agora é central: uma empresa pode copiar milhões de obras protegidas, transformar esse acervo em combustível tecnológico, criar produtos bilionários a partir dele e depois dizer que nada deve aos autores porque não está vendendo o livro, a reportagem, a fotografia ou a música original? 

A resposta ainda está sendo discutida nos tribunais. Mas o histórico dos livros mostra que essa briga começou antes da IA generativa e ficou muito mais grave depois dela.

Livros

O primeiro precedente teve início a partir de 2004, quando o Google começou a digitalizar milhões de livros de bibliotecas universitárias, incluindo obras protegidas por direitos autorais, sem pedir permissão explícita aos autores (projeto Google Books).

Segundo eles, o objetivo era criar um banco de dados pesquisável. Então, em 2005, nasce o caso Authors Guild v. Google, processo aberto em 2005 pelo Authors Guild (Sindicato dos Autores)contra o Google, alegando violação massiva de direitos autorais (copyright). 

Em 2013, o juiz Denny Chin, do Tribunal Distrital do Sul de Nova York entendeu que o projeto do Google era “fair use”, ou seja, o interesse público em usar a obra para fins específicos prevalece sobre a exclusividade do autor naquele caso concreto.

O magistrado acatou o argumento de que o Google não estava republicando os livros para auferir lucro, mas sim criando uma ferramenta de pesquisa funcional (um índice) que permite aos usuários encontrar termos e ver pequenos trechos. 

E o pior, o juiz considerou que o serviço funcionava como um “catálogo de fichas da era digital”, ajudando pessoas a encontrar livros e, potencialmente, aumentando as vendas e não substituindo o mercado dos livros. Ou seja, o Google bonzinho, de graça investiu para “aumentar as vendas dos livros”. É tão absurdo, que prefiro continuar com o texto.

Em 2015, a Corte de Apelações do Segundo Circuito confirmou a decisão. Estranhamente, a Suprema Corte dos Estados Unidos recusou-se a reexaminar o caso em 2016, deixando a vitória do Google de pé.

Esse precedente é importante porque abriu uma porta conceitual perigosa. O Google copiou livros inteiros sem autorização, mas venceu porque convenceu a Justiça de que a finalidade era transformadora, limitada e socialmente útil. 

Naquele momento, o conflito parecia restrito à indexação, ou seja, o livro era copiado para ser encontrado. A inteligência artificial mudou essa equação. Agora, a cópia não serve apenas para localizar trechos, ela serve para treinar sistemas capazes de produzir textos, resumos, respostas, paráfrases, análises e até obras concorrentes. 

O conteúdo deixou de ser para suposta referência (até hoje não engulo essa história) e passou a ser matéria-prima.

Pirataria 

Em 2024, editoras educacionais como Cengage, Macmillan Learning, McGraw Hill e Elsevier processaram o Google em Nova York no caso Cengage Learning Inc. v. Google LLC. 

A acusação é de pirataria de livros digitais. Segundo as editoras, o Google teria promovido, por meio de anúncios e resultados de busca, cópias piratas de livros didáticos, ignorando milhares de notificações de violação e lucrando com esse ecossistema. 

O processo ainda está em curso, com parte das alegações rejeitada em 2025, mas sem encerramento total. 

A terceira frente é mais próxima do tema da coluna: Google, Gemini e livros usados para IA. Em 2026, as editoras Hachette Book Group e Cengage Group pediram para entrar em uma ação coletiva já existente contra o Google, originalmente movida por autores e artistas visuais. A acusação é direta: o Google teria usado obras protegidas para treinar seus modelos generativos, incluindo o Gemini, sem licença, autorização ou pagamento. A Association of American Publishers informou que as editoras querem representar todos os editores cujos direitos teriam sido violados. A ação ainda está em curso.

Treinamento de IA

Fora do Google, o caso mais forte até agora é Bartz v. Anthropic. Autores como Andrea Bartz (“Nunca estivemos aqui”),  Charles Graeber (“O enfermeiro da noite”) e Kirk Wallace Johnson (“The Feather Thief”) processaram a Anthropic, criadora do app Claude, acusando a empresa de usar livros pirateados para treinamento de IA. 

O juiz William Alsup fez uma distinção decisiva. De um lado, entendeu que treinar IA com livros adquiridos legalmente poderia ser “fair use”. De outro, permitiu o avanço das acusações relacionadas à obtenção e armazenamento de obras pirateadas. 

A Anthropic aceitou um acordo de US$ 1,5 bilhão, com pagamento estimado de cerca de US$ 3 mil por livro para aproximadamente 465 mil obras. O acordo foi tratado como uma das maiores recuperações de copyright da história dos Estados Unidos. 

A vez da META

Outro caso fundamental é Kadrey v. Meta, movido por autores, entre eles Richard Kadrey (série “Sandman Slim”), Sarah Silverman (“The Bedwetter”) e Ta-Nehisi Coates (“Entre o mundo e eu”), contra a Meta pelo uso de livros no treinamento do modelo Llama. 

Em junho de 2025, o juiz Vince Chhabria decidiu a favor da Meta, entendendo que, naquele processo específico, os autores não conseguiram demonstrar de forma suficiente o dano ao mercado. 

Contudo, a vitória da Meta veio com uma advertência importante. O juiz deixou claro que a decisão não deveria ser lida como autorização ampla para empresas treinarem IA com obras protegidas. 

A Meta safou-se mais devido à fragilidade da prova apresentada do que a uma absolvição moral ou definitiva da prática. Essa é a minha modesta avaliação.

 A briga continua nos tribunais

Freepik

Também estão em curso ações contra a OpenAI. 

Em Authors Guild v. OpenAI, a Authors Guild, ao lado de autores renomados como John Grisham (“O dossiê pelicano”), George R.R. Martin (“As Crônicas de Gelo e Fogo”), Jodi Picoult (“Uma guardiã para minha irmã”), Jonathan Franzen (“As correções”) e George Saunders (“Lincoln no Limbo”), acusou a empresa de usar livros protegidos para treinar o ChatGPT. 

A ação foi apresentada em 2023 e depois passou a incluir a Microsoft como ré. O processo segue sem julgamento final. 

Em casos relacionados, como Tremblay v. OpenAI e Silverman v. OpenAI, algumas alegações foram parcialmente rejeitadas, mas a disputa sobre uso de obras protegidas em treinamento de IA continua em discussão. 

E já neste ano

Há ainda processos mais recentes ampliando o campo de batalha. Em março de 2026, a editora de Chicken Soup for the Soul processou várias empresas, incluindo Apple, Google, Nvidia, Meta, OpenAI, Anthropic, Perplexity e xAI, alegando uso de cópias pirateadas de seus livros para treinar sistemas de IA. 

A tese é simbólica: livros de narrativa pessoal, com forte apelo emocional e linguagem em primeira pessoa, seriam especialmente valiosos para ensinar máquinas a simular sensibilidade humana. O processo está em fase inicial. 

O que se vê, portanto, é um padrão. 

Primeiro, as plataformas copiaram para organizar a internet. Depois, para dominar a atenção. E agora, copiam para produzir linguagem. O caso Google Books foi vencido pelo Google porque a Justiça entendeu que a ferramenta não substituía o livro. 

A IA generativa torna essa defesa mais frágil. Um mecanismo de busca leva o leitor ao conteúdo. Um chatbot pode responder no lugar dele. Um índice aponta para a obra. Um modelo treinado com a obra pode absorver seu valor e apagar sua origem.

De volta à ação do CADE

É por isso que a ação no Cade importa. A discussão não é  apenas autoral, mas econômica, concorrencial e democrática. 

Quando uma empresa controla a busca, distribui audiência, recolhe dados, treina modelos e ainda decide quanto vale o conteúdo produzido pelos outros, o problema não é mais de contrato privado entre autor e plataforma. Passa a ser uma questão de assimetria estrutural: jornais perdem tráfego; editoras, mercado; escritores, remuneração; e o público, diversidade. A tecnologia, antes apresentada como neutra, nasce apoiada numa apropriação gigantesca de trabalho intelectual.

A pergunta que fica para o Brasil é simples e incômoda: vamos esperar que o mercado editorial seja sugado como parte da imprensa já foi ou vamos construir regras antes que a dependência seja irreversível? 

A experiência internacional mostra que autores e editoras estão reagindo, alguns com derrotas, outros com acordos bilionários, muitos ainda esperando sentença. 

Mas a briga já começou. E, desta vez, trata-se de saber quem tem o direito de transformar livros em combustível invisível para máquinas que escrevem, resumem, respondem e lucram.

Marcos Linhares é jornalista, escritor, professor e biógrafo. Atua há mais de duas décadas na promoção da leitura, políticas do livro e formação de autores. Foi presidente do Sindicato dos Escritores do DF e já coordenou a Feira do Livro de Brasília, projetos literários no DF e iniciativas educativas. É autor premiado nos Estados Unidos. Criou prêmios, programas e ações voltadas ao direito autoral, ao livro e à democratização da literatura.
linhares@marcoslinhares.com.br
marcoslinhares.com.br
@marcosslinhares

Paula Rocha

Editora chefe do Jornal Diário do Entorno

Artigos Relacionados

Botão Voltar ao Topo