Quando algoritmos decidem o que sabemos

Wait 5 sec.

TL;DR: As IAs generativas estão transformando fundamentalmente como descobrimos informação, criando um novo paradigma onde o conteúdo é filtrado por algoritmos antes de chegar aos usuários. Esta mudança exige que publishers repensem estratégias de SEO e desenvolvam novas abordagens para garantir visibilidade em um mundo dominado por respostas geradas por IA. Contudo, essa transformação traz riscos importantes sobre qualidade da informação que demandam um olhar atento.O que os dados revelam sobre citações de IADois estudos recentes iluminam essa transformação radical no consumo de informação. O relatório "What is AI Reading" da Muck Rack, desenvolvido com foco em agências de relações públicas para orientar como marcas devem navegar em um cenário onde conteúdo gerado por usuários ganha protagonismo, analisou mais de 1 milhão de citações de sistemas de IA.Paralelamente, a análise da Semrush divulgada pela Visual Capitalist identificou os domínios mais referenciados por modelos de linguagem. Embora o estudo da Muck Rack tenha sido concebido para profissionais de PR, aplicamos aqui uma lente editorial, examinando os achados através da perspectiva de publishers e criadores de conteúdo.A transição do comportamento de busca tradicional para respostas diretas geradas por IA representa uma ruptura histórica no consumo de informação. Se o fenômeno zero-click já reduzia drasticamente o tráfego orgânico para publishers, agora testemunhamos algo ainda mais radical. Um cenário onde a própria interface de busca está sendo substituída por conversas com assistentes inteligentes.Esta transformação não é apenas tecnológica, é epistemológica. Estamos redefinindo como a humanidade acessa e processa conhecimento, criando intermediários artificiais entre nós e as fontes originais de informação. A pergunta que me tira o sono é como nos preparamos para lidar com as consequências ou nos anteciparmos a elas.A nova anatomia das citações de IAO estudo da Muck Rack, que analisou mais de 1 milhão de links citados por sistemas de IA generativa, revelou que habilitar ou desabilitar a capacidade de busca na web muda dramaticamente as respostas da IA. Não se trata apenas de adicionar fontes, mas de alterar fundamentalmente o conteúdo das respostas. Isso levanta uma questão importante: como interpretar o que é correto ou confiável quando a mesma pergunta produz respostas completamente diferentes dependendo de configurações técnicas?Segundo o estudo, quando perguntado sobre "o pior time de baseball da MLB", o ChatGPT sem citações responde: "Os New York Mets de 1962 detêm o recorde da pior temporada na história da MLB, com 40 vitórias e 120 derrotas." Com citações habilitadas, a resposta muda completamente: “Chicago White Sox de 2024: Na era moderna, o White Sox estabeleceu um novo recorde com 41 vitórias e 121 derrotas”.Não é só uma adição de fontes, mas uma transformação na natureza da resposta. Isso significa que a IA não apenas sugere um link, mas processa a informação e a apresenta diretamente. As citações não apenas validam informações, elas moldam ativamente o que a IA "sabe" e comunica.O paradoxo da autoridade digitalOs dados revelam contradições sobre como a autoridade funciona na era da IA. Enquanto 95% das citações provêm de mídia não paga, com 27% sendo conteúdo jornalístico, a distribuição por outlets mostra fragmentação extrema. Apenas 15% das fontes aparecem consistentemente entre os top 10 de múltiplas indústrias.Reuters, Associated Press e Financial Times dominam as citações gerais, mas cada setor desenvolve suas próprias hierarquias.Esta especialização setorial representa tanto oportunidade quanto ameaça para publishers. No último artigo, falei sobre a dispersão da audiência e a redefinição do discovery, e sobre como algoritmos de IA transformam como conteúdo é descoberto, priorizando relevância semântica sobre métricas tradicionais de SEO. Sites menores com conteúdo altamente específico ganham visibilidade que seria impossível no modelo anterior de indexação baseado em autoridade de domínio.Os dados por setor revelam padrões específicos. Em finanças, o jornalismo responde por 37% das citações, com Claude mostrando 90% de suas principais fontes sendo únicas do setor. Na saúde, sites governamentais representam 18% das citações, o dobro da média geral. Tecnologia praticamente elimina fontes acadêmicas, priorizando plataformas como Medium e Coursera que refletem conhecimento prático.A autoridade generalista não garante mais visibilidade universal, a expertise em nichos específicos torna-se o diferencial competitivo. Para publishers, isso implica que ser citado pela IA significa fazer parte da próxima geração de busca, colocando seu conteúdo diante de usuários que talvez nunca visitem seu site, mas confiam no modelo que o referencia.A tirania da recênciaA análise temporal das citações expõe outro possível viés: a obsessão por atualidade. Modelos da OpenAI priorizam conteúdo dos últimos 12 meses, com 56% das citações jornalísticas nesta faixa temporal. Os modelos da Anthropic são menos tendenciosos (36%), mas ainda favorecem claramente material recente.Para publishers, isso significa uma corrida constante e complexa. Conteúdo evergreen, tradicionalmente valioso para SEO, perde relevância na economia da inteligência artificial. A pressão por atualizações constantes intensifica custos operacionais justamente quando as receitas baseadas em tráfego enfrentam pressão descendente.Quando conteúdo não moderado governa respostas de IAO aspecto que mais chama atenção na pesquisa é a dependência crescente das IAs em conteúdo gerado por usuários. A análise da Semrush, destacada pela Visual Capitalist, mostra que Reddit lidera com 40,1% das citações, seguido por Wikipedia (26,3%), dominando a lista dos sites mais citados pelas IAs para fatos. Plataformas onde qualquer pessoa pode publicar qualquer coisa tornaram-se as fontes primárias de "conhecimento" para sistemas que bilhões de pessoas vão consultar diariamente.Essa prevalência é um alerta e apresenta riscos significativos. Diferentemente do jornalismo profissional, que opera sob códigos éticos e processos editoriais, o conteúdo gerado por usuários não possui filtros de qualidade institutionalizados. Um comentário bem formulado no Reddit pode influenciar respostas de IA tanto quanto um artigo investigativo do New York Times.Os riscos incluem propagação de desinformação, amplificação de câmaras de eco e orientações não confiáveis em tópicos sensíveis como saúde ou finanças. Casos já documentados incluem IAs sugerindo misturas perigosas de produtos químicos domésticos, baseadas em discussões não verificadas em fóruns online.Além do SEO. O nascimento do GEOA otimização para mecanismos generativos (GEO – Generative Engine Optimization) aparece como disciplina essencial, mas ainda embrionária. Diferentemente do SEO tradicional, que visa ranqueamento em listas de resultados, o GEO busca inclusão em respostas formuladas por IA.As estratégias iniciais incluem:Recência estratégica: priorizar atualizações frequentes com foco temporal diferenciado por modelo de IA;Estruturação semântica avançada: organizar conteúdo para facilitar processamento algorítmico;Autoridade contextual: desenvolver expertise em nichos específicos com dados exclusivos;Diversificação de formatos: criar conteúdo híbrido para consumo humano e processamento por IA.Uma estratégia sólida de SEO, com estrutura clara, uso relevante de palavras-chave, marcação de dados e construção de autoridade, garante que o conteúdo seja bem indexado e facilmente compreendido pela IA. Isso é essencial para que a IA "leia" e cite seu conteúdo, mesmo que não gere um clique direto.O SEO não perde sua importância, ele se torna a infraestrutura sobre a qual o GEO é construído.O dilema existencial dos publishersA transição da busca tradicional para a era das respostas diretas da IA intensifica o desafio do fenômeno zero-click, transformando a meta de "aparecer nos primeiros resultados da busca" para "ser digno de citação pela IA". Para os publishers, essa é uma oportunidade e um risco.A intermediação da IA entre usuários e conteúdo original representa uma ameaça existencial para publishers. Se as respostas da IA eliminam a necessidade de visitar sites originais, como os criadores de conteúdo monetizam seu trabalho?A solução não pode ser puramente técnica. Requer reconfiguração fundamental dos modelos de negócio, priorizando relacionamentos diretos com audiências através de newsletters, memberships e produtos de dados especializados.Estratégias de crescimento na era pós-buscaPara publishers e empresas de mídia, a adaptação exige mudanças estruturais:Diversificação de receita: reduzir dependência de tráfego orgânico através de assinaturas, eventos, consultoria e produtos de dados proprietários;Autoridade em nichos: Concentrar recursos em áreas de expertise específicas onde a profundidade supera a amplitude;Relacionamento direto: Construir audiências próprias através de newsletters, podcasts e comunidades, reduzindo dependência de intermediários;Colaboração estratégica: Estabelecer parcerias com desenvolvedores de IA para garantir citação adequada e potencial compensação.O futuro da descoberta de informaçãoEstamos testemunhando não apenas uma mudança tecnológica, mas uma reorganização fundamental da distribuição e democratização da informação. A IA não está simplesmente melhorando a busca, mas tem potencial para substituí-la por um novo hábito de busca por conteúdo completamente diferente.Esta transformação levanta questões que transcendem negócios individuais. Como garantir diversidade de perspectivas quando algoritmos determinam quais fontes detêm autoridade sobre o tema? Como manter a qualidade da informação quando o conteúdo gerado por usuários governa as respostas?the 42* questionEm um mundo onde algoritmos de IA mediam nossa relação com o conhecimento e onde sistemas obscuros determinam o que consideramos verdadeiro, quem realmente controla o que sabemos? E mais importante ainda, estamos preparados para as consequências de entregar o curadoria do conhecimento humano a sistemas que não compreendemos completamente?*"42 é a resposta. Mas, creio que o problema, para ser bem honesto, é que você nunca soube qual era a pergunta", Brian Adams.Perguntas e Respostas1. Como a IA está mudando o comportamento de descoberta de informação?A IA está substituindo a busca tradicional por interfaces conversacionais que fornecem respostas diretas, eliminando a necessidade de visitar múltiplas fontes. Esta mudança representa uma evolução do fenômeno zero-click para um cenário de "zero-search", onde usuários obtêm informações através de diálogos com assistentes artificiais em vez de navegar por listas de resultados.2. Quais tipos de conteúdo têm maior chance de ser citado por IAs?Conteúdo jornalístico de alta autoridade representa 27% das citações, especialmente de outlets como Reuters e Associated Press, com forte preferência por material publicado nos últimos 12 meses. Conteúdo especializado por setor também apresenta vantagens competitivas, com cada indústria desenvolvendo hierarquias próprias de fontes preferenciais.3. Por que o conteúdo gerado pelo usuário domina as citações de IA?Plataformas como Reddit (40,1%) e Wikipedia (26,3%) oferecem volume massivo de conteúdo constantemente atualizado, formatado de maneira acessível para processamento por IA. No entanto, isso cria riscos significativos de qualidade e veracidade da informação, pois estas fontes não possuem os filtros editoriais do jornalismo profissional.4. Como publishers podem se adaptar a esta nova realidade?Desenvolvendo estratégias de GEO (Generative Engine Optimization), focando em expertise setorial, mantendo alta frequência de atualização, e construindo relacionamentos diretos com audiências através de newsletters e plataformas próprias para reduzir dependência de tráfego orgânico. A diversificação de receita torna-se essencial para sobrevivência.5. Qual o impacto econômico desta mudança para a indústria de conteúdo?A intermediação da IA ameaça o modelo econômico baseado em tráfego dos publishers, exigindo pivotagem para modelos de receita direta (assinaturas, memberships) e criação de valor que não possa ser facilmente replicado por sistemas automatizados. Isso representa uma reconfiguração fundamental da cadeia de valor do conteúdo digital.