Pular para o conteúdo
Made For Builders iconoMade For Builders

DefinedTerm · Glossário

O que é llms.txt

llms.txt é um arquivo de texto na raiz de um site que fornece aos grandes modelos de linguagem um índice estruturado do conteúdo mais relevante, em formato markdown. Proposto por Jeremy Howard em setembro de 2024, já conta com adoção superior a 844 mil domínios segundo o BuiltWith (novembro 2025), embora experimentos publicados pelo Search Engine Land não tenham detectado rastreamento ativo pelos quatro principais motores de IA durante dez semanas de monitoramento.

edu-lopez-paradaPublicado Actualizado

Definição ampliada

llms.txt é um arquivo em formato markdown colocado na raiz do domínio com o objetivo de oferecer aos modelos de linguagem um mapa curado do conteúdo mais importante do site. O formato define uma seção obrigatória — um H1 com o nome do site seguido de um parágrafo descritivo — e seções opcionais que agrupam recursos por categoria com links para páginas markdown acessíveis publicamente.

Diferentemente do robots.txt, o llms.txt não controla o acesso de crawlers: ele declara o que o proprietário considera canônico para fins de treinamento ou citação. A analogia mais precisa é a de um briefing editorial enviado diretamente ao modelo, não um portão de segurança.

Por que importa em 2026

O Search Engine Land publicou em novembro de 2025 um experimento de dez semanas com o arquivo ativo em cinquenta sites. Nenhum dos quatro principais motores avaliados — ChatGPT, Perplexity, Claude e Gemini — realizou requisições detectáveis ao arquivo durante a janela de observação.

Um estudo da Ahrefs conduzido por Linehan e Guan com 75.000 marcas (12 de dezembro de 2025) mede a correlação entre presença de llms.txt e visibilidade em IA em apenas 0,127 — o sinal individual mais fraco entre os oito fatores analisados. Para comparação, ter um canal no YouTube correlaciona em 0,737.

A conclusão prática: implementar llms.txt tem custo baixo e não prejudica, mas não deve ser tratado como alavanca prioritária de visibilidade até que os motores confirmem leitura ativa do arquivo.

Como funciona

  1. Criar o arquivo llms.txt na raiz do domínio.
  2. Abrir com um H1 contendo o nome do site e um parágrafo descritivo.
  3. Organizar seções temáticas com links para versões markdown de cada página relevante.
  4. Servir cada link como /caminho/index.md acessível publicamente sem autenticação.
  5. Manter o arquivo atualizado a cada publicação de conteúdo relevante.

Diferença com robots.txt e sitemap.xml

ArquivoFunção principalQuem lêEstado em 2026
robots.txtControle de acesso para crawlers por rotaTodos os crawlersPadrão maduro (RFC 9309)
sitemap.xmlÍndice de URLs para indexaçãoCrawlers de motores de buscaPadrão maduro
llms.txtÍndice curado de conteúdo para LLMsLLMs (em teoria)Adoção emergente, rastreamento não confirmado

Termos relacionados

ai.txt, AEO (Answer Engine Optimization), GEO (Generative Engine Optimization).

Fuentes

Términos relacionados

  • ai-txt
  • aeo-answer-engine-optimization
  • geo-generative-engine-optimization