DefinedTerm · Glossário
O que é llms.txt
llms.txt é um arquivo de texto na raiz de um site que fornece aos grandes modelos de linguagem um índice estruturado do conteúdo mais relevante, em formato markdown. Proposto por Jeremy Howard em setembro de 2024, já conta com adoção superior a 844 mil domínios segundo o BuiltWith (novembro 2025), embora experimentos publicados pelo Search Engine Land não tenham detectado rastreamento ativo pelos quatro principais motores de IA durante dez semanas de monitoramento.
Definição ampliada
llms.txt é um arquivo em formato markdown colocado na raiz do domínio com o objetivo de oferecer aos modelos de linguagem um mapa curado do conteúdo mais importante do site. O formato define uma seção obrigatória — um H1 com o nome do site seguido de um parágrafo descritivo — e seções opcionais que agrupam recursos por categoria com links para páginas markdown acessíveis publicamente.
Diferentemente do robots.txt, o llms.txt não controla o acesso de crawlers: ele declara o que o proprietário considera canônico para fins de treinamento ou citação. A analogia mais precisa é a de um briefing editorial enviado diretamente ao modelo, não um portão de segurança.
Por que importa em 2026
O Search Engine Land publicou em novembro de 2025 um experimento de dez semanas com o arquivo ativo em cinquenta sites. Nenhum dos quatro principais motores avaliados — ChatGPT, Perplexity, Claude e Gemini — realizou requisições detectáveis ao arquivo durante a janela de observação.
Um estudo da Ahrefs conduzido por Linehan e Guan com 75.000 marcas (12 de dezembro de 2025) mede a correlação entre presença de llms.txt e visibilidade em IA em apenas 0,127 — o sinal individual mais fraco entre os oito fatores analisados. Para comparação, ter um canal no YouTube correlaciona em 0,737.
A conclusão prática: implementar llms.txt tem custo baixo e não prejudica, mas não deve ser tratado como alavanca prioritária de visibilidade até que os motores confirmem leitura ativa do arquivo.
Como funciona
- Criar o arquivo
llms.txtna raiz do domínio. - Abrir com um H1 contendo o nome do site e um parágrafo descritivo.
- Organizar seções temáticas com links para versões markdown de cada página relevante.
- Servir cada link como
/caminho/index.mdacessível publicamente sem autenticação. - Manter o arquivo atualizado a cada publicação de conteúdo relevante.
Diferença com robots.txt e sitemap.xml
| Arquivo | Função principal | Quem lê | Estado em 2026 |
|---|---|---|---|
| robots.txt | Controle de acesso para crawlers por rota | Todos os crawlers | Padrão maduro (RFC 9309) |
| sitemap.xml | Índice de URLs para indexação | Crawlers de motores de busca | Padrão maduro |
| llms.txt | Índice curado de conteúdo para LLMs | LLMs (em teoria) | Adoção emergente, rastreamento não confirmado |
Termos relacionados
ai.txt, AEO (Answer Engine Optimization), GEO (Generative Engine Optimization).
Fuentes
Términos relacionados
- ai-txt
- aeo-answer-engine-optimization
- geo-generative-engine-optimization