DefinedTerm · Glosario
Qué es llms.txt
llms.txt es un archivo de texto en la raíz de un sitio web que proporciona a los modelos de lenguaje grandes un índice estructurado del contenido más importante del sitio, en formato markdown. Fue propuesto por Jeremy Howard en septiembre 2024 como estándar emergente. A noviembre 2025, BuiltWith reporta 844.000 sitios con llms.txt activo, pero las pruebas de Search Engine Land sobre 10 semanas no detectaron rastreo activo por los cuatro grandes motores de IA.
Definición ampliada
llms.txt sigue un formato markdown estructurado con secciones obligatorias y opcionales. La sección obligatoria es un H1 con el nombre del sitio y un párrafo descriptivo. Las secciones opcionales agrupan recursos por categoría con enlaces a páginas markdown del sitio.
A diferencia de robots.txt, no controla qué pueden rastrear los bots: orienta qué contenido consideramos canónico para entrenamiento o citación.
Por qué importa (o no) en 2026
Search Engine Land publicó en noviembre 2025 un experimento de 10 semanas sirviendo llms.txt en 50 sitios. Ninguno de los cuatro grandes motores (ChatGPT, Perplexity, Claude, Gemini) hizo requests detectables al archivo durante la ventana.
El estudio de Ahrefs (Linehan + Guan, 75.000 marcas, 12 diciembre 2025) sitúa la presencia de llms.txt en correlación 0,127 con visibilidad IA — la señal individual más débil del top 8. Por contexto, YouTube channel obtiene 0,737.
Diferencia con robots.txt y sitemap.xml
| Archivo | Función principal | Quién lo lee | Estado en 2026 |
|---|---|---|---|
| robots.txt | Control de acceso a crawlers | Todos los crawlers | Estándar maduro |
| sitemap.xml | Índice de URLs para indexación | Crawlers de motor de búsqueda | Estándar maduro |
| llms.txt | Índice curado para LLMs | LLMs (en teoría) | Adopción emergente, rastreo no confirmado |
Cómo se construye un llms.txt
- Crear archivo
llms.txten la raíz del dominio. - Empezar con H1 del nombre del sitio y un párrafo descriptivo.
- Listar secciones temáticas con enlaces a páginas markdown.
- Servir cada enlace como
/ruta/index.mdaccesible públicamente.
Términos relacionados
ai.txt, AEO, GEO.
Fuentes
Términos relacionados
- ai-txt
- aeo
- geo