llms.txt
Archivo Markdown servido en la raíz de un sitio (/llms.txt) que propone Jeremy Howard en septiembre de 2024 como índice curado para modelos de lenguaje: qué es el sitio, qué documentos importan y dónde están sus versiones en texto plano.
En una analogía · Es como el robots.txt pero para la IA: un mapa limpio que le dice al agente qué leer y dónde, sin el ruido de la web.
También conocido como: llms-txt · llms-full.txt
¿Qué es llms.txt?
llms.txt es una convención propuesta por Jeremy Howard (Answer.AI) en septiembre de 2024: un archivo Markdown en la raíz del dominio (https://tudominio.com/llms.txt) que resume el sitio para un modelo de lenguaje. Resuelve un problema de presupuesto: la ventana de contexto de un modelo es finita, y el HTML de un sitio de documentación gasta la mayor parte en navegación, scripts y markup. El archivo ofrece la versión destilada: qué es esto, qué documentos importan, dónde están.
La convención define dos archivos:
/llms.txt: el índice. Un H1 con el nombre del proyecto, un blockquote con el resumen, y listas de enlaces con una línea de descripción por documento./llms-full.txt: opcional. El contenido completo de la documentación concatenado en un único Markdown, para clientes que prefieren cargarlo todo de una vez.
Estructura mínima
# Acme Design System
> Design system de Acme. 42 componentes, 380 tokens DTCG,
> 7 principios. Versión 3.2.0.
## Docs
- [Tokens](https://ds.acme.com/tokens.json): catálogo DTCG completo
- [Principios](https://ds.acme.com/principles.md): los 7 principios con criterios de aplicación
- [API de componentes](https://ds.acme.com/api/): un JSON por componente público
## Optional
- [Changelog](https://ds.acme.com/changelog.md): historial de versiones
La sección ## Optional tiene semántica definida: señala lo que un cliente puede omitir si el contexto va justo.
Para qué lo usa un design system
Un design system con llms.txt le da a cualquier agente un punto de entrada estable: en una sola petición HTTP obtiene el mapa del sistema y las URLs de los datos en crudo. Sin él, el agente hace scraping de la documentación renderizada y hereda todos sus defectos (menús, banners, markup).
El coste de implantación es el más bajo de toda la pila agéntica: un archivo estático, sin infraestructura. Por eso es el paso 5 de la auditoría AI-readiness: si un sistema no tiene ni esto, lo demás puede esperar.
llms.txt frente a robots.txt, sitemap.xml y MCP
| Archivo | Audiencia | Función |
|---|---|---|
| robots.txt | Crawlers | Qué no indexar |
| sitemap.xml | Buscadores | Qué URLs existen |
| llms.txt | Modelos de lenguaje | Qué leer y en qué orden |
| MCP server | Agentes | Consultas dinámicas y funciones ejecutables |
llms.txt es estático y de lectura; un MCP server es dinámico y puede ejecutar funciones. La secuencia razonable para un equipo: primero llms.txt (una tarde), después MCP (un sprint).
Ver también
- MCP (Model Context Protocol)
- Agente (en diseño de producto)
- Auditoría AI-readiness de un design system en 7 pasos
- Cómo se implementa un MCP server para tu design system
La mini-formación de auditoría AI-readiness incluye la plantilla de llms.txt para design systems junto con la rúbrica de los 7 ejes.
Lecturas de referencia
A seguir