Hemos traducido este artículo del inglés al español. Haz clic aquí para leer el artículo original. Si detectas algún problema en el contenido, no dudes en escribirnos a report-osteam@semrush.com.
¿Qué es LLMs.txt?
El archivo llms.txt es un estándar propuesto destinado a ayudar a los modelos de lenguaje grandes (LLM) a comprender y utilizar mejor el contenido de los sitios web.
Aquí está la especificación oficial :

La idea es bastante sencilla: en lugar de dejar que los rastreadores de IA deambulen por tu sitio, les proporcionas una lista seleccionada de tu contenido más importante. Para indicarle a la IA a qué contenido de tu sitio web debería prestar atención.
Ya contamos con estándares como robots.txt y sitemaps para ayudar a los motores de búsqueda a navegar por los sitios web de manera más eficiente. Lo que diferencia a llms.txt es que está diseñado específicamente para modelos de IA que podrían usar tu contenido para responder preguntas o generar respuestas para los usuarios.
También se especula que la implementación de llms.txt podría dar a los sitios web mayor visibilidad en las respuestas generadas por IA y potencialmente generar más tráfico de referencia.
Antes de analizar llms.txt y determinar si merece la pena implementarlo, entendamos por qué es necesario crear otro estándar web.
¿Qué problema intenta resolver LLMs.txt?
llms.txt está diseñado para ayudar a los rastreadores de IA a navegar por los sitios web de manera más efectiva. En este momento, estos robots rastreadores se enfrentan a dos grandes desafíos:
- Las páginas web modernas son difíciles de leer. La mayoría de los rastreadores de IA solo pueden leer el HTML básico de tus páginas, no el contenido que se carga mediante JavaScript. Eso significa que llms.txt proporciona un formato claro y estructurado que ayuda a los rastreadores de IA a digerir rápidamente la información.
- La mayoría de los sitios web tienen un exceso de información. Cuando los rastreadores de IA visitan su sitio web, no necesariamente saben qué es importante. Si dedican tiempo a rastrear páginas que no son útiles (como entradas de blog antiguas), pueden generar respuestas basadas en información subóptima; llms.txt ayuda a resolver este problema.
llms.txt también puede reducir las ineficiencias en el entrenamiento de modelos de lenguaje grandes.
El entrenamiento de los LLM implica un coste computacional enorme. Con la guía de llms.txt, es menos probable que los LLM desperdicien recursos en contenido irrelevante.
¿Cómo se estructuran los archivos LLMs.txt?
Según el estándar propuesto, los archivos llms.txt deben estar estructurados y formateados en Markdown.
Markdown es un lenguaje de marcado ligero que utiliza una sintaxis de formato de texto plano para crear documentos estructurados. (Es el mismo formato que usan los desarrolladores en los archivos README de GitHub, y los sistemas de IA pueden analizarlo fácilmente).
Algunos elementos comunes de Markdown que usarás en tu archivo llms.txt incluyen:
- # para el encabezado H1, ## para los H2, ### para los H3, y así sucesivamente
- > para citas en bloque para resaltar descripciones importantes
- - o * para viñetas en listas no ordenadas
- [texto](url) para hipervínculos a tu contenido
- : para añadir descripciones junto a los enlaces que ayuden a explicar a qué llevan.
- ``` para bloques de código al compartir ejemplos técnicos
La especificación oficial llms.txt proporciona un ejemplo muy básico de cómo podría ser el aspecto del archivo. Pero si su sitio web es grande o complejo, es posible que desee agregar más estructura: usar H3 y H4 para crear subsecciones, incorporar tablas para organizar los datos o incluir fragmentos de código para demostrar el uso de la API.
No hay nada de malo en eso. Los archivos Markdown son completamente legibles por los rastreadores de IA, así que no hay problema siempre que uses una sintaxis válida. Esta estructura adicional podría, de hecho, proporcionar a los rastreadores de IA más contexto.
Aquí tenéis un ejemplo sencillo que sigue la especificación básica:
# Nombre de la empresa
>Breve descripción de la actividad de su empresa
## Productos
- [Producto 1](https://example.com/product-1): Descripción de este producto
- [Producto 2](https://example.com/product-2): Descripción de este producto
## Documentación
- [Primeros pasos](https://example.com/docs/getting-started): Introducción a nuestra plataforma
- [Referencia de la API](https://example.com/api): Documentación completa de la API¿Utilizan las marcas el estándar LLMs.txt?
Sí, algunas empresas SaaS y orientadas a desarrolladores ya utilizan archivos llms.txt en sus sitios web.
Sin embargo, su adopción general es bastante minoritaria. Según NerdyData, solo 951 dominios (una pequeña fracción de la web) habían publicado un archivo llms.txt hasta julio de 2025.
Aquí tenéis algunos ejemplos de empresas:
| Marca | En qué se centra el archivo | La estructura general |
| Documentación para desarrolladores | Utiliza múltiples niveles de encabezados (#, ##, ###, ####) para dividir el contenido en secciones separadas. También incluye ejemplos de código completos, muchos enlaces y notas útiles a lo largo del texto. En general, da la sensación de ser una base de conocimientos muy completa. | |
| Documentación para desarrolladores | Comienza con líneas descriptivas en la parte superior, como título:, descripción: y etiquetas: para dar una idea sobre la documentación específica que sigue. Y utiliza encabezados claros (#, ##, ###) para organizar el contenido en secciones lógicas. En cada sección encontrarás instrucciones paso a paso y ejemplos prácticos de código. | |
| Documentación para desarrolladores | Utiliza un número reducido de encabezados y crea una estructura muy básica. Consiste principalmente en una larga lista de enlaces y descripciones junto a ellos para ayudar a explicar a qué conducen. | |
| Documentación para desarrolladores | Utiliza encabezados en la parte superior (#, ##) y luego pasa directamente a una lista muy larga de enlaces. Los enlaces no están agrupados en secciones, y no hay subtítulos, resúmenes ni descripciones. |
Observa las diferencias en el enfoque que cada empresa da a su archivo llms.txt. Cada una utiliza una estructura diferente.
No hay nada de malo en esto. Siempre que utilicen Markdown válido, el archivo es legible por máquina y puede ser procesado fácilmente por sistemas de IA.
Además, ninguna de estas empresas tiene un archivo que se centre en su sitio web en su conjunto. Fue una decisión personal. Puedes crear un archivo que se centre en todo tu sitio web o solo en una sección específica.
¿Deberías usar LLMs.txt en tu sitio web?
Probablemente no valga la pena invertir tu tiempo en usar llms.txt ahora mismo, a menos que tengas curiosidad y quieras experimentar.
Actualmente, llms.txt es solo una propuesta de estándar, en lugar de algo que estén utilizando realmente las principales empresas de IA.
Ninguna de las empresas de LLM como OpenAI, Google o Anthropic ha dicho oficialmente que siguen estos archivos cuando rastrean sitios web.
John Mueller, de Google, también lo confirmó en Bluesky:

Dicho esto, hay algunas señales interesantes.
Por ejemplo, Anthropic ha publicado un archivo llms.txt en su propio sitio web. Eso no significa que su rastreador de IA esté utilizando realmente estos archivos, pero sugiere que probablemente al menos estén abiertos a la idea.
Todavía estamos en la fase inicial de especulación, donde la gente está implementando el archivo con la esperanza de que algún día pueda resultar útil.
¿Semrush va a implementar este archivo?
Hemos implementado llms.txt en uno de nuestros sitios hermanos, Search Engine Land, para ver si ofrece alguna ventaja significativa en términos de visibilidad de IA y tráfico. Puedes consultar el archivo aquí si tienes curiosidad.
Realizaremos un seguimiento de los resultados durante los próximos meses y actualizaremos este artículo con nuestras conclusiones.
Si también quieres experimentar con llms.txt en tu propio sitio, a continuación encontrarás instrucciones paso a paso sobre cómo implementarlo.
Cómo crear un archivo LLMs.txt (paso a paso)
Esto es técnico, por lo que lo mejor es involucrar a un desarrollador en el proceso siguiendo estos tres pasos:
1. Decide qué contenido quieres destacar.
Antes de crear un archivo, determine qué páginas o secciones de su sitio web deben resaltarse para los rastreadores de IA.
Digamos que quieres crear un archivo llms.txt para todo tu sitio web. Como mínimo, considera lo siguiente:
- Páginas de productos o servicios
- Publicaciones de blog actualizadas
- Página de precios
- Página "Sobre nosotros"
- Página de contacto
Estas son, por lo general, las páginas que le darán a la IA una buena idea de lo que hace tu empresa y cómo ayudas a tus clientes.
2. Crea el archivo
Abre un editor de texto como el Bloc de notas o Visual Studio Code y crea un nuevo archivo llamado llms.txt.
Debes formatear el archivo usando Markdown. Una vez más, los desarrolladores son útiles para crear el archivo.
Así es como podría verse la estructura del archivo:
# Nombre del sitio web
>Breve descripción de su sitio web
Notas importantes:
- Elemento diferenciador clave o detalle importante sobre su negocio
- Otra nota importante sobre lo que hace o no hace
- Tercer punto clave que ayuda a definir su oferta
## Productos
- [Nombre del producto 1](https://example.com/product-1): Breve descripción de la característica y el beneficio principal de su producto
- [Nombre del producto 2](https://example.com/product-2): Breve descripción de la característica y el beneficio principal de su producto
- [Nombre del producto 3](https://example.com/product-3): Breve descripción de la característica principal y el beneficio de su producto
## Contenido del blog
- [Título de la entrada del blog 1](https://example.com/blog-post-1): Breve descripción del contenido de esta entrada del blog y su utilidad
- [Título de la entrada del blog 2](https://example.com/blog-post-2): Breve descripción del contenido de esta entrada del blog y su utilidad
- [Título de la entrada del blog 3](https://example.com/blog-post-3): Breve descripción del contenido de esta entrada del blog y su utilidad
## Empresa
- [Acerca de nosotros](https://example.com/about): Información sobre la empresa, su misión y el equipo
- [Contacto](https://example.com/contact): Cómo contactar con nuestro equipo
- [Precios](https://example.com/pricing): Descripción general de los planes, características y costes de nuestros productos3. Sube el archivo a tu sitio web
Coloca el archivo terminado en la ubicación correcta para que, en teoría, los rastreadores de IA puedan encontrarlo.
La ubicación exacta depende del alcance de su archivo llms.txt:
- Si cubre todo su sitio web, súbalo a su directorio raíz (es decir, “https://[sudominio].com”) para que sea accesible en “https://[sudominio.com]/llms.txt”.
- Si el archivo trata específicamente sobre documentación, colóquelo en el subdirectorio correspondiente (por ejemplo, “https://[docs.yourdomain.com]/llms.txt”).
Necesitarás la ayuda de un desarrollador para subir el archivo. Este archivo debe colocarse en su servidor, generalmente a través de su panel de control de alojamiento web, como cPanel.
Inicie sesión en su proveedor de alojamiento y luego navegue al Administrador de archivos de cPanel > .

Luego, diríjase al directorio correcto. Si su archivo llms.txt está destinado a todo el sitio, vaya a la carpeta public_html/. (Ese es el directorio raíz para la mayoría de los dominios).
Si se trata de un subdominio como “https://[docs.tudominio.com]”, navega a la carpeta asignada a ese subdominio, que suele llamarse /docs/ o similar.

Sube tu archivo llms.txt allí y guarda los cambios.

Una vez subido el archivo, confirme que todo funciona correctamente abriendo una nueva pestaña y visitando la URL directamente.
También puedes ejecutar una auditoría rápida de tu sitio web en la herramienta Auditoría del sitio de Semrush para confirmar que tu archivo llms.txt se está cargando correctamente.

Además, no olvides mantener el archivo actualizado periódicamente. Revise periódicamente los enlaces para eliminar las páginas obsoletas. Y añade enlaces al nuevo contenido que agregues al sitio web.