Respuestas directas sobre llms.txt — útiles para SEO de cola larga y Q&A citables por IA.
¿Qué es un archivo llms.txt?
Un archivo llms.txt es un texto Markdown en la raíz de tu dominio (/llms.txt) que lista tus páginas más importantes con descripciones breves para sistemas de IA. Ofrece a los modelos un mapa curado sin rastrear todo el sitio. La convención está en llmstxt.org.
¿Este generador de llms.txt es gratis?
Sí: es 100 % gratis, sin registro, créditos ni inicio de sesión. Rastreamos páginas públicas y construimos el archivo desde títulos y meta descripciones HTML sin usar IA. Puedes copiar o descargar al instante.
¿Dónde coloco el archivo llms.txt?
Súbelo a la raíz de tu dominio para que esté en https://yourdomain.com/llms.txt. Algunos sitios de documentación usan /docs/llms.txt, pero la raíz es lo más habitual.
¿Cuál es la diferencia entre llms.txt y llms-full.txt?
llms.txt es un índice de enlaces curado con descripciones breves — lo que la mayoría necesita. llms-full.txt incluye el texto completo de las páginas y puede ser enorme. Empieza con llms.txt; añade llms-full.txt solo si lo necesitas.
¿Ayuda llms.txt al SEO o al ranking de Google?
No: llms.txt no es un factor de ranking de Google y Google ha indicado que no lo usa para indexación de búsqueda. Su valor está en herramientas de IA, descubrimiento para desarrolladores y asistentes de código. Para SEO, invierte en sitemaps, meta etiquetas y contenido.
¿ChatGPT, Claude, Gemini y Perplexity leen realmente llms.txt?
Ningún proveedor importante de IA se ha comprometido oficialmente a usar llms.txt en inferencia de producción. La adopción es incierta, aunque algunos rastreadores ocasionalmente solicitan /llms.txt. El uso más claro hoy son asistentes de código y herramientas para desarrolladores.
¿Es llms.txt lo mismo que robots.txt? ¿Bloquea rastreadores de IA?
No: llms.txt es un archivo de inclusión y curación, no de bloqueo. Para restringir rastreadores como GPTBot o ClaudeBot, usa robots.txt y la documentación de exclusión de cada proveedor.
¿Cómo compruebo si los rastreadores de IA obtienen mi llms.txt?
Filtra los logs de acceso del servidor por solicitudes a /llms.txt e inspecciona el User-Agent. Busca GPTBot, ClaudeBot, PerplexityBot y Google-Extended. Una sola solicitud no implica uso continuo — observa patrones durante semanas.
¿Qué tamaño debe tener el archivo?
Cura tus mejores páginas en lugar de listar cada URL. Apunta muy por debajo de los límites de contexto del modelo — unos 150 000 palabras o ~700 KB como techo práctico. La calidad supera a los volcados exhaustivos.
¿Debo crear una copia Markdown de cada página?
Generalmente no: publicar espejos .md indexables puede causar contenido duplicado. llms.txt enlaza a URLs canónicas con descripciones; suele ser suficiente. Usa llms-full.txt solo si necesitas texto completo inline.
¿Con qué frecuencia debo actualizar llms.txt?
Actualiza cuando añadas, elimines o cambies significativamente páginas clave. En sitios activos, regenerar desde el sitemap mensualmente o en cada despliegue (CI) mantiene el archivo al día.
¿Esta herramienta usa IA o Gemini?
No. El generador rastrea HTML público y extrae títulos, meta descripciones y estructura de URL de forma programática. Nada se envía a Gemini ni a ningún otro modelo de IA.
¿URL de sitemap o URL del sitio web?
Usa sitemap para blogs y sitios grandes — descubre todas las páginas listadas rápidamente. Usa la URL del sitio para sitios pequeños — empezamos en la homepage y seguimos enlaces internos. Pega URLs específicas para un subconjunto.
¿Por qué no se puede rastrear mi sitio?
Algunos sitios bloquean solicitudes automatizadas con protección anti-bot, Cloudflare o WAF. Prueba pegar URLs manualmente o usa tu sitemap si es accesible públicamente.