¿Por qué solo se rastrean algunas de las páginas de mi sitio web?
Si has observado que solo se rastrean de 4 a 6 páginas de tu sitio web (tu página de inicio, las URL de los sitemaps y robots.txt), lo más probable es que se deba a que nuestro bot no ha podido encontrar enlaces internos salientes en tu página de inicio. A continuación encontrarás las posibles causas de este problema.
Puede que no haya enlaces internos salientes en la página principal, o que estén incluidos en JavaScript. Si tienes una suscripción Pro, nuestro bot no analizará el contenido JavaScript, por lo que si tu página de inicio tiene enlaces al resto de tu sitio ocultos en elementos de JavaScript, no los leeremos ni tampoco rastrearemos esas páginas.
Aunque el rastreo de contenido JavaScript sólo está disponible para los usuarios de Guru y Business, podemos rastrear el HTML de una página con elementos JS, y podemos revisar los parámetros de tus archivos JS y CSS con nuestras comprobaciones de rendimiento, independientemente del tipo de suscripción (Pro, Guru o Business).
En ambos casos, hay una forma de garantizar que nuestro bot rastree tus páginas. Para ello, tienes que cambiar la fuente de rastreo de "sitio web" a "sitemap" o "URL de archivo" en la configuración de tu campaña:
"Sitio web" es la fuente por defecto. Significa que rastreamos tu web usando un algoritmo breadth-first search y navegando a través de los enlaces que encontremos en el código de tu página, comenzando por la página de inicio.
Si eliges una de las otras opciones, rastrearemos los enlaces que se encuentren en el sitemap o en el archivo que subas.
Nuestro rastreador de Auditoría del sitio podría estar bloqueado para algunas páginas en robots.txt o por etiquetas noindex/nofollow. Puedes comprobar si es así en el informe Páginas rastreadas:
Puedes inspeccionar tu Robots.txt en busca de comandos disallow que impidan a rastreadores como el nuestro acceder a tu sitio web.
Cuando aparece este código en la página principal de un sitio web, se nos indica que no se nos permite indexar/seguir enlaces ni tampoco acceder a él. Asimismo, el hecho de que en una página aparezca al menos uno de estos dos códigos, "nofollow" o "none", provocará un error de rastreo.
<meta name="robots" content="noindex, nofollow">
Encontrarás más información sobre estos errores en nuestro artículo sobre solución de problemas.
El límite para otras páginas de tu sitio web es de 2 MB. En caso de que una página tenga un tamaño HTML demasiado grande, verás el siguiente error:
Preguntas frecuentes
- What Issues Can Site Audit Identify?
- How many pages can I crawl in a Site Audit?
- ¿Cuánto tiempo se tarda en rastrear un sitio web? Parece que mi auditoría se ha bloqueado.
- ¿Cómo audito un subdominio?
- Can I manage the automatic Site Audit re-run schedule?
- Can I set up a custom re-crawl schedule?
- ¿Cómo se calcula la puntuación de Site Health en la herramienta Auditoría del sitio?
- How Does Site Audit Select Pages to Analyze for Core Web Vitals?
- How do you collect data to measure Core Web Vitals in Site Audit?
- Why is there a difference between GSC and Semrush Core Web Vitals data?
- ¿Por qué solo se rastrean algunas de las páginas de mi sitio web?
- ¿Por qué las páginas que funcionan en mi sitio web aparecen como rotas?
- Why can’t I find URLs from the Audit report on my website?
- Why does Semrush say I have duplicate content?
- Why does Semrush say I have an incorrect certificate?
- What are unoptimized anchors and how does Site Audit identify them?
- What do the Structured Data Markup Items in Site Audit Mean?
- Can I stop a current Site Audit crawl?
- How to Disable JS Rendering and Inspect a Page
Manual
- Configuración de Auditoría del Sitio
- Solución de problemas de auditoría del sitio
- Site Audit Overview Report
- Informes Temáticos de Auditoría del sitio
- Reviewing Your Site Audit Issues
- Site Audit Crawled Pages Report
- Site Audit Statistics
- Compare Crawls and Progress
- Exporting Site Audit Results
- Cómo optimizar la velocidad de rastreo de la Auditoría de tu sitio
- Cómo integrar la Auditoría del sitio con Zapier
- JS Impact Report