Saltar al contenido
Conocimiento
Kits de herramientas de Semrush
SEO
Auditoría del sitio
¿Por qué solo se están rastreando unas pocas páginas de mi web?

¿Por qué solo se están rastreando unas pocas páginas de mi web?

Si solo se están rastreando 4-6 páginas de tu web (tu página principal, URL del sitemap y robots.txt), probablemente se deba a que nuestro bot no pueda encontrar enlaces internos en tu Home. A continuación, puedes encontrar posibles razones para este problema.

No hay enlaces internos salientes en la página principal o están incluidos en JavaScript. Nuestro bot todavía no puede analizar el contenido de JavaScript, por lo que si tu página de inicio tiene enlaces al resto de tu sitio ocultos en elementos de JavaScript, no podremos leerlos ni rastrear esas páginas.

Aunque no podemos rastrear contenido JavaScript, podemos rastrear el HTML de una página que tiene elementos JS y podemos revisar los parámetros de tus archivos JS y CSS con nuestras verificaciones de rendimiento.

En ambos casos, hay formas de asegurarte de que tu bot pueda rastrear tus páginas. Para hacerlo, necesitas cambiar la fuente de rastreo desde "web" a "sitemap" o "URL del archivo" en la configuración de tu campaña:

Site Audit crawl source

"Web" es la fuente predeterminada. Esto significa que vamos a rastrear tu web utilizando un algoritmo de búsqueda amplio y navegar a través de los enlaces que vemos en el código de tu página — empezando por la página principal.

Si eliges una de las otras opciones, vamos a rastrear los enlaces que encontremos en el sistemap o el archivo que subas.

Nuestro rastreador puede estar bloqueado en algunas páginas en el archivo robots.txt de la web o debido a las etiquetas noindex/nofollow. Puedes comprobar si este es el caso en tu informe de páginas rastreadas:

Site Audit blocked pages

Puedes inspeccionar tu Robots.txt en busca de comandos de disallow que impidan que rastreadores como el nuestro accedan a tu sitio web.

Si ves el siguiente código en la página principal de una web, no podemos index/follow los enlaces y tenemos el acceso bloqueado. O, una página que contenga al menos uno de los siguientes: "nofollow", "none", te llevará a un error de rastreo.

<meta name="robots" content="noindex, nofollow">

Puedes encontrar más información sobre estos errores en nuestro artículo de solución de problemas.

Auditoría del sitio está equipada para analizar páginas principales de no más de 4 MB.

¿Por qué solo se están rastreando unas pocas páginas de mi web? image 3

El límite para el resto de páginas de tu web es de 2 MB. En caso de que una página tenga un tamaño HTML demasiado grande, verás el siguiente error:
¿Por qué solo se están rastreando unas pocas páginas de mi web? image 4