Saltar al contenido

Configurar Auditoría del Sitio

Para configurar la Auditoría del Sitio, primero tienes que crear un Proyecto para el dominio. Una vez creado ese nuevo proyecto, selecciona el botón “Configurar”, en el bloque de Auditoría del Sitios de la interfaz.

Si tienes algún problema para poner a trabajar la auditoría del sitio, puedes hacer clic en Solución de Problemas en Auditoría de Sitio para recibir ayuda.

 

 

Dominio y límite de páginas

Vas a ser remitido a la primera parte del asistente de configuración, Dominio y Límite de Páginas. Desde aquí, puedes, o bien elegir entre “Start Site Audit”, que ejecutará inmediatamente una auditoría de tu sitio con nuestra configuración por defecto, o bien personalizar la configuración de la auditoría de acuerdo a tus gustos. Pero no te preocupes, siempre puedes cambiar la configuración y volver a ejecutar tu auditoría para rastrear una zona más específica de tu sitio, después de tu primera selección.

Alcance de Rastreo

Para rastrear un dominio específico, un subdominio, o una subcarpeta, puedes introducir esa especificación en el campo “Alcance de rastreo” (“Crawl scope”). Si introduces un dominio en ese campo, se te dará la opción de rastrear todos los subdominios de ese dominio con una casilla de verificación.

Site Audit domain and limit of pages settings

Límite de páginas a comprobar

Después, selecciona cuántas páginas quieres rastrear en cada auditoría. Puedes introducir una cantidad personalizada usando la opción “personalizar” (“Custom”). Conviene que selecciones esta cantidad de manera cautelosa, dependiendo del nivel de tu suscripción y la regularidad con la que revisas o re-auditas tu web.

  • Los usuarios Pro pueden rastrear hasta 100.000 páginas al mes, y 20.000 páginas en cada auditoría.
  • Los usuarios Guru pueden rastrear hasta 300.000 páginas al mes, y 20.000 páginas en cada auditoría.
  • Los usuarios Business pueden rastrear hasta 1.000.000 páginas al mes, y 100.000 páginas en cada auditoría.

Fuente de rastreo

Establecer la fuente de rastreo permite determinar cómo el bot de rastreo de Semrush rastrea tu página web, y encuentra las páginas a auditar. Además de establecer la fuente de rastreo, puedes fijar máscaras y parámetros para ser o bien incluidos o excluidos en los pasos 3 y 4 de la auditoría del asistente de configuración.

Hay cuatro opciones para determinar tu fuente de rastreo en la auditoría: web, sitemap del sitio, sitemap por URL y un documento de URLs.

1. Rastrear desde la web significa que rastreamos tu sitio como lo hace el GoogleBot, usando un algoritmo de breadth-first search y navegaremos a través de los enlaces que encontramos en el código de tu página, comenzando por la página principal.

Si solo quieres rastrear las páginas más importantes de tu web, elige rastrear desde Sitemap en lugar de rastrear desde la web, lo que permitirá acceder a las páginas más importantes en lugar de a las que están más accesibles desde la home.

2. Rastrear desde Sitemap del sitio significa que sólo rastreamos las URL que se encuentren en el sitemap desde el archivo robots.txt

3. Rastrear desde Sitemap por URL es lo mismo que rastrear desde “Sitemap del sitio”, pero esta opción te permite introducir específicamente la URL de tu sitemap.

Como los motores de búsqueda utilizan mapas sitemaps para entender qué páginas deben rastrear, siempre debes intentar mantener tu sitemap lo más actualizado posible, y usarlo como una fuente de rastreo con nuestra herramienta, para lograr una cuidadosa auditoría.

4. Rastrear desde un archivo de URLs permite una auditoría altamente específica de una serie de páginas de una web. Asegúrate de que el archivo está correctamente guardado como .csv o .txt, con una URL por línea, y súbelo directamente a Semrush de tu ordenador.

Este es un método útil si quieres comprobar páginas específicas y mantenerte en tu presupuesto de rastreo. Si haces algún cambio en un pequeño número de páginas de tu sitio, y quieres comprobarlas, puedes usar este método para llevar a cabo una auditoría específica, y no gastar así ningún presupuesto de rastreo extra.

Después de descargar el archivo, el asistente te dirá cuántas URLs han sido detectadas, de modo que puedas comprobar de nuevo si ha funcionado correctamente, antes de comenzar con la auditoría.

Site Audit uploaded file

Rastreo de Javascript

Si utilizas JavaScript en tu sitio web, puedes habilitar la ejecución de JS en los ajustes de tu campaña de Site Audit.

JS-rendering

Por favor, te avisamos amablemente de que esta opción solo está disponible en la subscripción Guru o Business.

Auditando AMPs

La casilla de verificación de “Rastreo de páginas AMP primero” (“Crawl AMP pages first”) asegura que tu auditoría rastrea las páginas que quieres comprobar para los temas más importantes relacionados con la implementación de AMP. Ahora mismo las comprobaciones de AMP están disponibles sólo para suscriptores del nivel Business.

Después de configurar estas herramientas, puedes ejecutar la auditoría de tu sitio. De todas maneras, si prefieres añadir máscaras o quitar parámetros, o establecer un horario, utiliza la configuración avanzada y las instrucciones de configuración que se muestran debajo.

Ajustes avanzados y configuración

Nota: los siguientes cuatro pasos de la configuración son avanzados y opcionales.

Ajustes de rastreo

Aquí puedes escoger el agente que quieres que rastree tu sitio. Primero, establécelo escogiendo entre la versión para móvil o escritorio de los dos SemrushBot o de GoogleBot.

Site Audit user agent

A medida que cambias el usuario, podrás ver cómo el código en la pantalla de diálogo inferior cambia consecuentemente. Ese es el código de uso del agente y puede ser usado como bucle si quieres verificar el usuario por tu cuenta.

Opciones de crawl-delay

Después, tienes tres opciones de crawl-delay (es decir, el tiempo en segundos entre dos páginas rastreadas) para un rastreo: el crawl-delay mínimo, respetar el crawl-delay de robots.txt y una URL cada dos segundos.

Si estableces el crawl-delay mínimo entre páginas, el bot rastreará tu página web a su ritmo normal. Por defecto el SemrushBot esperará en torno a un segundo antes de comenzar a rastrear la siguiente página.

Si tienes una archivo robots.txt en tu sitio, y un crawl-delay específico, entonces puedes seleccionar la opción “respect robot.txt ”, para que tu rastreador de Auditoría de Sitio siga las instrucciones de este crawl-delay.

Debajo puedes ver cómo se ve un rastreo aplazo en una archivo de robots.txt.

Crawl-delay: 20

Si nuestro rastreador ralentiza tu página web y no tienes ninguna directiva de crawl-delay en la archivo robot.txt, puedes pedirle a Semrush que rastree una URL cada dos segundos. Esto forzará que la auditoría tarde más tiempo en ser completada, pero conseguirá una menor pérdida de velocidad para usuarios actuales de la página web durante la auditoría.

Permitir/No permitir URLs

Esta opción te permitirá rastrear específicamente o bloquear determinadas subcarpetas de una web. Puedes incluir cualquier cosa en la URL, después de TLD. Por ejemplo, si quieres rastrear la subcarpeta http://www.example.com/shoes/mens/ tendrás que escribir : “/shoes/mens/” en la casilla de la izquierda.

Site Audit allow

Para evitar que se rastreen subcarpetas específicas, puedes introducir la ruta de la subcarpeta en la casilla a deshabilitar. Por ejemplo, para rastrear la categoría de zapatos de hombre “men’s shoes”, pero excluyendo botas de monte “hiking boots”, como una de las subcategorías de zapatos de hombre (https://example.com/shoes/mens/hiking-boots/), tendrás que introducir  /shoes/mens/hiking-boots/ en la casilla de deshabilitar.

Site Audit allow disallow

Si te olvidas de introducir el símbolo / al final de la URL en la casilla para deshabilitar (ex: /shoes), entonces Semrush se saltará todas las páginas en la subcarpeta /shoes/, así como las URL que comienzan por /shoes (como por ejemplo www.example.com/shoes-men)

Eliminar parámetros de URLs

Los parámetros URL (también conocidos como query strings) son elementos de la URL que no cuadran con el esquema de estructura jerárquica. En realidad, han sido añadidos al final de la URL para dar instrucciones lógicas al buscador web.

Los parámetros URL consisten en un signo ? seguido del nombre de un parámetro (página, utm_medium, etc) y =.

Por eso “?page=3” es un simple parámetro URL que puede indicar la tercera página de deslizamiento en una URL específica.

El cuarto paso de la configuración de la Auditoría del Sitio te permite especificar cualquier parámetro de URL que use tu página web, para quitarlo de la URL mientras se rastrea. Esto ayuda a que Semrush no duplique el rastreo de la misma página en una sóla auditoría. Si un bot ve dos URLs, una con parámetros y otra sin ellos, rastreará las dos páginas, con el consiguiente gasto en el presupuesto de rastreo.

Site Audit url parameters

Por ejemplo, si incluyes “page” en esta casilla, esto supone quitar todas las URLs que incluyan “page” en su extensión URL. Podrían ser USR con valores como ?page=1, ?page=2, etc. Eso implicaría evitar rastrear dos veces la misma página (por ejemplo los dos “/shoes” and “/shoes/?page=1” como una URL), en el proceso de rastreo.

Los usos más comunes de parámetros de URL incluyen páginas, lenguajes y subcategorías. Estos tipos de parámetros son útiles para páginas web con grandes catálogos de productos o con mucha información. Otro tipo habitual de parámetro son los UTMs, que se usan para el rastreo de clic y el tráfico en campañas de márketing.

Si ya tienes un proyecto configurado, y quieres cambiar tu configuración, utilizando los ajustes siguientes:

Settings menu in Site Audit

Usarás las mismas instrucciones enumeradas debajo seleccionando las opciones “Masks” y “Removed parameters”.

Derivar restricciones web

Para auditar áreas privadas de tu sitio web protegidas por contraseña mediante autenticación de acceso simple, acredítate (nombre de usuario y contraseña) y permite que el bot de Auditoría del Sitio llegue a esas páginas y las audite.

Site Audit bypass website restrictions

Se recomienda este procedimiento para sitios que están en proceso de desarrollo o son privados y están totalmente resguardados por una password. Para estar seguros de que el rastreador pasa por la zona que quieres, asegúrate de permitir y habilitar o deshabilitar las URL y los parámetros de URL.

Puedes evitar también esos momentos a través del archivo robots.txt. Al igual que el rastreo con opciones de credencial, esto es útil para los sitios que están en mantenimiento en este momento. También es útil en el caso de que el propietario de la página web no quiera modificar el archivo robots.txt.

Si usas esta opción, tanto los recursos internos como las páginas bloqueadas no serán rastreadas. Ten en cuenta que para poder utilizar esta opción el propietario del sitio tiene que autentificarse.

Programar

Por último, selecciona con qué frecuencia quieres que auditemos automáticamente tu web. Las opciones que tienes son:

  • Semanalmente (tú escoges qué día de la semana)
  • Diariamente
  • Una única vez

Puedes cambiar tus preferencias siempre que quieras, dentro del proyecto.

Site Audit schedule

Una vez que hayas completado las preferencias que prefieres, selecciona “Empezar la Auditoría del Sitio” (Start Site Audit).

Solución de problemas

En el caso de que veas el cuadro de diálogo de “una auditoría de dominio ha fallado”, querrás comprobar que nuestro rastreador de Auditoría del Sitio no ha sido bloqueado por nuestro servidor. Para asegurar un rastreo apropiado, por favor, sigue los pasos de nuestro Solucionador de Problemas de Auditoría del Sitio para incluir nuestro bot entre la lista blanca.

De forma alternativa, puedes descargar el archivo de errores generado cuando falle un rastreo y proporcionar dicho archivo a tu webmaster de forma que pueda analizar la situación y tratar de encontrar la razón del error de rastreo. Si necesitas una forma de analizar el archivo de error por ti mismo, puedes subirlo a nuestra herramienta de Analisis de Archivos de Error.

Conectando Google Analytics y Auditoría del Sitio

Después de completar el asistente de configuración, podrás conectar tu cuenta de Google Analytics para incluir todos los temas relacionados con las páginas más vistas.

Si sigues teniendo algún problema al ajustar tu Auditoría del Sitio, prueba con la resolución de problemas de Site Audit, o contacta con nuestro equipo de soporte y estaremos encantados de ayudarte.