Conocimiento
Kits de herramientas de Semrush
SEO
Auditoría del sitio
Configuración de Auditoría del Sitio

Configuración de Auditoría del Sitio

Para configurar una auditoría del sitio, primero tienes que crear un proyecto para el dominio. Una vez que lo tengas creado, selecciona el botón "Configurar" en el bloque Auditoría del sitio de la interfaz del proyecto.

Si tienes problemas para que se ejecute la Auditoría del sitio web, consulta Solución de problemas de la Auditoría del sitio para obtener ayuda.

Dominio y límite de páginas

Se te dirigirá a la primera parte del asistente de configuración, Dominio y límite de páginas. Desde aquí, puedes elegir la opción "Iniciar Auditoría del sitio" para ejecutar inmediatamente una auditoría de tu sitio con nuestra configuración predeterminada, o bien personalizar la configuración de la auditoría a tu gusto. Pero no te preocupes, porque siempre puedes cambiar la configuración inicial y volver a ejecutar la auditoría para rastrear una sección más específica de tu sitio web.

Alcance de rastreo

Para rastrear un dominio, subdominio o subcarpeta concretos, introdúcelos en el campo "Alcance de rastreo". Si introduces un dominio en este campo, podrás marcar la casilla de verificación para rastrear todos los subdominios.

Por defecto, la herramienta comprueba el dominio raíz, que incluye todos los subdominios y subcarpetas disponibles en tu sitio web. En la configuración de la Auditoría del sitio, puedes definir tu subdominio o subcarpeta como nivel de alcance de rastreo y desmarcar la casilla "Rastrear todos los subdominios" si no quieres que se rastreen otros subdominios.

Por ejemplo, imagina que solo quieres hacer una auditoría del blog de tu web. Puedes definir como alcance de rastreo blog.semrush.com o semrush.com/blog/, dependiendo de si está implementado como subdominio o como subcarpeta.

Una ventana que muestra la configuración básica de Auditoría del sitio: Alcance de rastreo, Límite de páginas rastreadas y Fuente de rastreo. Una flecha roja apunta a la línea Ver ejemplos en Alcance de rastreo, que abre los ejemplos del aspecto de los dominios raíz, subdominios y subcarpetas.

Un GIF que muestra la configuración básica de la Auditoría del sitio web. Se selecciona el número de páginas y una fuente de rastreo, con lo que se despliegan las opciones disponibles. Tras seleccionar el número deseado de páginas para rastrear y una fuente de rastreo, el cursor se dirige al botón verde "Iniciar auditoría del sitio".

Límite de páginas para comprobar

A continuación, selecciona cuántas páginas quieres rastrear por auditoría. Puedes indicar un número personalizado mediante la opción "Personalizado". Elige bien el número que quieres introducir, dependiendo del nivel de tu suscripción y de la frecuencia con la que tengas pensado volver a auditar tu sitio web.

  • Los Usuarios Pro pueden rastrear hasta 100.000 páginas al mes y 20.000 páginas por auditoría.
  • Los Usuarios de Guru pueden rastrear 300.000 páginas al mes y 20.000 páginas por auditoría.
  • Los usuarios de Business pueden rastrear hasta 1 millón de páginas al mes y 100.000 páginas por auditoría.

Fuente del rastreo

La configuración de la Fuente del rastreo determina cómo el bot de la Auditoría del sitio de Semrush va a rastrear tu sitio web y encontrar páginas para auditar. Además de configurar la fuente de rastreo, puedes definir máscaras y parámetros para incluirlos o excluirlos de la auditoría en los pasos 3 y 4 del asistente de configuración.

Hay 4 opciones para establecer la fuente de rastreo de tu auditoría: Sitio web, Sitemap en el sitio, Sitemap por URL y URL desde archivo.

1. Rastrear desde el sitio web significa que rastrearemos tu sitio como el robot de Google, utilizando un algoritmo de búsqueda breadth-first y navegando por los enlaces que veamos en el código de tu página, empezando por la página principal.

Si solo quieres rastrear las páginas más importantes de una web, si eliges rastrear desde el sitemap en lugar de desde el sitio web, en la auditoría se rastrearán las páginas más importantes en vez de solo las más accesibles desde la página de inicio.

2. Rastrear desde sitemaps en el sitio significa que solo rastreamos las URL incluidas en el sitemap del archivo robots.txt.

3. Rastrear desde sitemap por URL es lo mismo que rastrear desde "Sitemaps en el sitio", pero esta opción te permite introducir directamente la URL de tu sitemap.

Como los motores de búsqueda utilizan los sitemaps para saber qué páginas rastrear, siempre debes intentar mantener tu sitemap lo más actualizado posible y utilizarlo como fuente de rastreo con nuestra herramienta para obtener una auditoría precisa.

Notas: Auditoría del sitio solo puede utilizar una URL de sitemap como origen de rastreo a la vez, por lo que si tu sitio web tiene varios sitemaps, la siguiente opción (Rastrear desde un archivo de URL) puede funcionar como alternativa.

4. Rastrear desde un archivo de URL te permite hacer una auditoría centrada en páginas muy concretas de una web. Asegúrate de que el archivo está correctamente guardado como .csv o .txt, con una URL por línea, y súbelo directamente a Semrush desde tu ordenador.

Es un método útil si quieres comprobar páginas concretas y conservar tu presupuesto de rastreo. Si solo has hecho cambios en pocas páginas de tu web y deseas verificarlas, puedes utilizar este método para ejecutar una auditoría específica y no malgastar presupuesto de rastreo.

Después de cargar archivo, el asistente te dirá cuántas URL se han detectado para que puedas asegurarte de que ha funcionado correctamente antes de ejecutar la auditoría.

Ventana de configuración de la auditoría del sitio web. En Fuente del rastreo, se selecciona y resalta la opción URL desde archivo. Para demostrar cómo funciona esta opción, se ha subido un archivo de ejemplo. La herramienta ha proporcionado el número de URL detectadas en el archivo (97 URL), y este número también aparece resaltado en este menú.

Rastreo de JavaScript

Si utilizas JavaScript en tu sitio web, puedes activar el renderizado JS en la configuración de tu campaña de Auditoría del sitio.

Site Audit settings window with the second tab, Crawler settings, on display. The JS rendering part, which is the last one on this tab, is highlighted to make this option easier to find.

Ten en cuenta que esta función sólo está disponible en las suscripciones Guru y Business.

Auditoría de AMP

La casilla "Rastrear primero las páginas AMP" garantiza que tu auditoría rastreará tus páginas AMP para comprobar los problemas más importantes en la implementación de AMP. En este momento, las comprobaciones de AMP solo están disponibles para las suscripciones de nivel Business.

Después de configurar estos ajustes, ya puedes ejecutar la Auditoría del sitio web. Sin embargo, si quieres añadir máscaras o eliminar parámetros y programar tu calendario, sigue las instrucciones avanzadas de instalación y configuración que aparecen a continuación. 

Configuración avanzada

Nota: Los cuatro pasos siguientes de la configuración son avanzados y opcionales.

Configuración del rastreador

Aquí puedes elegir el agente usuario ("user agent") que quieres que rastree tu sitio. En primer lugar, define el user agent eligiendo entre la versión móvil o de escritorio de SiteAuditBot o de GoogleBot.

Por defecto, verificamos tu sitio web con nuestro bot de rastreo móvil, que hace la auditoría de la misma forma que lo haría el rastreador móvil de Google. Puedes cambiar al bot rastreador de Semrush para la versión de escritorio cuando quieras. 

Menú de Configuración de Auditoría del sitio web. En la segunda pestaña, "Configuración del rastreador", aparece destacada la sección "User agent". La selección User agent tiene activada la opción por defecto: SiteAuditBot-Mobile.

Cuando cambies de user agent, verás que el código del cuadro de diálogo que hay debajo también cambia. Este es el código de user agent y puede utilizarse en un comando cURL (URL de cliente) si quieres probar el user agent por tu cuenta.

Opciones de Crawl-delay

A continuación, tienes tres opciones de "crawl delay" (es decir, el tiempo en segundos entre dos páginas rastreadas): crawl-delay mínimo, respetar el crawl-delay de robots.txt o rastrear una URL cada 2 segundos.

Si dejas marcada esta demora mínima entre páginas, el robot rastreará tu sitio web a su velocidad normal. Por defecto, SiteAuditBot esperará alrededor de un segundo antes de empezar a rastrear otra página.

Si tienes un archivo robots.txt en tu sitio y has definido un crawl-delay concreto, puedes seleccionar la opción "respetar crawl-delay de robots.txt" para que nuestro rastreador de Auditoría del sitio respete esa indicación.

A continuación se muestra cómo aparece indicado un crawl-delay dentro de un archivo robots.txt:

Crawl-delay: 20

Si nuestro rastreador hace que tu sitio web funcione más lento y no hay ninguna instrucción "crawl-delay" en tu archivo robots.txt, puedes decirle a Semrush que rastree una URL cada 2 segundos. Esto puede hacer que tu auditoría tarde más en completarse, pero causará menos problemas potenciales de velocidad a los usuarios reales de tu sitio web durante la auditoría.

Permitir/no permitir URL

Esta opción te permitirá rastrear o bloquear determinadas subcarpetas de un sitio web. Para ello, deberás incluir todo lo que contiene la URL después del TLD (dominio de primer nivel). Por ejemplo, si quisieras rastrear la subcarpeta "http://www.example.com/shoes/mens/", tendrías que escribir "/shoes/mens/" en la casilla "Permitir" de la izquierda.

Paso "Permitir/No permitir URL" de la configuración de Auditoría del sitio web. En la captura de pantalla, hay dos campos para las máscaras de permitir/no permitir. En el campo "permitir", se añade el siguiente ejemplo: /shoes/mens/. Una flecha roja la señala cuál es el formato que deben tener las máscaras para aplicarse correctamente.

Para evitar que se rastreen subcarpetas específicas, puedes introducir la ruta de la subcarpeta en la casilla de no permitir. Por ejemplo, para rastrear la categoría de zapatos de hombre "men’s shoes", pero excluyendo botas de monte "hiking boots" como una de las subcategorías de zapatos de hombre (https://example.com/shoes/mens/hiking-boots/), tendrás que escribir "/shoes/mens/hiking-boots/" en la casilla de no permitir.

Ejemplo de cómo concretar aún más la configuración de la máscara de permitir/no permitir. En el campo "permitir", una flecha roja apunta al mismo ejemplo /shoes/mens/. En "no permitir", una segunda flecha apunta a "/shoes/mens/hiking-boots" para indicar que se pueden excluir determinadas subcarpetas a pesar de las indicaciones de la sección "permitir".

Si te olvidas de añadir la "/" al final de la URL en la casilla de no permitir (por ejemplo: /shoes), Semrush omitirá todas las páginas de la subcarpeta "/shoes/", así como todas las URL que empiecen por "/shoes" (como www.example.com/shoes-men). 

Eliminar parámetros de URL

Los parámetros de URL (también conocidos como cadenas de consulta) son los elementos de una URL que no encajan en la estructura jerárquica de rutas. En cambio, se añaden al final de una URL y dan instrucciones lógicas al navegador web.

Los parámetros de URL siempre incluyen un "?" seguido del nombre del parámetro (página, utm_medium, etc.) y =.

Así, "?page=3" es un simple parámetro de URL que podría servir para identificar la 3.ª página de desplazamiento dentro de una única URL.

El 4.º paso de la configuración de la Auditoría del sitio te permite especificar los parámetros de URL que utiliza tu sitio web para eliminarlos de las URL durante el rastreo. De esta forma Semrush no rastreará la misma página dos veces durante tu auditoría. Si un bot visita dos URL, una con un parámetro y otra sin él, puede rastrear ambas páginas y, como resultado, desperdiciar tu presupuesto de rastreo.

Paso "Eliminar Parámetros de URL" de la configuración de Auditoría del sitio. En los campos de parámetros, se muestran varias opciones de ejemplo, con una flecha roja señalándolas para llamar la atención sobre cómo debe ser el formato de los parámetros de la URL para que funcione.

Por ejemplo, si añadieses "page" a esta casilla, se quitarían todas las URL cuya extensión de URL incluya "page". Podrían ser URL con valores como ?page=1, ?page=2, etc. Con esto, se evitaría rastrear la misma página dos veces en el proceso de rastreo; por ejemplo, las URL "/shoes" y "/shoes/?page=1" se tratarían como una sola URL.

En los parámetros de URL se suelen incluir páginas, idiomas y subcategorías. Este tipo de parámetros son útiles para sitios web con muchos productos e información. Otros parámetros de URL habituales son los UTM, que se utilizan para hacer un seguimiento de los clics y el tráfico de las campañas de marketing.

Si ya tienes un proyecto y quieres cambiar su configuración, puedes hacerlo utilizando el icono del engranaje:

Informe Visión general de la Auditoría del sitio con el menú de configuración abierto mediante el icono de engranaje de la parte superior derecha. El menú Configuración es desplegable y puedes desplazarte hacia abajo para ver opciones de configuración adicionales. La lista de estas opciones está resaltada en rojo, así como el icono del engranaje, para que sea más fácil encontrarlos.

Utilizarás las mismas indicaciones anteriores seleccionando las opciones "Máscaras" y "Parámetros eliminados".

Ignorar restricciones del sitio web

Para auditar un sitio web en fase de preproducción u oculto mediante autenticación de acceso básico, en el quinto paso de la configuración hay dos opciones:

  1. Ignorar los comandos "disallow" en robots.txt y la metaetiqueta robots
  2. Rastrear con tus credenciales para eludir áreas protegidas por contraseña

Si quieres omitir los comandos de no permitir en el archivo robots.txt o en la metaetiqueta (normalmente, se encuentra dentro de la etiqueta <"head"> del sitio web),

tendrás que subir el archivo .txt proporcionado por Semrush a la carpeta principal de tu sitio web.

Puedes subir este archivo directamente a esta carpeta principal, del mismo modo que subirías un archivo para la verificación de GSC, por ejemplo. Este proceso sirve para verificar la propiedad del sitio web y nos permite rastrearlo.

El paso "Omitir restricciones del sitio web" de la Configuración de Auditoría del sitio. Cada Widget de este paso está resaltado en rojo. Una flecha roja bajo el número 1 señala la opción "Ignorar disallow en robots.txt y por metaetiqueta robots" marcada. La segunda flecha bajo el número 2 apunta a la opción "Rastrear con tus credenciales". La opción "Rastrear con tus credenciales" está activada, que presenta los campos de nombre de usuario y contraseña.

Una vez subido el archivo, puedes iniciar la auditoría del sitio y recopilar los resultados.

Para hacer un rastreo con tus credenciales, solo tienes que introducir el nombre de usuario y la contraseña que utilizas para acceder a la parte oculta de tu sitio web. Nuestro bot utilizará tus datos de acceso para acceder a las áreas ocultas y proporcionarte los resultados de la auditoría.

Programar

Por último, elige con qué frecuencia quieres que auditemos automáticamente tu web. Las opciones que tienes son:

  • Una vez a la semana (elige el día que quieras)
  • A diario
  • Una vez

Puedes cambiar tus preferencias siempre que quieras, dentro del proyecto.

Opciones de programar disponibles en la última pestaña del menú de configuración de Auditoría del sitio. Se abre un menú desplegable que muestra la opción semanal para cada día de la semana, la opción diaria y la opción de rastreo único.

Una vez completada la configuración, selecciona "Iniciar auditoría del sitio".

Resolución de problemas

En el caso de que aparezca el cuadro de diálogo "Ha habido un error en la auditoría del dominio", deberás comprobar que nuestro rastreador de Auditoría del sitio no esté bloqueado por tu servidor. Para garantizar un rastreo correcto, sigue nuestros pasos de Solución de problemas de auditoría del sitio para dar permisos a nuestro bot. 

Si lo prefieres, puedes descargar el archivo de registro que se genera cuando se produce el fallo de rastreo y proporcionar este archivo a tu webmaster para que pueda analizar la situación e intentar averiguar por qué está bloqueado el rastreo.

Vincular Google Analytics y Auditoría del sitio web

Tras completar el asistente de configuración, podrás conectar tu cuenta de Google Analytics para incluir problemas relacionados con tus páginas más vistas. 

Si sigues teniendo problemas al ejecutar la auditoría del sitio, consulta Solución de problemas de la Auditoría del sitio.

Mostrar más
Mostrar más
Mostrar más