logo-small

¿Cómo hacer una Auditoría SEO con SEMrush? Guía completa paso a paso

93
Wow-Score
La Wow-Score muestra si una entrada de un blog crea o no interacción. Se calcula en base a la correlación entre el tiempo de lectura activo de los usuarios, su velocidad de desplazamiento y la longitud del artículo.
Leer más

¿Cómo hacer una Auditoría SEO con SEMrush? Guía completa paso a paso

Fernando (Gomez) Ferreiro
¿Cómo hacer una Auditoría SEO con SEMrush? Guía completa paso a paso

¿Necesitas tener a mano una completa guía que te lleve de la mano en la realización de una auditoría SEO con SEMrush?  

En Indexando Marketing nos encanta hacer auditorías de páginas web.

El problema suele estar en que la información que ofrecemos puede ser complicada de interpretar por cualquier cliente aun cuando este tenga experiencia con otras agencias SEO. 

En este caso, vamos a explicar cuáles son los datos que ofrecemos en una auditoría con SEMrush.

Esta información no está redactada para un perfil de SEO alto, todo lo contrario, por lo que permitidme no ser purista a la hora de usar los términos. 

Lo primero que debemos explicar es que los datos que dan estas herramientas, ya sea SEMrush o cualquier otra, a veces tienen que ser revisados de forma manual, puesto que no siempre se encuentra toda la información que necesitamos o bien la información marcada como error en verdad no lo es por ser parte de la estrategia establecida previamente. 

En las auditorías de SEMrush tenemos un dato importante que es el “Total Score” y que indica el valor que da SEMrush dentro de la auditoría.

Seguro que te estás preguntado cuál es el valor correcto que debemos tener y la respuesta siempre es la misma: ¿por qué no vamos a llegar al máximo? Después de todo, es solo cuestión de horas de trabajo.

Aun así, por dar un dato, creo que lo mínimo que ha de tener un dominio es un Total Score de 85.

Antes que nada, hay que decir que lo normal en un proyecto es que la primera auditoría con Site Audit sea un desastre, no hay que tener miedo, como hemos dicho antes, es cuestión de horas y horas y horas de trabajo, para que os sintáis mejor os dejamos una gráfica de una auditoría de Google, pero un dato importante, solo se han analizado 20.000 URL de 7.290.000 URL que tiene Google.es

Auditoría Google.es

Aunque parece que con un total score o puntuación total de un 40% es un desastre ... su ventaja está en la velocidad que alcanza el crawler, es realmente impresionante el tiempo de respuesta. 

En este enlace tienes toda la información por si le quieres dar una vuelta link.

Diferentes puntos de la auditoría SEO con SEMrush

Estos son los diferentes elementos que podemos "auditar dentro de una auditoría", posteriormente, analizaremos todos estos puntos de una forma más precisa, de momento, es solo una introducción a toda la información que voy a explicar.

  1. Overview: Vista rápida del proyecto.
  2. Issues: Representación de todos los problemas a corregir. 
  3. Crawled Pages: Visualización del estado de salud de cada URL. 
  4. Statistics: Estadística analítica del dominio. 
  5. Compare Crawls: Comparativa de las diferentes revisiones. 
  6. Progress: Progreso las acciones realizadas.
  7. Consideraciones personales: Consejos y recomendaciones.

1.  OVERVIEW

Esta es una pantalla rápida de acceso a la información, donde podemos ver de forma ágil si tenemos algún problema desde la última auditoría realizada.

Auditoría SEO www.agenciadeseo.es

Una recomendación es que programéis siempre el envío de las auditorías a vuestro mail, de esta forma, si tenéis 30 proyectos, vais a ver rápidamente cuál es el proyecto más prioritario o si tiene un problema serio a solucionar.

Mucha atención al dato de “Crawled Pages” o “Páginas rastreadas” puesto que un aumento o descenso de este dato puede indicar un problema serio.

Al igual que a las gráficas de Errors, Warnings y Notices, puesto que nos van a informar gráficamente de la evolución de estos datos.

2.  ISSUES

Para mí, esta es la parte donde más tiempo debemos invertir.

Hay que prestar mucha atención al aumento o descenso de esta información.

No debes fiarte de que algo se solucione solo, todo tiene que ser parte de una estrategia. 

Issues Google.es

Los fallos se dividen en tres conceptos:

  • Errors: Son errores graves que incumplen la normativa de Google.
  • Warning: Fallos de nivel medio que ayudan a mejorar el SEO pero no son cruciales.
  • Notices: Son recomendaciones de SEMrush que pueden mejorar los rankings.

2.1  ERRORS

Al ser fallos graves estos datos deben de ser tratados de forma urgente.

Informe o no SEMrush de un fallo, tenemos que comprobar estos puntos de forma manual para corregir lo que el programa no puede ver, como puede ser un mal etiquetado o una estructura incorrecta.

Para esta parte, puedes usar herramientas complementarias como screaming frog para ver las estructuras de datos.

  • Pages have duplicate content issues

Pregúntate por qué Google va a mostrar dos veces en la misma búsqueda la misma información, si tenemos el mismo contenido en dos URLs de nuestro dominio, posiblemente Google se plantee cuál de ellas debe de posicionar primero y si son relevantes para el usuario las dos opciones.

Este suele ser un problema muy típico causado por la falta de estrategia, lo más aconsejable es tener un Excel con las estructuras de títulos, metas descripciones, H1 y H2 de todo tu dominio.

Con esta estructura bien definida y con unos objetivos, no deberías de tener problemas de duplicidades.

  • Pages have duplicate meta descriptions

Etiqueta HTML: <meta name="description" content="Somos una Agencia SEO."/>

Las meta descripciones son un punto fundamental a trabajar por dos motivos: por un lado, es un lugar que contiene palabras que ha buscado el usuario y, por otra parte, es una buena zona para llamar la atención de este.

Es lo que se conoce como CTR.

Si piensas en cómo reclamar la atención de los usuarios y cuáles son las palabras que se usarán para acceder a dicha información tendrás meta descripciones perfectas.

No debemos interpretar una duplicidad con un texto exacto sino con un porcentaje o parte de este, es decir, Google es un procesador matemático y va a valorar el contenido duplicado de una descripción a nivel porcentual.

Es muy típico cuando tenemos por ejemplo dos servicios o dos productos muy parecidos, por ejemplo un “teléfono rojo” y un “teléfono azul”.

Cuando los productos tienen la misma característica y solo cambia en una parte de la descripción se suelen dar problemas de duplicidades.

Aquí tenemos varias opciones, pero lo más recomendable es trabajar la descripción de cada producto introduciendo en cada uno diferentes palabras por las que busquen los usuarios.

  • Page doesn't have a title tag

Etiqueta HTML: <title>Agencia SEO</title>

No tener esta etiqueta dentro del HTML de tu dominio puede generar que el dominio no se posicione por los términos que necesitas, hasta ahí llega su importancia.

El título es un pilar del SEO, lo que significa que es algo que debemos de cuidar todo lo posible, una norma de Google es que este elemento debe ser único en todas las URL's del dominio y nosotros te aconsejamos que mejor que sea único en todo internet o bien seas el primero en crearlo.

Para solucionarlo tienes que recurrir una vez más a tu estrategia SEO.

Si no ves opciones posibles para solucionar la duplicidad de títulos, puedes usar un truco: decirlo como se diría en otro país, de esa forma también atraerás clientes de otras nacionalidades residentes en tu zona de venta o bien usar lo que se llama un “long tail” o decir lo mismo pero ampliando el concepto.

  • Page returned a 4XX status code

Los errores 4XX o errores 400 indican que hay un fallo en los enlaces que tienes en tu dominio.

Se les llama errores 400 porque hay distintos tipos como los 401, 402, 403, 404.

Lo normal es que aparezca el error 404, que significa que la URL no existe.

  • 400  Es debido a un "bad request" o "solicitud nula" o bien un problema de permisos en nuestro .htaccess.
  • 401  Es un fallo de autorización, normalmente al introducir usuario y contraseña.
  • 403  Es un fallo al acceso a un fichero al cual no se tiene permiso.
  • 404  El más clásico de todos, se produce cuando accedemos a una URL que no existe.
  • 406   Ocurre cuando le solicitamos algo que no puede ser interpretado por el servidor.

Es muy normal que con el tiempo en un dominio aparezcan y desaparezcan URL's.

Google piensa que tener errores 400 da una mala experiencia a los usuarios y aunque esto es algo que pasa en casi todos los dominios, lo tenemos que solucionar.

Para solucionarlo solo tienes que acceder al código de la URL donde te da el error y eliminar el enlace roto (en ocasiones también puede deberse a un bloqueo del sitio donde enlazas).

Hay SEO's que usan sistemas para que no aparezcan nunca este tipo de fallos, pero esto, es totalmente desaconsejable, si hay un fallo (sea cual sea) es mejor saber que existe y solucionarlo.

Una buena práctica es crear una buena página de errores para que el usuario se encuentre ubicado cuando encuentre un 404 y tenga una buena experiencia de usuario.

Aprovecha este tipo de páginas para dirigir a los usuarios donde realmente tienen que ir.

  • Sitemap.xml file has format errors

Los sitemaps son archivos con los que indicamos a Google donde se encuentra la información de nuestro dominio, de hecho, cuando accede a nuestro dominio para ver si tenemos o no algo nuevo o modificado, siempre acude a estos ficheros para averiguarlo.

Es muy común en algunos CMS como Joomla, PrestaShop y desarrollos a medida, que el sitemap.xml no se genere de forma correcta o que incluso esté bloqueando el acceso a Google mediante el archivo robots.txt (luego explicamos este archivo).

Si tenemos un problema en el sitemap.xml vamos a despistar a Google sobre lo tiene que indexar, tenemos que procurar tener siempre este archivo de forma correcta.

Para solucionarlo, te aconsejo siempre acudir a un programador, es algo tan importante que siempre va a merecer la pena solucionarlo cueste lo que cueste.

Otro consejo en el uso de un sitemap es segmentar la información, es decir, ofrece diferentes sitemaps para que Google acceda de forma independiente.

En la ayuda de Google puedes encontrar la explicación para crear diferentes tipos de sitemaps específicos: vídeos, imágenes, páginas, artículos…

Otra ventaja de segmentar la información es que si tienes un fallo en uno de estos archivos, te va a ser siempre más fácil encontrar donde se encuentra.

En Search Console tienes la opción de añadir los sitemaps que hayas creado y, de esa manera, también verás si son correctos.

Si has creado o modificado algún sitemap.xml en tu dominio te recomiendo que lo borres de Search Console y lo vuelvas a subir, es una manera de asegurarte de que sean rastreados.

  • Page has a WWW resolve issue

Este fallo nos indica que los usuarios (y Google) pueden acceder a tu domino con y sin las www.

Las “www” son un protocolo, es decir, una forma de acceder a tu dominio.

El problema está en que podemos hacer que los usuarios visualicen información diferente bajo la misma URL si modificamos este protocolo.

Otro problema relacionado con esto, es el hecho de usar o no esta barra al final de cada URL “/”.

Tenemos que definir si la va a llevar siempre o no pero hay que tener una norma para todo el dominio en este sentido.

Ejemplo:

  1. http://www.agenciadeseo.es/
  2. http:// agenciadeseo.es

Esto es algo que genera errores en toda la estrategia, contenidos duplicados, si ofrecemos la misma información al usuario con y sin las www.

Según Google, esto no es un fallo grave, según yo, puede generar problemas de indexación (número de URL's que están presentes en Google) y sí nos va a dar problemas en función del número de URL's que tengamos en nuestro dominio.

Si no solucionas este fallo, también puede que estés diluyendo tu estrategia de link building (estrategia de enlaces entrantes / backlinks) puesto que los usuarios pondrán el enlace como les plazca y, casi seguro, que no va a ser como más nos convenga en la estrategia de enlaces.

Existen muchas formas de solucionar este error, puedes usar una estrategia de redireccionamiento (301) o bien puedes hacer que todo esto se solucione con la correcta configuración del archivo del servidor llamado .htaccess para lo cual te recomiendo la ayuda de un programador.

El .htaccess no es un fichero que pueda tocar cualquiera.

  • External images are broken

Este error indica que hay imágenes externas que están rotas o bien no tienes acceso a ellas.

Esto puede ocurrir porque el dominio externo está caído o bien ha dejado de existir.

Para empezar, no es recomendable que se usen imágenes externas, pero si tienes que usarlas por necesidad, procura que éstas estén siempre online o verás este error de forma constante.

Para solucionarlo solo debes de acceder a la URL donde te dice SEMrush que tienes esta imagen externa rota y modificar el enlace con uno actual o bien eliminar el enlace a la imagen exterior.

  • Pages couldn't be crawled

Aquí, nos está indicando que hay alguna página o URLa la que Google no puede acceder, ¿es esto un fallo?

No necesariamente, pero debemos de estar atentos de que Google pueda acceder sin problemas a las URLs que queremos que aparezcan en Google.

Si tienes páginas bloqueadas a Google estas no aparecen en este buscador y si no aparecen en él, evidentemente no nos va a generar posicionamiento o tráfico en el dominio.

Normalmente este tipo de cosas ocurre por varios factores: 

  • Tenemos la etiqueta “<meta name="robots" content="noindex"/> en la URL en cuestión.
  • El archivo robots.txt está bloqueando el acceso a una carpeta o una URL.
  • Los DNS (luego os cuento qué son) están bloqueando el dominio.
  • La URL tienen formatos incorrectos.

Para solucionarlo, solo debes de averiguar qué es lo que está haciendo que no indexe (aparezca en Google) y reparar dicho bloqueo.

Como he dicho al principio, no tiene que ser un error como tal, dentro de las estrategias SEO debemos de ser conscientes de que no todo tiene que estar en Google en un dominio, de hecho, en muchas ocasiones, desde la agencia bloqueamos el acceso a URLs que no tienen sentido que existan (productos descatalogados, sesiones de compras, información demasiado antigua o que no generen ningún tipo de tráfico cualificado o no aporten valor al dominio …) y lo que pasa a continuación, es que Google se centra en lo que tiene que leer y automáticamente sube en el ranking de resultados.

  • Pages couldn't be crawled (DNS resolution issues)

Este es un fallo muy raro, de hecho casi nunca lo hemos visto.

Lo que nos está indicando es que los DNS o Domain Name Services no están funcionando bien o directamente no están funcionando.

Para que nos entendamos un poco, un DNS digamos que es un paso intermedio entre el usuario que busca en Google y el acceso a la información en nuestro servidor, realmente lo que significa (no te asustes) es resolución inversa de nombre o lo que es lo mismo, convierta una IP en un dominio.

  • Pages couldn't be crawled (incorrect URL formats)

Este fallo lo que nos indica es que hay caracteres incorrectos en las URLs y, por este motivo, Google no puede indexar dicha URL.

Google quiere que usemos siempre caracteres alfanuméricos sin caracteres latinos como las “ñ”, acentos, espacios en blanco, guiones bajos como “_” y, ya que estamos, os aconsejo que uséis siempre caracteres en minúsculas.

Pero la realidad es que en ocasiones nos hemos encontrado URL's con estas características que no debes usar, con un posicionamiento mejor que incluso otras URLs del mismo dominio, aún así no son aconsejables de usar.

Para solucionar este fallo, te recomiendo que uses siempre un redireccionamiento 301 si vas a cambiar una URL por otra.

  • External links are broken

Este error indica que tienes enlaces en tu dominio que apuntan a otros que ya no existen.

Otra cosa que puede pasar también es que el dominio al que estás enlazando esté bloqueando tu enlace.

El problema lo vas a tener tanto en la experiencia de usuario como en que estás también rompiendo tu estrategia de link building interno (estrategia de enlaces interno).

En mi opinión, esto no afecta negativamente a tu estrategia SEO pero si te puedo decir que no ayuda.

Para solucionar este fallo tienes varias opciones, la más cómoda es eliminar el link de la URL que te está indicando y dejar la palabra que enlaza sin enlace.

Otra opción es modificar el enlace a otra parte del dominio o mi preferida: modificar el enlace para llevar a información más actualizada.

  • Internal images are broken

Este punto nos indica que tenemos imágenes rotas, es decir, no tienen la ruta correcta, bien por haberse movido o eliminado la imagen del servidor.

Como decía antes, todo lo que está roto debe ser solucionado.

Una imagen rota genera dos inconvenientes: primero vas a hacer que tu web cargue más lenta porque el navegador va a esperar a ver si, por casualidad, la imagen aparece y, por otro lado, vas a crear una mala experiencia de usuario denotando dejadez en tu dominio.

Para solucionarlo tienes dos opciones, primero accede a la URL marcada y luego, puedes volver a subir una imagen o bien no usar ninguna imagen.

Quiero aprovechar para decir que las imágenes son una parte significativa de muchos proyectos y no pueden perderse, en SEO lo debemos cuidar absolutamente todo.

  • Issues with duplicate title tags

Este error nos habla de las duplicidades de los títulos.

Un poco más arriba hablaba del problema de no tener un título, pues igual de negativo puede llegar a ser tener los títulos duplicados.

El problema en sí, no es tener los títulos duplicados.

El problema radica en que no vas a saber exactamente cómo se va a tomar dicho error Google, es decir, va a indexar los dos títulos y los va a colocar uno debajo de otro en las primeras posiciones o bien se “enfadará” y al no saber cuál es el importante no pondrá ninguno de estos en los primeros resultados.

Normalmente y dependiendo de la competencia y autoridad de un dominio, Google hará una u otra cosa.

Para solucionar este error te recomiendo que mires que keywords tienen posicionadas las dos URLs y en función de este dato decidas modificar el título de una de las dos.

  • Pages returned 5XX status codes

Los errores 5XX (quinientos)  son errores que se producen en el servidor, estos errores son de obligada solución.

  • 500  Se refiere a un fallo del servidor, normalmente por estar apagado.
  • 504  Ocurre cuando el servidor rinde demasiado y es incapaz de responder en un tiempo correcto.
  • 509  Pasa cuando se supera el ancho de banda (tráfico que puedes obtener de tu proveedor de internet) contratado.

El más común de todos es el 500 y es el que más hay que tener en cuenta, puesto que si el servidor está fuera de juego nadie puede acceder a tu web, incluido Google.

Esto indica que empezará a quitarte URLs de sus resultados poco a poco.

Esta es una técnica que usan algunas empresas de Black SEO para hacerte desaparecer de Google si no pueden contigo.

Este fallo hay que solucionarlo lo más rápido posible, normalmente con reiniciar el servidor debería ser suficiente pero esto no ocurre en todos los casos.

Aquí es cuando entran en juego las copias de seguridad, os recomiendo que si por algún motivo nada funciona, la forma más rápida de solucionarla es no centrar todos los esfuerzos en intentar solucionar lo que sea que le pase al servidor y usar la copia de seguridad en otro servidor que sí funcione, luego lo único que tienes que hacer es cambiar los DNS (es donde se registra el servidor que tiene la web) para que apunten al nuevo servidor.

Una vez esté todo solucionado ya tendrás tiempo de ver qué le pasa al antiguo servidor.

  • Robots.txt file has format errors

Este es un fichero de vital importancia en SEO y un gran desconocido para muchos.

Es tan importante una buena configuración que es algo que siempre has de dejar en manos de un experto SEO.

A este fichero se le puede sacar mucho partido, tiene dos funciones principales: decirle a Google qué es lo que puede tener en sus resultados y lo que no, aparte de definir quién tiene acceso a tu web y quién no.

Con la configuración de acceso a la información (URL o rutas) vas a poder, sobre todo, evitar contenido duplicado o contenido de baja calidad en los resultados de Google, haciendo así que el buscador se centre en la información importante.

Un ejemplo: si solo tienes un autor en tu blog en Wordpress y utilizas esta línea de comando “Disallow: /author/” vas a evitar una duplicidad con la categoría principal y si usas “Disallow: /comments/” evitarás que se indexen los comentarios fuera de la página que se generaron o si usas este otro “Disallow: /*?s=” evitarás que cualquier SEO malvado lo use para inundar a Google  de resultados no relevantes.

Definiendo quién tiene y quién no tiene acceso, vas a evitar que estos “bots” o robots consuman los datos de tu server pero lo más importante será que tendrás en Google Analytics unos datos más certeros sobre tu tráfico directo y referral.

No quiero que entendáis que existe una configuración correcta de este fichero, cada estrategia SEO persigue unos objetivos, de ahí que cada dominio, independientemente del CMS contenga una configuración diferente.

Un consejo, en Search Console tienes una herramienta para ver si este fichero tiene algún tipo de fallo, igualmente, si realizas algún tipo de modificación en este fichero es más que recomendable que le des a “probar” en esta herramienta para que Google sea consciente de que existe una modificación.

  • Internal links are broken

Este error indica que dentro de nuestro dominio existen enlaces a otros puntos de nuestro dominio que han sido borrados o modificada su URL.

Esto va a crear problemas de usabilidad (experiencia de usuario) a los usuarios y vas a hacer un lío a Google a la hora de indexar tu contenido, ya que Google se ayuda de los enlaces internos para saber que contenido existe.

Para solucionar este problema solo tienes que acceder a las URLs que se marcan y modificar el enlace a un punto correcto.

  • Wrong pages found in sitemap.xml

Este fallo indica que algo va mal en nuestros sitemaps.

Un sitemap no es más que un documento en el que indicamos a Google qué URL tenemos dentro de nuestro dominio, de ahí la importancia de que esté perfecto.

Los errores más habituales son:

  • No contiene todas las URLs de nuestro dominio.
  • Contiene URLs que no están dentro de nuestro dominio.
  • Contiene URLs duplicadas.
  • Contiene caracteres que hacen que sea ilegible su contenido.
  • Tienen un peso (KB) superior al tiempo que Google dedica a su rastreo.

Existen diferentes estrategias que podemos usar para sacar un mejor rendimiento en SEO pero la estrategia más habitual es la de la segmentación y la especificación.

Cuanto más dividido tengamos un sitemap más fácil va a ser averiguar si existen o no errores en él.

Imagina que Google te dice que no tienes una URL indexada (aparece en Google) en un sitemap con más de 10.000 URL's, como comprenderás, será complicado averiguar cuál es la URL afectada.

Si segmentas un sitemap en diferentes archivos (Google no va a poner problemas con esto) como pueden ser sitemap del blog, sitemap de página, sitemap de producto, sitemap de imágenes, sitemap de vídeo … te será más fácil averiguar donde se encuentra el error.

Lo único que tienes que hacer es subir a Search Console todos los sitemaps que hayas creado y de esta forma, Google te validará que esté correcto, aun así, no te fíes de todos los fallos que puede indicar Search Console.

Yo he hecho comprobaciones sobre los fallos de indexación que da Google en esta herramienta y donde decía que todo estaba bien, había fallos y donde decía que había fallos, estaba bien.

Con esto lo único que digo es que debes de prestar atención a que todo esté realmente correcto, sobre todo cuando te indica un error.

Cuando hagas una modificación en los sitemaps, es muy aconsejable hacer una comprobación en Search Console, de esta manera Google se dará cuenta antes de la actualización.

Un sitemap está compuesto de los siguientes elementos:

  • URL: URL.
  • Prioridad de rastreo: es decir, qué es lo primero que Google ha de mirar al acceder al sitemap
  • Imágenes: Número de imágenes en la URL. 
  • Ch. Freq.: Frecuencia de rastreo indica cada cuánto tiempo ha de acceder a dicha URL.
  • Last Mod.: Fecha de la última modificación en el contenido de la URL.

Ahora un poco de historia, cuándo el algoritmo de Google estaba comenzando a utilizarse, Google declaró que usaba como factor SEO los valores que tenemos en los sitemap de “Ch. Freq.” y “Last Mod.”

Como los SEO's modificábamos estos valores con un script (un programita) Google dijo que dejaría de usarlos, pero esto es algo de lo que aún no estoy seguro que sea así.

Un dato: Google ofrece diferentes formatos específicos de sitemaps, esto indica que, si es posible, debemos probar estas recomendaciones.

Sobre todo, si tienes un modelo de negocio específico como el de un fotógrafo, puesto que existe un sitemap específico para imagen o para una empresa si utiliza el vídeo marketing como estrategia.

  • Pages have no viewport tag

Este error indica que la URL que marca este error no contiene la etiqueta “meta viewport” que se usa para temas de dispositivos móviles, de ahí, su importancia.

Indica cual va a ser la parte visible de la pantalla en un dispositivo.

Este es su formato: <meta name="viewport" content="width=device-width, initial-scale=1.0">

Google está muy centrado en los dispositivos móviles, cualquier fallo en móvil va a tener una consecuencia, sobre todo, desde que indicó que había cambiado la forma de trabajar con “mobile index first” o lo que es lo mismo y siendo muy escueto, en la explicación: usará la indexación en móvil en PC.

Esto puede también ser debido a que Google hace unas semanas decía que esperaba que el 75% de las búsquedas en 2017 sean desde dispositivos móviles.

  • Pages have too large HTML size

Este error indica que el tamaño del HTML es demasiado pesado, es decir, tienes tanto contenido en una sola URL que a Google le va a costar trabajo indexar todo.

Si tienes un HTML demasiado largo o pesado vas a tener problemas de indexación (aparecer en Google) ya que Google va a ser reticente a acceder a dicha URL y seguro que vas a tener una URL lenta, lo que va a hacer que te quite el posicionamiento logrado.

La mayoría de las veces que ocurre esto, el problema no suele estar en una sola URL, sino en casi todo el dominio.

Esto se debe a que la plantilla usada para ofrecer el contenido no está optimizada.

Otra palabra que tienes que conocer es “DOM” que se puede explicar cómo el número de elementos de HTML que incluye dicha URL.

Si tienes más de 1.000 elementos vas a dificultar la indexación.

Un dato más que creo interesante es el valor actual para que se declare que un HTML es demasiado pesado: 100Kb.

Esto es así, porque es el máximo aceptado por Google por rastreo de una URL.

Ahora bien, las cosas cambian y los servidores de Google tienen cada vez mayor capacidad, por lo que se cree que ha aumentado este valor al doble.

Aún así, no aconsejo que se supere el valor de 100, es más, cuanto menor sea su peso más rápida irá la descarga

  • AMP pages have no canonical tag

El AMP o Accelerated Mobile Pages Project es la niña bonita de Google y ya es parte del futuro del SEO en móviles.

En este caso, SEMrush te está indicando que la etiqueta canonical hace referencia a una etiqueta de HTML que se usa (por decirlo rápido) para mostrar qué URL es la que tiene autoridad.

El actual problema que tiene la tecnología AMP es que si somos puristas en SEO, estamos creando contenido duplicado, puesto que para el AMP lo que hacemos (es automático), es crear la misma URL pero terminada en /AMP, de ahí la importancia del uso de la etiqueta canonical.

En Search Console tienes una herramienta específica para averiguar si la versión AMP de tu dominio es o no correcta, independientemente del correcto funcionamiento de la canonical.

Una cosa importante, el AMP es algo que todos debemos de ir implementando, sobre todo, si tenemos un modelo de negocio basado en la información, puesto que Google ya está mostrando en sus resultados de noticias esta tecnología que aumenta por diez la velocidad de carga de una URL.

  • Hreflang implementation issues

Este error indica que hay algún tipo de fallo en la estructura del HTML de esta etiqueta, lo que hará que Google no la reconozca.

El error más común es que no estén bien direccionadas las estructuras de los enlaces.

Lo más clásico es colocar todas las URLs de un idioma a la home (página principal) lo que es un error, repito, cada etiqueta hreflang debe de dirigir al mismo contenido con diferente lenguaje, no debe de dirigir a cualquier lugar.

La etiqueta hreflang se usa cuándo tenemos un dominio con diferentes idiomas e indica la variante de un idioma.

Esta es una parte de la herramienta que aún está en BETA, es decir, no está 100% probada y en parte es completamente normal, puesto que incluso Google ha dado muchos fallos en su propia herramienta de validación de código para esta etiqueta.

Un ejemplo:

  • <link rel="alternate" href="http://domain.com/en" hreflang="en" />
  • <link rel="alternate" href="http://domain.com/es" hreflang="es" />

Si no solucionas este problema Google no va a saber valorarte como un dominio internacional y vas a perder un valor que estás trabajando.

  • Hreflang conflicts within page source code

En este caso, lo que nos está indicando es que puedes tener un conflicto en el etiquetado, como por ejemplo apuntar dos etiquetas del mismo lenguaje a dos URLs diferentes.

Si tienes un conflicto, lo que pasará es que Google no sabrá cuál es el enlace correcto.

Lo que tienes que hacer para resolver este problema es averiguar donde se encuentra el conflicto y dejar solo la URL correcta.

2.2  WARNING

Recuerda que esto son solo advertencias sobre las circunstancias de tu dominio, debes de plantear si realmente se deben de solucionar y alinear el plan de mejora del dominio con estas acciones si definitivamente decides solucionarlo.

  • Pages have low text-HTML ratio

Aquí nos está indicando que en relación al HTML que tiene una URL no hay suficiente texto, no debemos entender que no haya suficiente texto, sino que en relación a todo el HTML, no hay tanto texto.

Este problema hay que solucionarlo para que Google guarde en sus servidores más información que HTML, después de todo, el HTML no es relevante para los resultados de Google.

Para solucionar este fallo tienes dos opciones, si es un fallo común en todo el dominio lo recomendable es que un programador arregle o cambie la plantilla usada en el dominio.

En muchas ocasiones es tan fácil como quitar del HTML las estructuras de HTML, en otras, te vas a ver obligado a cambiar el tema de tu web.

Si vas a solucionar este problema asegúrate de optimizar la velocidad de carga, seguramente el coste de esta acción no sea demasiado si realizas ambas acciones conjuntamente.

Doy por hecho que si vas a cambiar el aspecto de tu dominio no caigas en el mismo error de seleccionar otra plantilla con el mismo problema.

  • Pages have a low word count

En este caso, lo que nos está indicando es que dichas URLs no tienen suficientes palabras para cumplir con la normativa de Google.

Esto no es algo que debas solucionar de forma inmediata, recuerda que no es un error sino un warning.

Antes de ejecutar cualquier acción es más que aconsejable que analices los datos de las URLs afectadas.

Para solucionarlo, recuerda que con SEMrush tienes la opción de analizar un dominio o bien una sola URL.

Si la URL ya está posicionada por las keywords que tienen que estar posicionadas no te aconsejo que toques la densidad de texto, si no ha alcanzado sus objetivos, modifica el contenido para seguir la normativa de Google.

  • Pages have underscores in the URL

Indica que tienes caracteres como “ñ,%20%,_” y otros más dentro de tu URL, lo que en principio puede crear un problema de indexación, pero puede no significar que lo tenga.

En muchas ocasiones he visto URLs con estructuras lamentables que posicionaban dentro de un dominio mejor que aquellas que sí seguían las normas de Google.

Antes de ponerte a solucionar este warning debes  analizar si dicha URL tiene tráfico por SEO o no.

Si lo tiene, has de plantearte no tomar medidas (depende de la estrategia SEO global) pero si no recibe tráfico desde Google puedes plantear crear una URL con una estructura correcta y hacer un redireccionamiento 301 de la URL antigua a la nueva, de esta forma, no perderá el poco valor que tuviese.

Una recomendación en este tipo de warning es complementar SEMrush con el análisis de URLs que te da Search Console u otra herramienta de SEO.

Siempre es bueno asegurarse antes de realizar cualquier acción.

  • Pages don't have an h1 heading

Aquí nos está indicando que dentro de una URL no existe la etiqueta de HTML - H1 y esto más que un warning debería de ser tratado como un error y os explico el porqué: las etiquetas H1 son uno de los factores SEO más importantes, puesto que Google es algo que siempre valora para ver cuál es el foco SEO que queremos darle a una URL.

Todas las URL's tienen que contener esta etiqueta.

Si no tenemos la etiqueta H1 estamos perdiendo una gran oportunidad de indicarle a Google en qué sentido queremos posicionar una URL.

Que esta etiqueta no esté en algún punto de nuestro dominio puede ser perdonable, pero que no esté en la página principal o home es un error imperdonable porque la H1 de la home ayuda a posicionar rápido en nichos no muy competidos.

Ahora bien, puedes ir a hacer marca o ir a por una keyword de tu modelo de negocio.

Aquí la estrategia SEO puede ser muy diferente en función de cada proyecto, pero a groso modo tenemos que solucionarlo de la siguiente manera: si ya tienes H1 en tu dominio revisa que cada URL esté posicionada por el contenido de texto de cada H1 y de no tenerlo, aún puedes ver qué keywords tiene dicha URL posicionada y usar el H1 para aumentar el ranking de la misma en esa URL.

Una aclaración, la normativa de Google indica que no debes usar más de un H1 en una URL pero esto no es realmente así, no es algo que se tenga que hacer como norma pero no va a pasar nada si usas más de un H1 en alguna que otra URL.

Lo que va a pasar si usas más de un H1 en una URL es que Google va a tomar como representación la primera que encuentre dentro del HTML.

Pero repito, no lo uses como norma.

  • Pages have too many parameters in their URLs

Aquí nos está indicando que la URL contiene parámetros (variables de programación) que pueden afectar negativamente o no a nuestra estrategia SEO.

Ejemplo: domain.com/mode=sand&s_qpage=1&s_qtext=armario&s_qver=sall

En estos casos, podemos tener un problema de contenido duplicado puesto que una URL mostraría la misma información que otra o bien Google sería incapaz de rastrear dicha información.

Hay que tener mucho cuidado con el número de parámetros que incluimos en una URL puesto que hay dispositivos móviles que no tienen capacidad de interpretar una URL con más de 250 caracteres en total, algo que puede ocurrir si incluimos demasiados.

Otro aspecto que has de valorar aquí es si realmente son necesarios o bien puedes utilizar otra estructura de URLs que mejoren el rendimiento SEO de tu estrategia, como puede ser el uso de categorías.

Ejemplo: domain.com/armario/sall

Para saber si tienes que solucionarlo o no, lo único que tienes que hacer es analizar qué es lo que vas a conseguir con esta estrategia de URLs o si bien otra estrategia sería mejor, al igual que pensar si estas URLs deberían estar indexadas o no.

  • Images don't have alt attributes

En este caso, nos está diciendo que no tenemos texto dentro del atributo alt de una imagen.

El atributo alt no es más que parte del código HTML que podemos incluir dentro de una imagen para indicarle a Google el significado de esta.

Google no entiende las imágenes por mucho que se esfuerce, con esta etiqueta le estamos diciendo exactamente el contenido de una imagen, de ahí la importancia de que una imagen tenga este atributo bien construido.

Ejemplo: <img src="imagen.jpg" alt="Descripción SEO">

No hay que olvidarse de que las imágenes deben formar parte de nuestra estrategia SEO.

Puede ser un valor diferencial ante nuestra competencia.

La herramienta solo te indica qué imágenes no tienen este atributo, por lo que la solución se basa en incluirle en este atributo el texto correcto, que normalmente parte del posicionamiento o estrategia que tenga la URL que la contiene.

El problema radica en que no te indica si el atributo alt está correctamente introducido, lo que nos va a obligar a hacer siempre una revisión de si es o no correcto el contenido que contienen todas las imágenes.

Dependiendo del CMS (wordpress, prestashop) así tendrás una forma u otra de incluir este dato en cada imagen.

  • Pages have too much text within the title tags

Nos indica que la etiqueta “title” (el título de la URL) es demasiado larga como para mostrarse correctamente en Google.

Esto es algo que Google no acepta bien, pues entiende que no le estamos ofreciendo al usuario toda la información.

Sobre todo, tenemos que entender que en cada dispositivo vamos a tener un máximo de información que mostrar al usuario.

Ejemplo: <title> Don Quijote de la Mancha | Cervantes </title>

Lo normal es hacer una estrategia con un máximo de 70 caracteres pero dependiendo del objetivo de la estrategia así deberá de ser el tamaño del título.

Es decir, si quieres atraer un tráfico SEO desde dispositivos Smartphone deberás de adaptar tu título a este tipo de dispositivo y así con cada uno.

Las actuales estrategias de SEO indican que cuanto más corto y preciso sea el título más efectivo será.

  • Pages have slow load speed

Nos indica que la URL es demasiado lenta.

Tener una URL lenta es tener un problema a solucionar.

Hay que analizar si nuestra URL es lenta en un navegador, un dispositivo o una localización, como siempre, dependiendo de la estrategia.

Google ya tiene incluida la velocidad como un factor SEO, si tenemos URLs lentas es cuestión de tiempo que empecemos a tener problemas de indexación y lo más importante, con nuestros usuarios.

Los usuarios no somos pacientes, sabemos lo que queremos ver y lo queremos ya, si no es así, lo buscaremos en el resto de páginas que sabemos que pueden ofrecer la misma información.

Debemos valorar cuando una URL nace lenta o cuando una URL se hace lenta.

Si una URL nace lenta puede ser un problema la indexación del contenido de esta.

Probablemente por introducir demasiadas URLs o scripts (programitas) pero si una URL que estaba bien se vuelve lenta es por dos motivos: un fallo del servidor o un fallo en la programación, de ahí que debamos de estar muy atentos siempre a este tipo de warning y resolverlo.

  • Pages have temporary redirects

Ahora simplemente nos está advirtiendo de que existe un número de URLs con un redireccionamiento, o lo que es lo mismo, hay una URL que al abrirla ésta envía al usuario hacia otra URL.

Al estar enviando a un usuario o a Google, de URL a URL lo que estamos haciendo realmente es hacerle perder el tiempo rastreando.

Esto no es que sea el mayor problema que podamos tener en SEO pero sí es cierto, que si tenemos un número elevado de redirecciones en nuestro dominio estaremos haciendo perder el tiempo a los usuarios.

Para solucionarlo deberemos evaluar si estas URLs deberían estar redireccionadas o no.

Para tomar esta decisión lo mejor es averiguar si la URL está indexada en Google o si tiene algún enlace de interés.

Sino solo debemos  eliminar esta redirección, bien desde la configuración de nuestro CMS o del archivo .htaccess.

  • Sitemap.xml not found

Indica que no encuentra el archivo sitemap pero no está diciendo en ningún momento que no exista.

Como hemos comentado antes, no tener un sitemap puede ser un problema por lo que está bien hacer un check sobre este punto.

Revisa que exista el sitemap y que Search Console tenga constancia de él.

  • Pages don't have enough text within the title tags

En este caso, nos está indicando que el texto del título es corto, pero como siempre tenemos que saber si es porque está dentro de una estrategia SEO.

Los títulos son algo que podemos ir modificando en una estrategia si no conseguimos los resultados deseados.

Y si vemos que tenemos una serie de URLs que tienen un título corto que no ha conseguido resultados es un buen punto de partida para empezar a reestructurar el dominio.

En caso de querer modificar el tamaño de un título es recomendable usar dos estrategias: o bien vamos a marca, es decir, introducimos la marca en el título del dominio o bien la usamos para incluir keywords que nos interesen posicionar.

Busca siempre aumentar el CTR (número de veces que nos hacen clic en los resultados de Google) con palabras que llamen la atención del usuario y pertenezcan a la estrategia SEO como “presupuesto gratuito”, “la mejor guía de” y palabras que convenzan a los usuarios.

  • Page doesn't have a meta description

Este dato dice que no tenemos el atributo de descripción.

Ejemplo: <meta name=”description” content=”Descripción del contenido " />

Tener esta etiqueta correctamente configurada es muy importante a nivel estratégico, tan importante que hay que invertir tiempo en ver cuál es la meta descripción correcta que has de usar en cada URL.

Es muy recomendable que incluya las keywords por las que queremos posicionar una URL.

Que una herramienta SEO diga que no hay ningún fallo no significa que esté bien.

Aquí ocurre lo mismo que con el atributo alt de las imágenes, el hecho de tener un fallo no indica que no debamos de invertir tiempo en analizarlo manualmente.

  • Pages have no hreflang and lang attributes

Ya hemos visto que podemos saber si tenemos algún conflicto o un fallo de implementación, en este caso, nos está indicando que una URL no tiene este atributo.

No tenemos que preocuparnos si nos marca un warning en el caso de que nuestra web no esté en diferentes idiomas.

Si nuestro dominio tiene varios idiomas, todas las URLs tienen que tener esta etiqueta, por lo que esta parte de la herramienta será de gran utilidad para detectar posibles fallos.

Las herramientas actuales para crear la etiqueta hreflang no funcionan al 100% en todos los casos, debemos  tener cuidado para no perder esta funcionalidad.

En el caso de tener un fallo es mucho mejor que un programador ponga una solución definitiva a este problema.

  • Pages contain frames

Los frames o iframes son fragmentos de códigos que podemos usar en nuestra web para sacar o incluir información de otras webs, lo que va en contra de las políticas de calidad de Google.

Esto es algo que no siempre puede solucionarse porque en algunos casos es una necesidad, como incluir un vídeo o una información variable.

Otro dato que hay que tener en cuenta es que los frame son unas etiquetas de HTML muy antiguas que no están soportadas por lenguajes de HTML como el HTML5.

Aun así, tenemos que ser capaces de dar una solución o bien buscar la fórmula para intentar sacar los frames o iframes de nuestras URLs.

Siempre hay opciones.

  • Pages don't have doctype declared

Es difícil definir el “doctype declared” puesto que siempre se ha conocido por este nombre, la definición técnica sería “declaración de tipo de documento” que indica que formato de HTML va a poder recibir el navegador y la forma en la que se serializada el HTML.

Aunque SEMrush dé un fallo siempre es bueno, debido a la multitud de tipos de “doctype declared” que existen, comprobarlo con “W3C's validation service”.

Tener mal definido el “doctype declared” nos puede dar problemas con las etiquetas de HTML que podamos usar.

Aunque es cierto que este fallo es algo que parte más de una programación a medida, realmente en un Wordpress, prestashop y demás va a ser muy difícil encontralo.

  • Pages have too many on-page

En este caso, lo que nos está indicando es que tenemos demasiados enlaces en una URL.

Esto provoca que Google tenga dificultad para analizar todo el contenido que está enlazado.

Si no lo solucionas puedes tener dos problemas, el más importante es que puedes hacer que tu “crawler buggest” se vea afectado y, por otra parte, vas a repartir tanto la autoridad de esa URL que no va a aportar ningún valor por si misma.

Esto es algo que se puede solucionar de mil maneras, normalmente cuando tenemos esta notificación es porque tenemos el mismo enlace desde diferentes puntos, por lo que eliminando uno de estos no deberíamos tener muchos más problemas.

Otra opción es disminuir el número de elementos que tienen enlaces y así controlar el número de estos.

  • Pages use Flash

Si aparece este fallo es que tienes una web realmente antigua, Flash tiene un formato tipo .swf, es un lenguaje o archivo que Google no entiende.

Confieso que llegué a amar Flash (MX) pero era totalmente compresible que lo prohibiera.

A Google no le hace gracia que puedas usarlo para colocar información que no tenga Google controlada, de ahí el problema.

Si lo tienes es muy recomendable que uses cualquier otro formato, como el vídeo.

  • Pages don't have character encoding declared

Los character encoding son etiquetas de HTML que sirven para definir el tipo de caracteres que se van a usar en una URL, de esta forma podemos o no definir acentos o cualquier carácter.

Ejemplo de uso de esta etiqueta:

  • HTML4: <meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
  • HTML5: <meta charset="UTF-8">

Cuando no tienes esta etiqueta bien declarada vas a tener un código “sucio” y posiblemente los usuarios no visualicen correctamente la información, de ahí su importancia.

Es un error atípico de los CMS, es más un despiste de programación que un error en sí mismo.

Para solucionarlo solo debes de colocar la codificación correcta en el HTML.

  • Pages have duplicate H1 and title tags

Nos está indicando que tenemos duplicado el contenido (texto) de la etiqueta H1 y la etiqueta title.

Esto no es algo que debas solucionar si forma parte de tu estrategia, hay ocasiones en las cuales es mejor una duplicidad y otras ocasiones en las que no.

Si decides usar esta referencia de SEMrush el mejor consejo que te puedo dar es que utilices una de las dos etiquetas para la keyword exacta que más tráfico atrae (volumen de búsquedas mensuales) y otra para usarla con un long tail (keyword con menos búsquedas pero que al ser más amplia puede ser menos competitiva).

  • Internal links contain nofollow attributes

Cuidar nuestros enlaces internos es algo que como SEO debemos de saber, el atributo de HTML nofollow indica que no queremos que se siga este link (enlace), lo que en principio hace que Google no siga o rastree dicho enlace.

Esta es otra de las cosas que tenemos que pensar si solucionar o no, puesto que depende si eres un B2B (Business To Business) o un B2C (Business To Consumer) puede o no interesarte hacerlo.

En el caso de los B2B es completamente necesario no tener ningún warning en este punto, puesto que todo lo que hay en la web debe ser indexado y comprendido por Google pero, en el caso de los B2C nos podemos encontrar sesiones o compras del carrito de la compra con este atributo, lo que es correcto, es decir, no ha de modificarse este atributo nofollow.

Para solucionar este error es completamente necesario tocar la programación de la web, por lo que es recomendable que lo haga un programador. 

  • Sitemap.xml not indicated in robots.txt

Ya he hablado en el punto “Robots.txt file has format errors“ sobre la importancia de este fichero.

En la configuración del mismo tenemos la posibilidad de indicar donde se encuentra el sitemap del dominio, lo que puede ser conveniente en algunos casos.

Si tienes un solo sitemap es muy recomendable colocarlo en el robots.txt, pero si usas estrategias de SEO de segmentaciones de sitemaps, no es recomendable que le indiques a Google donde se encuentra el sitemap e indicar su ubicación por Search Console.

Hay muchas formas de hacer un fichero sitemap para indicarle a Google todo tu contenido pero aunque solo exista la especificación de Google de que tiene que ser un formato válido, también puedes usar estrategias de segmentación y reducción del peso de esto para que sea más efectiva la indexación y la solución de errores.

  • Pages have more than one h1- heading

La etiqueta H1 es de las etiquetas del HTML más importantes y, en este caso, nos está indicando que hay duplicidad en esta etiqueta.

Lo que en principio puede hacer que Google tome un valor incorrecto sobre el valor que le quieres dar a la página.

Pero la realidad es que es algo que (sin abusar) no es realmente importante, ya que en el caso de que ocurra Google toma la misma decisión que en su política de calidad de link building, toma el primer valor, es decir, va a tomar como bueno el primer H1 que encuentre para su base de datos.

Hay que tener mucho cuidado con este warning porque lo normal es que no sea un fallo controlado de la estrategia y es probable que pueda afectar.

Para solucionarlo solo tienes que decidir cuáles de las etiquetas H1 son la correctas en cada URL y eliminar las demás.

  • Homepage does not use HTTPS encryption

Indica que la página principal o homepage no tiene un encriptado de seguridad con HTTPs.

Volvemos a lo mismo, puede que sea necesario tomar medidas o puede que no sea necesario hacerlo.

Si tienes un ecommerce va a ser algo necesario buscar una solución pero si lo que tenemos es una página de marca o un blog no veo tanta necesidad de tomar esta decisión si el dominio está en producción; si el dominio es de nueva creación habría que tenerlo en cuenta a la hora de presupuestar la estrategia como valor diferencial.

2.3  AVISOS

Esta es una sección informativa sobre elementos que pueden afectar a tu estrategia de SEO, que no sean importantes no significa que no sean urgentes.

  • Páginas que bloquearon el rastreador de SEMrush

Da una relación de las URLs que no pueden ser rastreadas por SEMrush, lo que puede indicar que quizás otras herramientas de SEO o Google no puedan rastrear correctamente.

Merece la pena invertir tiempo en saber si es correcto o no.

¿Si no quieres que algo no esté en Google? ¿Por qué lo pones en internet?

Si tienes URLs bloqueadas, evidentemente puede que Google no las indexe por un lado y por otro, hagas pensar a Google por qué estás bloqueando dicha información.

Hace tiempo que Google declaró que quería tener acceso al contenido en CSS y JS y si dentro de ese contenido bloqueado tenemos este tipo de formatos de archivo, Google puede pensar mal.

Hay muchos proveedores de hosting que tienen por defecto cortado el acceso a herramientas como SEMrush para evitar tráfico en sus servidores.

Y una vez dicho esto, contaros que quitar contenidos de Google en un dominio con más de 100 URLs puede ser una de las mejores prácticas en SEO que puedas realizar, eso sí, tómate este dato con paciencia y piensa bien lo que vas a hacer, puesto que si no sabes desindexar contenidos puedes causar un problema en vez de una ventaja competitiva. 

  • Enlaces externos que contienen atributos nofollow

Nos informa de que uno de nuestros enlaces salientes contiene el atributo nofollow, algo que puede estar bien si el dominio no es de calidad, pero ante esto tenemos que preguntarnos que si el dominio no es de calidad que necesidad tenemos de dar ese atributo.

Si realmente quieres mencionar a un dominio de baja autoridad es mucho mejor colocar simplemente la URL sin ningún tipo de enlace, por eso, antes de poner ningún enlace en tu dominio siempre es recomendable que analices su autoridad con cualquier herramienta de SEO como SEMrush que te permita saber cuál es la historia de un dominio para averiguar si puede o no tener algún tipo de problema con Google.

Si vemos que un dominio ha sido penalizado por Google es una mala idea hacerle un link desde nuestra web.

En muchas ocasiones, vemos que los links a las redes sociales se colocan con este atributo, en mi opinión, al igual que debemos de pasar valor a nuestra estrategia interna de enlaces, también debemos de pasar valor a las redes sociales para que por lo menos reciban autoridad desde el dominio propietario de ellas.

Podemos encontrarnos este problema en los sistemas que tenemos para compartir cualquier información en redes sociales, en estos casos, muchas veces la decisión está en reducir el número de redes sociales en los que se comparte una información o producto.

No todo está preparado para las redes sociales.

  • Las URLs de Nº páginas son demasiado largas

Este es un parámetro que indica que una URL es muy larga en número de caracteres y podemos tener problemas a nivel de dispositivo y con el mismo Google.

Si tenemos URLs con demasiados caracteres debemos saber que no todos los dispositivos van a funcionar igual, sobre todo, podemos tener algún problema con smartphones antiguos.

Con los nuevos dispositivos no vamos a tener problemas, pero como SEO sí tenemos que saber que una URL demasiado larga suele contener demasiada información, información que puede estar duplicada en otra URL, ya que este tipo de URLs nos las encontramos en dominios como poco control sobre sus URLs.

Para solucionarlo, lo recomendable es contar con un sistema de 301 que nos permita hacer una URL más precisa pero con redirección de la URL antigua a la URL nueva.

  • Robots.txt no encontrado

Es difícil que SEMrush se confunda en esta información, nos está indicando que el fichero robots.txt (ya mencionado) no se encuentra en nuestro dominio.

Si no lo tenemos, le estamos dando todas las posibilidades de rastreo a Google, lo que seguro no sea lo más conveniente en nuestro proyecto.

Para solucionarlo lo mejor es hacer un buen estudio de cuáles son las condiciones que queremos marcar en nuestra estrategia de rastreo y plasmarlas en este archivo.

Cuidado con tener más de un robots.txt distribuido libremente por nuestro dominio sin ningún control.

  • Pages have hreflang language mismatch issues

Si queremos que la semántica internacional de nuestro dominio sea comprendida por Google necesitas tener un correcto código que le indique a Google qué es que, de ahí la importancia de tener correctamente configuradas estas etiquetas.

Este es un aviso que tenemos que contrastar con los datos de segmentación internacional de Search Console, ambas herramientas deben dar este dato como positivo si queremos que la internacionalización del lenguaje sea correcta.

Solo has de seguir las recomendaciones de SEMrush y Google para hacer que esta funcionalidad esté correcta, aunque es cierto que es una etiqueta de HTML que da más problemas que alegrías, pues es un fallo muy normal dentro de las estrategias SEO internacionales que no han tenido un estrategia SEO previa.

En la siguiente imagen tenéis una infografía con todos los errores de un Site Audit de Google.es.

Site Audit de Google

3.  CRAWLED PAGES

En este apartado podemos ver de forma individual el estado de cada una de las URLs que hemos rastreado.

CRAWLED PAGES

Aquí lo divertido está en que podemos trabajar a nivel de auditoría tanto con lo que está como con lo que no está.

Es decir, podemos sacar un listado de todas las URLs que tienen una característica o todas las URLs que no tienen una característica, lo que nos va a permitir sacar un listado de URLs en las que debemos trabajar para llegar a soluciones específicas.

Aunque parezca algo simple es algo que desde un departamento de soluciones tiene una gran ventaja, no es lo mismo ir URL a URL solucionando multitud de errores que poder por ejemplo aplicar una estrategia que determine el orden de prioridades a solucionar en un proyecto y solucionar todos los problemas de un tipo sobre un listado de URL, de esa forma, se puede ser mucho más productivo a la hora de solucionar los errores de un dominio.

4.  STATISTICS

En esta sección de la herramienta podemos ver estadísticas de todo lo que nos falta por mejorar en nuestro dominio con la intención de que Google pueda entender mejor el contenido de este. 

Es un dato de utilidad que tenemos que tomar de nuestro dominio y, sobre todo, de nuestros competidores más directos, para que podamos entender mejor cómo funciona su estrategia SEO en estos aspectos.

Recordad que no todo está en lo que nosotros hacemos, también debemos de ser conscientes de lo que hace nuestra competencia para estar por encima de nosotros.

Estadísticas de google.es

Ya sea por formato de lista o gráfico vamos a poder analizar la siguiente información de un dominio:

  • Marcado

Un marcado o marcado de datos es la forma que tenemos de decirle a Google en qué consiste nuestro contenido, lo que va a hacer que tengamos un mejor ranking en los resultados.

Se usa por el simple hecho de que aumenta la semántica de nuestro dominio frente a Google.

Es cierto que es muy difícil tener un 100% de marcados de datos en un dominio, pero es algo a lo cual debemos de aspirar con el tiempo, no tenerlo solucionado, sobre todo, en puntos importantes como la parte de localización para negocios locales, el blog para sistemas de noticias o cuya estrategia SEO esté influida por una estrategia de contenidos o ecommerce para sus productos, puede llegar a ser un verdadero problema con una solución que solo requiere de horas de un programador bajo la guía de un SEO con una estrategia.

En este caso, nos muestra información sobre diferentes marcados, pero no debemos olvidar que el marcado de datos merece un artículo tan largo como este, pues hay mucho que aprender sobre esto y cada modelo de negocio puede aprovechar los marcados de una forma diferente al de su competencia.

  1. Schema.org: Podemos encontrar formatos para multitud de elementos, desde un evento a un medicamento.
  2. Twitter Cards: Se usa para que cuando se comparta dicha URL en Twitter, el tweet tenga una estructura de datos específica, lo que va a permitir que se visualice correctamente (si lo tenemos bien configurado) en esta red social.
  3. Open Graph: Es el marcado que se utiliza tanto para redes sociales como para CMS de Wordpress, no es de mis favoritos pero si es efectivo en una estrategia básica, es mejor que nada.
  4. Microformatos: Es otra forma de hacer lo mismo con muchas opciones interesantes.
  • Profundidad rastreo

Esta parte de la herramienta me parece una preciosidad en el sentido de que te deja visualizar cuantos enlaces hacen falta para llegar a una URL desde tu home.

¿Por qué escondemos un enlace?

Cuantos más links hagan falta para llegar a una URL de tu dominio, más dificultades va a tener el usuario para acceder a ella y Google piensa que porque le va a dar más prioridad a un contenido que nosotros tenemos más oculto que otro, de ahí que si tenemos un problema de posicionamiento con una URL debemos de  mirar qué profundidad de enlace tiene y si ese es el problema del posicionamiento de dicha URL.

Para solucionar un problema de profundidad de rastreo en muchas ocasiones no vamos a tener más opciones que modificar el diseño de nuestro dominio.

Ahora sí, mucho cuidado si hacemos cambios, porque los cambios normalmente afectan a todo el dominio.

Con esto solo quiero decir que hay que ser consecuentes de que hay que hacer cambios pero hay que pensar en todas las posibilidades.

Un dato que no nos marca esta herramienta (ni ninguna otra que conozca) es la localización del flujo de los enlaces.

Recordad que no es lo mismo que el enlace parta de la parte superior de la web que de la parte inferior o de un lateral de esta, la posición cuenta.

En este punto, también debemos de hacer una reflexión sobre cuál es la estrategia que hay que seguir para no sobrepasar los tres enlaces de profundidad, recordad que no todos los dominios deben de tener las mismas estrategias, estas son algunas de las opciones que podemos usar.

0% páginas con más de 3 clics

  1. 1 clics: 0% 
  2. 2 clics: 12%
  3. 3 clics: 88%

90% páginas con más de 3 clics 

  1. 1 clics: 2% 
  2. 2 clics: 3%
  3. 3 clics: 5% 
  • Código de estado HTTP

Ya hemos visto que los códigos de estado HTTP indican un estado o incidencia de una URL.

Los dos elementos más importantes de este punto son:

  1. Páginas con códigos de error 4xx y 5xx: Son páginas con errores graves que han de resolverse, los 4XX (400,404…) se refieren a errores en la web, mientras los errores 5XX (500,501…) se refieren a errores de servidor.
  2. 3XX: Indican redirecciones como la 301,302… y con esto simplemente hay que ser precavido, no es cuestión de si hay o no hay, sino de si estas URLs están en Google indexadas y si realmente es necesario seguir teniendo activa esta redirección.

Solo los errores 3XX podrían formar parte de una estrategia SEO, pero todo lo que sea un error 4XX ó 5XX debe de solucionarse con rapidez.

  • Canonización

Esta es una etiqueta que evita el problema con el contenido duplicado, es una simple etiqueta de HTML.

Ejemplo: <link rel="canonical" href="http://www.agenciadeseo.es/" />

Se pueden realizar muchos experimentos de SEO con esta etiqueta si la unimos a otras etiquetas de HTML que pueden beneficiar nuestro posicionamiento.

  • Enlace AMP

Lo normal es que tengas una gráfica como esta:

100% páginas no tienen enlace AMP - 0% tienen enlace AMP

O lo que es lo mismo, no tienes AMP configurado en tu dominio.

Si es el momento o no de invertir recursos en configurar tu dominio para AMP es decisión estratégica, pero si tus clientes te llegan en gran medida por smartphone, debería ser una prioridad.

La verdad es que Google está haciendo cosas interesantes para las páginas AMP porque sabe y viene diciendo desde hace tiempo que el futuro está en los smartphones, como indica la nueva modificación de su algoritmo “Google Mobile First Indexing Update”.

Lo ideal sería ver una gráfica como esta:

0% páginas no tienen enlace AMP - 100% tienen enlace AMP

Un poco más arriba tienes más información sobre “AMP pages have no canonical tag”

  • Mapa del sitio vs. Páginas rastreadas

Este es un punto realmente interesante a la hora de analizar una estrategia SEO, pues no en todos los casos nos van a coincidir las URLs rastreadas con las URLs de nuestro sitemap.

Esto no es negativo por definición, pero sí es cierto que tenemos que ser conscientes de este dato.

Si no coinciden, significará que Google está invirtiendo su tiempo en analizar algo que posiblemente no tenga por que analizar.

  1. Nº páginas en mapa del sitio: Informa del total de URL's que tenemos en nuestros sitemaps.
  2. Páginas rastreadas encontradas en el mapa de sitio: Nos va a decir cuáles son las páginas que ha rastreado SEMrush que se encuentran en el sitemap, para ver el dato solo tienes que pulsar en el número del %
  3. Páginas rastreadas no encontradas en el mapa de sitio: Este es el dato contrario, está muy bien sobre todo porque puedes hacer filtros para detectar posibles problemas.

Prestad atención a este punto de la auditoría que nos puede ayudar a comprender qué es visible y qué no es visible.

  • Enlaces internos entrantes

Este es una dato importantísimo para el SEO on page.

Recordad que no solo hemos de hacer enlaces externos, es crucial saber hacer una arquitectura de enlaces interna.

Por daros un dato, si vemos que una URL tiene un posicionamiento bajo dentro de un dominio con autoridad puede deberse al hecho de que no recibe suficientes enlaces internos, de ahí la importancia de estos datos.

Otra cosa es la estrategia que sigamos en nuestra política de enlaces internos, normalmente la home es la URL con más enlaces, pero deberías de preguntarte si en tu dominio esto debería de ser así o no, un ejemplo, imagina que el valor diferencial de tu dominio es una herramienta online que hace algo espectacular ¿no debería de ser esta URL la más enlazada internamente en tu dominio?

La siguiente pregunta es si esta URL debería de tener siempre el mismo “anchor text” (texto con el que se realiza el enlace) o no, puesto que una vez más, la respuesta no va a ser siempre la misma.

Con otras herramientas como Search Console podemos contrastar si la información de SEMrush es correcta o no, pero solo podemos usar SEMrush si queremos medir o auditar a un competidor.

Al igual que el dato de “Profundidad de rastreo” debemos ser estratégicos para evitar sorpresas.

  • Uso de hreflang

Esta es una etiqueta que se ha mencionado con anterioridad por lo que no voy a repetirme sobre lo que es y cómo se usa.

Solamente comentar que si no tienes un dominio en varios idiomas no tiene que preocuparte esta información pero si tienes un dominio en varios idiomas si debes preocuparte de tenerlo de forma adecuada.

  1. Páginas tienen hreflang: Indica el número de páginas del dominio con este atributo.
  2. With issues: Nos dice el número de páginas que tienen problemas con esta etiqueta.
  3. Without hreflang: Dice el número de páginas que no contienen este atributo, lo que puede ser una forma fácil de detectar problemas con esta etiqueta.

Si tenemos una estrategia de SEO internacional tenemos que prestar atención a un correcto funcionamiento de esta etiqueta.

5.  COMPARE CRAWLS

En este apartado, lo que vamos a ver es la evolución del proyecto de una forma matemática, algo muy importante cuando trabajas con un equipo de trabajo, pues se pueden definir objetivos individuales o colectivos.

Recuerda que para sacarle provecho a esta herramienta debes modificar los rangos de fechas para seleccionar la fecha de inicio y fin de las auditorías, si tienes las auditorías programadas de forma semanal (es lo más recomendable) vas a tener un montón de datos que te pueden valer para hacerle ver al cliente el trabajo realizado en el proyecto y en qué fechas.

El SEO tiene algo malo y es que muchas de las acciones no se ven directamente.

Es difícil demostrar solo con datos de ranking que se está realizando un trabajo de mejora del dominio.

Aquí tienes una forma fácil de demostrar un trabajo en backend.

COMPARE CRAWLS

A nivel de SEO uno de los puntos clave es el dato de “Páginas rastreadas”. pues puedes ver si el dominio ha crecido de forma inesperada o bien ha bajado el número de URLs lo que puede indicar que se ha perdido alguna URL por el camino.

6.  PROGRESS

En este apartado, vamos a poder analizar los mismos datos que teníamos en el apartado anterior pero de una forma más específica y visual.

Progress google.es

Normalmente, se usa para ver la evolución de un proyecto pero, sobre todo, cuando se realizan migraciones o acciones agresivas en un dominio.

Un dato importante es que no debemos de analizar todos los datos en conjunto.

Para poder ver la evolución de un dato es mejor usar el dato en sí mismo y otro dato similar de forma que tengamos un valor individual y comparativo.

Algunos de los datos más interesantes de este apartado es el de “Velocidad lenta de carga de página” para analizar si hay factores internos y externos que estén afectando a la velocidad.

Otro uso que le puedes dar es averiguar en qué momento se ha tocado algo del dominio que no debería de haberse tocado, por ejemplo, si seleccionas “Sitemap.xml no especificado en robots.txt” vas a poder comprobar en qué rastreo fue modificado el robots.txt.

7.  CONSIDERACIONES PERSONALES

Ahora me gustaría aclarar algunas cosas sobre las auditorías en general.

Una auditoría SEO ya sea con SEMrush o cualquier otra herramienta no debe descartar una auditoría SEO manual.

No es que las herramientas sean buenas o malas, solo son herramientas que no van a poder medir si por ejemplo una imagen tiene una etiqueta correcta o si el nombre de la imagen es el que debería de ser o si la web es fea.

Eso lo tenemos que mirar personalmente.

Todas las herramientas tienen un % de error dentro de sus resultados y es un dato que debes considerar, de hecho, SEMrush te da la oportunidad a través del icono del ojo, porque puede que sea lo que yo llamo un “falso positivo”, de esta forma, tendrás una puntuación más acertada.

Un clásico de SEMrush en estas cosas son los errores 503 que aparecen en las auditorías, realmente lo que ocurre es que el servidor del dominio analizado bloquea a SEMrush por hacerle demasiadas peticiones.

Pienso que no es recomendable usar una sola herramienta a la hora de hacer una auditoría SEO.

Siempre intento hacer las auditorías con varias herramientas por dos motivos: el primero es que no coinciden siempre en todos los datos, lo que hace que se me despierte la capacidad de análisis y, por otro lado, no todas las herramientas tienen las mismas capacidades a la hora de mostrar resultados, unas hacen mejor cosas que otras no hacen.

El hecho de usar varias herramientas para hacer lo mismo nos aportará un punto de vista más amplio sobre el dominio.

Sobre todo, si tienes herramientas específicas sobre los puntos de una auditoría conseguirás ampliar la visión del proyecto.

Descarga

Después de leer esta extensa y completa guía, ¿te quedan dudas sobre cómo realizar una auditoría SEO con SEMrush? Puedes dejarnos tus preguntas en comentarios. 

Agencia de SEO dedicada a resolver problemas de posicionamiento y a generar y mejorar estrategias de marketing en buscadores. Realizamos auditorías donde evaluamos todos los factores SEO y establecemos una comparativa con datos analíticos para dar siempre una respuesta basada en estadísticas y no una opinión sin fundamento.
Compartir esta entrada
o
2000 es el número máximo de caracteres permitido
Samuel Soler
Lo primero es felicitarte por el artículo. Lo segundo tengo una duda. He probado el Site Audit y a mi me da un error 403 en muchas páginas que luego no encuentro tal error. ¿Puede ser que una redirección http cuando en realidad es https la detecte como error 403?

un saludo y gracias
Fernando (Gomez) Ferreiro
Samuel Soler
Hola Samuel, seguramente el equipo técnico de Semrush te pueda dar una respuesta mejor, pero por experiencia previa, lo que pasa es que tu propio servidor te deniega el acceso porque piensa que está siendo atacado y te devuelve el 403, que es por denegación de servicio.
Un saludo.
Simplemente mi enhorabuena por esta magnífica guía. No solamente desarrollas cada punto, sino que además los resuelves. Excelente trabajo.
Fernando (Gomez) Ferreiro
Jose Luis Candeleda
Muy buenas Jose.
Me alegran tus palabras
Un saludo.
Excelente artículo Fernando, muchas gracias!
Fernando (Gomez) Ferreiro
Beltrán
Gracias por el comentario Beltrán.
Sergio Vazquez
Hola Fernando,
Me lo he leído entero y casualmente explico en mis clases del Máster esta herramienta y lo voy a mencionar a mis alumnos el artículo.
No olvidemos que una máquina no puede sustituir a un profesional con experiencia e incluso a veces da falsos positivos fáciles de interpretar si sabes como.
Solo puedo felicitarte por el trabajo que has hecho y a SEMRUsh por la herramienta ;-)
Saludos
Fernando (Gomez) Ferreiro
Sergio Vazquez
Muchas gracias Sergio, a ver si nos desvirtualizamos pronto.
Un saludo.
Gerardo
Hola, un gran artículo. Me lo he leído casi enterito.
Pero hay una cosa con la que no estoy de acuerdo
"en el caso de los B2C nos podemos encontrar sesiones o compras del carrito de la compra con este atributo, lo que es correcto, es decir, no ha de modificarse este atributo nofollow."
Como muchos expertos SEO mencionan, gary illyes mencionó en una entrevista, que los nofollow no pasan page rank, pero sí que lo desperdician. Además, según las google guidelines los nofollow son para páginass en las que no confiamos demasiado. Entonces ¿Enlazamos una de nuestras páginas porque no confiamos en ella?
Lo ideal sería un noindex para este tipo de páginas. y luego de forma opcional para doble seguridad un disallow e incluso eliminar la url de GSC.
Saludos
Fernando (Gomez) Ferreiro
Gerardo
Buenas Geraldo, me encanta la discrepancia.
Gerardo
Fernando (Gomez) Ferreiro
jeje, GerarDo, con R.
Supongo conocías este vídeo/artículo
https://www.stonetemple.com/seo-tags-virtual-keynote-with-gary-illyes-and-eric-enge/
Saludos
Alicia Rodríguez Ruiz
Hola Fernando, es imposible no empezar el comentario felicitándote por esta excelente guía de Site Audit. Leyéndote me animo a hacerte una pregunta, aparte de usar palabras clave y de reclamar la atención del lector ¿hay alguna estructura en la meta descripción que funcione mejor que otras? Gracias.
Fernando (Gomez) Ferreiro
Alicia Rodríguez Ruiz
Buenos días Alicia.
Realmente es cuestión de prueba error, pero como truco, incluir la keyword principal al principio del texto e incluir lo un LSI (palabras sinónimas / concordancia de frase / concordancia de palabra) y ahora estamos haciendo pruebas incluyendo los H2 con buenos resultados.
Saludos.
Alicia Rodríguez Ruiz
Fernando (Gomez) Ferreiro
Apuntado, ya nos informarás de los resultados con los H2. Gracias por la respuesta.
Alicia Rodríguez Ruiz
Fernando (Gomez) Ferreiro
Apuntado, ya nos informarás de los resultados con los H2. Gracias por la respuesta
Rost  Torchinskiy
Muchas gracias Fernando por este artículo! Creo que es una de las mejores guías del Site Audit que he visto.
Fernando (Gomez) Ferreiro
Rost Torchinskiy
Gracias Rost Torchinskiy
Ha llevado tiempo hacerla, me alegro que guste.
Saludos.