Para hacer nuestro contenido accesible a más usuarios, hemos traducido este artículo del inglés al español mediante traducción automática. Haz clic aquí para leer el artículo original. Si detectas algún problema en el contenido, no dudes en escribirnos a report-osteam@semrush.com.
¿Qué es el contenido duplicado?
El contenido duplicado es contenido idéntico o muy similar que aparece en más de un lugar en Internet.
Por tanto, aunque un contenido no sea una copia exacta de otra página, puede considerarse duplicado si se parece lo suficiente a esa otra página.
Así es como se ven los contenidos idénticos y similares:
Puede haber contenido duplicado en diferentes páginas web de tu sitio. O a través de distintos sitios web.
Para que se considere duplicado, un contenido debe tener lo siguiente:
- Solapamiento notable en la redacción, estructura y formato con otra pieza
- Poca o ninguna información original
- Sin valor añadido para el lector en comparación con una página similar
En este artículo, explicaremos cómo afecta el contenido duplicado al SEO y cinco causas comunes del contenido duplicado. Y te mostrará cómo evitar y resolver los problemas de contenido duplicado.
Empecemos por el impacto SEO.
¿Cómo afecta el contenido duplicado al SEO?
Google no penaliza el contenido duplicado a menos que pretenda "ser engañoso y manipular los resultados de los motores de búsqueda".
Entonces, ¿por qué tener contenido duplicado es un problema para el SEO? Echemos un vistazo:
Puede perjudicar tu clasificación
El objetivo de Google es presentar a los buscadores páginas que contengan información original y útil. No páginas que simplemente repiten contenidos que ya se encuentran en otros sitios (incluidos los contenidos de tu propio sitio web).
Por eso tienen sistemas de clasificación de búsquedas diseñados para dar prioridad al contenido original a la hora de clasificar los resultados.
Por tanto, si tienes varias páginas que se parecen, Google hará todo lo posible por identificar cuál es la página original.
Pero si no puede identificar el original, tu clasificación podría verse afectada. Y puede que la página no se clasifique.
Y si tu contenido se clasifica, es posible que la versión que elija Google no sea la que tú quieres que aparezca en las páginas de resultados de los motores de búsqueda (SERP).
Puede Distribuir Backlinks Innecesariamente
Los backlinks son enlaces en otros sitios web que dirigen a tu sitio web.
Cada backlink es como un voto de confianza de ese otro sitio web. Lo que indica a Google que tu contenido es probablemente preciso y útil.
Tener dos o más versiones de un mismo contenido puede diluir el valor de enlace, es decir, la reputación y la autoridad que se transmiten de una página a otra a través de un enlace.
He aquí por qué.
Supongamos que tienes dos páginas idénticas con las siguientes URL:
- https://www.gardeningwebsite.com/gardening/planting-flowers
- https://www.gardeningwebsite.com/flowers/planting-flowers
Así, si tienes 50 backlinks entre esas dos páginas, 30 de ellos podrían ir a la primera URL, mientras que los 20 restantes enlazarían a la segunda.
En lugar de tener una página reforzada con 50 backlinks, obtienes dos páginas con menos backlinks cada una.
Esta distribución puede conducir potencialmente a una peor clasificación en los motores de búsqueda, ya que ninguna de las dos páginas gana tanta autoridad como lo haría una sola.
Puede perjudicar la rastreabilidad de tu sitio web
Los motores de búsqueda como Google necesitan rastrear e indexar (es decir, encontrar y almacenar) tu contenido para que aparezca en los resultados de búsqueda.
Las páginas duplicadas malgastan tu presupuesto de rastreo (la cantidad de tiempo y recursos que los rastreadores de los motores de búsqueda dedican a rastrear tu sitio antes de seguir adelante). Porque los rastreadores pueden acabar revisando varias versiones del mismo contenido.
Esto reduce el número de páginas que pueden ser rastreadas. Lo que puede afectar a la visibilidad de tu sitio en los resultados de búsqueda.
Más información: Rastreabilidad & Indexabilidad: Qué son & Cómo afectan al SEO
5 causas comunes del contenido duplicado accidental
Hay muchas razones por las que el contenido puede duplicarse accidentalmente, principalmente por cuestiones estructurales del sitio web, como variaciones de URL y contenido copiado.
He aquí cinco causas comunes:
1. Gestión incorrecta de las variaciones WWW y no WWW
A menudo, los usuarios pueden acceder a los sitios web tanto a través de una URL que incluya "www" al principio como a través de una URL sin ella.
Si tu sitio es accesible en ambos sentidos y no gestionas adecuadamente estas variaciones, pueden surgir problemas de contenido duplicado.
Imagina que tu sitio web es una casa con varias entradas. Algunas personas podrían entrar en tu casa por la puerta principal utilizando "www.example.com". Y otros pueden entrar por la puerta trasera utilizando "ejemplo.com".
Aunque se trate de la misma casa, las variaciones de URL pueden hacer que a los motores de búsqueda les parezcan dos distintas.
2. Conceder acceso con HTTP y HTTPS
Que tu sitio web sea accesible a través de los protocolos HTTP y HTTPS también puede dar lugar a contenido duplicado.
Esto es como tener una puerta normal con la URL "http://example.com" para algunos visitantes. Y una puerta súper segura y cerrada con la URL "https://example.com" para los demás.
Los robots de búsqueda las ven como puertas de casas diferentes si no les dices qué puerta es la entrada principal.
3. Usar barras inclinadas finales y barras inclinadas no finales
Google considera que las variantes de una URL con y sin barra final ("/") son contenido duplicado.
Por ejemplo, las dos URL siguientes se considerarían únicas para los motores de búsqueda:
- www.example.com/page/
- www.example.com/page
Para evitar esta duplicación, elige un enfoque para las barras finales en las URL de tus páginas y cíñete a él. (Pronto hablaremos más sobre cómo utilizar redireccionamientos 301 para solucionar este problema).
Lo hemos hecho en nuestro propio blog.
Así, si introduces "https://www.semrush.com/blog" en tu navegador, serás redirigido inmediatamente a "https://www.semrush.com/blog/".
4. Incluir contenido raspado o copiado
El scraping de contenidos se produce cuando alguien copia contenidos de un sitio web y los publica en otro sitio sin permiso ni dando la debida atribución.
Pero Google suele distinguir bastante bien entre la fuente original y el contenido copiado. Ya han escrito anteriormente sobre cómo tratan el contenido raspado, diciendo:
No debería preocuparte mucho ver los efectos negativos de la presencia de tu sitio en Google si observas que alguien raspa tu contenido.
5. Tener versiones separadas para móvil y escritorio
Una forma de estructurar tu sitio para hacerlo apto para móviles es utilizar URL distintas para las versiones de escritorio y móvil.
Por ejemplo, puedes utilizar "ejemplo.com" para los usuarios de ordenadores de sobremesa. Y "m.ejemplo.com" para los usuarios de móviles.
Este enfoque te permite adaptar el contenido y el diseño específicamente a los dispositivos móviles, para garantizar una experiencia más fácil de usar.
Pero si no se implementa correctamente, el uso de URL separadas para las versiones móvil y de escritorio puede dar lugar a problemas de contenido duplicado.
Cómo evitar el contenido duplicado
El primer paso para abordar el contenido duplicado en SEO es averiguar dónde se produce en tu sitio (si es que se produce).
Aquí tienes dos formas de encontrarlos:
Audita tu sitio para identificar contenido duplicado
Comprobar regularmente si hay contenido duplicado en tu sitio te ayudará a solucionar los problemas desde el principio.
Puedes peinar tus páginas manualmente si tu sitio es lo suficientemente pequeño. Pero eso es ineficaz. Y puede que te pierdas algunas páginas
Por ello, te sugerimos que pases tu sitio por la herramienta Auditoría del sitio de Semrush.
Para empezar, abre la herramienta, introduce tu URL en la barra de búsqueda y haz clic en "Iniciar auditoría".
A continuación, se te pedirá que configures los ajustes básicos del rastreo. Esto incluye establecer un límite para las páginas comprobadas y una frecuencia de auditoría. Puedes seguir esta guía paso a paso para configurar tu auditoría para conocer los ajustes.
Cuando estés listo, haz clic en "Iniciar auditoría del sitio".
Cuando tu auditoría esté lista, verás un panel similar a éste:
Haz clic en la pestaña "Problemas" para ver una lista completa de los problemas técnicos y el número de páginas a las que afectan.
A continuación, introduce "duplicado" en la barra de búsqueda situada encima de la lista de cuestiones técnicas.
La Auditoría de Sitios marca las páginas como contenido duplicado si su contenido es idéntico en al menos un 85%. También marca los títulos y meta descripciones duplicados.
Si tu dominio tiene páginas duplicadas, verás un enlace "Por qué y cómo solucionarlo" en la misma línea.
Haz clic en él para ver una ventana emergente con más información sobre el problema en cuestión y cómo puedes solucionarlo.
Supervisar las páginas indexadas en Google Search Console
Google Search Console (GSC) es una herramienta gratuita que puedes utilizar para ver si todas tus páginas están indexadas. Y cuáles no.
La herramienta también te dice por qué no se indexan las páginas. Y una de esas razones es el contenido duplicado.
Para empezar, configura GSC. Si no estás seguro de cómo hacerlo, consulta la guía de Semrush sobre Google Search Console para obtener un recorrido paso a paso.
A continuación, haz clic en la pestaña "Páginas" de la sección "Indexación" del menú de la izquierda.
Verás un gráfico que te indica cuántas páginas están indexadas. Y cuántas páginas no lo son.
Desplázate hacia abajo para ver las razones por las que no se indexaron tus páginas.
Para obtener una lista de tus páginas duplicadas, haz clic en el error "Duplicado, Google eligió una canónica diferente a la del usuario" si lo tienes.
Al hacerlo, se abrirá un informe que te mostrará un gráfico de cuántas páginas afectadas has tenido a lo largo del tiempo. Y una lista de páginas con duplicados.
Puedes solucionar el problema utilizando uno de los métodos que indicamos a continuación. Y haz clic en "Validar corrección" para que Google compruebe tu sitio.
Cómo solucionar problemas de contenido duplicado
Ahora, es el momento de repasar lo que puedes hacer para evitar problemas relacionados con el contenido duplicado. O remediar los problemas actuales.
Aquí tienes dos métodos que puedes utilizar:
Implementar etiquetas canónicas
Las etiquetas canónicas (también llamadas etiquetas rel="canonical") son fragmentos de código HTML que especifican la URL preferida para contenidos duplicados o muy similares.
Una etiqueta canónica indica a los motores de búsqueda qué versión de tu página quieres que indexen y muestren en los resultados de búsqueda.
Puedes encontrar la etiqueta en la sección <head> del código HTML de un sitio web. Aquí tienes un ejemplo de su aspecto:
Las etiquetas canónicas autorreferenciales (es decir, las etiquetas de una página que apuntan a sí misma) también pueden proteger tu contenido de los scrapers. Esto se debe a que indica a los motores de búsqueda que la página en la que se encuentran es la fuente original y autorizada.
Si los scrapers copian tu contenido y no incluyen esta etiqueta correctamente, es más probable que los motores de búsqueda reconozcan tu página como la original.
Añadir una etiqueta canónica a tu página variará en función del sistema de gestión de contenidos que utilices: WordPress, Webflow, etc.
La forma más sencilla de hacerlo en WordPress es con el plugin Yoast SEO.
Primero, accede a tu cuenta de WordPress.
A continuación, añade Yoast SEO a tu sitio de WordPress haciendo clic en "Plugins" > "Añadir nuevo" en el menú de la izquierda.
Escribe "Yoast SEO" en la barra de búsqueda. A continuación, busca el plugin y haz clic en "Instalar ahora".
Tras instalar el plugin y configurarlo, haz clic en "Páginas" en la barra lateral y navega hasta una de tus páginas duplicadas.
A continuación, abre la barra lateral de Yoast SEO haciendo clic en el logotipo de Yoast SEO que se encuentra en la esquina superior derecha de tu pantalla.
Desplázate por la barra lateral hasta que veas "Avanzado". Haz clic en él para desplegarlo e introduce el enlace canónico en el espacio bajo "URL canónica".
Si la página es un duplicado, añade en el espacio la URL de la página que quieres que Google indexe. Si estás en la página que quieres indexar, introduce la URL de esa página para crear una etiqueta canónica autorreferente.
Una vez que hayas insertado la etiqueta canónica, la Auditoría del sitio de Semrush para probar su implementación. Y comprueba si ha disminuido el número de páginas duplicadas.
Para leer más:
Implementa redireccionamientos 301 cuando sea necesario
Una redirección 301 redirige permanentemente a los usuarios y a los motores de búsqueda de una URL a otra. Este método es el mejor para los duplicados que no necesitas conservar (como cuando has cambiado de HTTP a HTTPS o cuando has trasladado una página a una nueva URL).
Digamos que has cambiado la URL de tu página "Acerca de" de "www.url.com/about-the-company" a "https://url.com/about".
Querrás redirigir la URL antigua a tu nueva URL. Para que los usuarios y los motores de búsqueda lleguen a la página correcta.
Algunas empresas de alojamiento implementarán automáticamente una redirección 301 cuando cambies la URL de una página. Pero los pasos exactos para implementar una redirección 301 dependen de tu servidor y del sistema de gestión de contenidos (CMS) que utilices.
Para obtener instrucciones detalladas, consulta nuestra guía sobre redireccionamientos 301.
Monitoriza y audita tu contenido con Semrush
El contenido duplicado puede tener un impacto negativo en el SEO. Puede reducir tu potencial de clasificación y perjudicar la rastreabilidad de tu sitio web.
Pero hay formas de evitar los problemas de contenido duplicado. Y resuelve los problemas antes de que empiecen a afectar al rendimiento de tu sitio web.
Utiliza la herramienta Auditoría del sitio de Semrush para controlar regularmente la salud de tu sitio. Y comprueba rápidamente si tienes algún problema de contenido duplicado en tu sitio web.