Contenido duplicado: Qué es + 4 formas de abordarlo

Hava Salsi

ago 02, 202411 min de lectura
Colaborador: Sydney Go
Cómo evitar el contenido duplicado
Compartir

TABLA DE CONTENIDOS

Para hacer nuestro contenido accesible a más usuarios, hemos traducido este artículo del inglés al español mediante traducción automática. Haz clic aquí para leer el artículo original. Si detectas algún problema en el contenido, no dudes en escribirnos a report-osteam@semrush.com.

¿Qué es el contenido duplicado?

El contenido duplicado es contenido idéntico o muy similar que aparece en más de un lugar en Internet. 

Por tanto, aunque un contenido no sea una copia exacta de otra página, puede considerarse duplicado si se parece lo suficiente a esa otra página.

Así es como se ven los contenidos idénticos y similares:

Un contenido copiado palabra por palabra y ligeramente reescrito

Puede haber contenido duplicado en diferentes páginas web de tu sitio. O a través de distintos sitios web.

Para que se considere duplicado, un contenido debe tener lo siguiente:

  • Solapamiento notable en la redacción, estructura y formato con otra pieza
  • Poca o ninguna información original
  • Sin valor añadido para el lector en comparación con una página similar

En este artículo, explicaremos cómo afecta el contenido duplicado al SEO y cinco causas comunes del contenido duplicado. Y te mostrará cómo evitar y resolver los problemas de contenido duplicado.

Empecemos por el impacto SEO.

¿Cómo afecta el contenido duplicado al SEO?

Google no penaliza el contenido duplicado a menos que pretenda "ser engañoso y manipular los resultados de los motores de búsqueda". 

Entonces, ¿por qué tener contenido duplicado es un problema para el SEO? Echemos un vistazo:

¿Cómo afecta el contenido duplicado al SEO?

Puede perjudicar tu clasificación

El objetivo de Google es presentar a los buscadores páginas que contengan información original y útil. No páginas que simplemente repiten contenidos que ya se encuentran en otros sitios (incluidos los contenidos de tu propio sitio web).

Por eso tienen sistemas de clasificación de búsquedas diseñados para dar prioridad al contenido original a la hora de clasificar los resultados.

Por tanto, si tienes varias páginas que se parecen, Google hará todo lo posible por identificar cuál es la página original.

Pero si no puede identificar el original, tu clasificación podría verse afectada. Y puede que la página no se clasifique.

Y si tu contenido se clasifica, es posible que la versión que elija Google no sea la que tú quieres que aparezca en las páginas de resultados de los motores de búsqueda (SERP).

Los backlinks son enlaces en otros sitios web que dirigen a tu sitio web.

Cada backlink es como un voto de confianza de ese otro sitio web. Lo que indica a Google que tu contenido es probablemente preciso y útil.

Qué es un backlink

Tener dos o más versiones de un mismo contenido puede diluir el valor de enlace, es decir, la reputación y la autoridad que se transmiten de una página a otra a través de un enlace.

He aquí por qué.

Supongamos que tienes dos páginas idénticas con las siguientes URL:

  • https://www.gardeningwebsite.com/gardening/planting-flowers
  • https://www.gardeningwebsite.com/flowers/planting-flowers

Así, si tienes 50 backlinks entre esas dos páginas, 30 de ellos podrían ir a la primera URL, mientras que los 20 restantes enlazarían a la segunda.

En lugar de tener una página reforzada con 50 backlinks, obtienes dos páginas con menos backlinks cada una.

Cómo el contenido duplicado puede diluir las señales de clasificación

Esta distribución puede conducir potencialmente a una peor clasificación en los motores de búsqueda, ya que ninguna de las dos páginas gana tanta autoridad como lo haría una sola.

Puede perjudicar la rastreabilidad de tu sitio web

Los motores de búsqueda como Google necesitan rastrear e indexar (es decir, encontrar y almacenar) tu contenido para que aparezca en los resultados de búsqueda.

Las páginas duplicadas malgastan tu presupuesto de rastreo (la cantidad de tiempo y recursos que los rastreadores de los motores de búsqueda dedican a rastrear tu sitio antes de seguir adelante). Porque los rastreadores pueden acabar revisando varias versiones del mismo contenido. 

Esto reduce el número de páginas que pueden ser rastreadas. Lo que puede afectar a la visibilidad de tu sitio en los resultados de búsqueda.

Más información: Rastreabilidad & Indexabilidad: Qué son & Cómo afectan al SEO

5 causas comunes del contenido duplicado accidental 

Hay muchas razones por las que el contenido puede duplicarse accidentalmente, principalmente por cuestiones estructurales del sitio web, como variaciones de URL y contenido copiado. 

He aquí cinco causas comunes:

1. Gestión incorrecta de las variaciones WWW y no WWW

A menudo, los usuarios pueden acceder a los sitios web tanto a través de una URL que incluya "www" al principio como a través de una URL sin ella.

Si tu sitio es accesible en ambos sentidos y no gestionas adecuadamente estas variaciones, pueden surgir problemas de contenido duplicado.

Imagina que tu sitio web es una casa con varias entradas. Algunas personas podrían entrar en tu casa por la puerta principal utilizando "www.example.com". Y otros pueden entrar por la puerta trasera utilizando "ejemplo.com". 

Aunque se trate de la misma casa, las variaciones de URL pueden hacer que a los motores de búsqueda les parezcan dos distintas.

2. Conceder acceso con HTTP y HTTPS

Que tu sitio web sea accesible a través de los protocolos HTTP y HTTPS también puede dar lugar a contenido duplicado.

Esto es como tener una puerta normal con la URL "http://example.com" para algunos visitantes. Y una puerta súper segura y cerrada con la URL "https://example.com" para los demás. 

Los robots de búsqueda las ven como puertas de casas diferentes si no les dices qué puerta es la entrada principal. 

3. Usar barras inclinadas finales y barras inclinadas no finales

Google considera que las variantes de una URL con y sin barra final ("/") son contenido duplicado.

Por ejemplo, las dos URL siguientes se considerarían únicas para los motores de búsqueda:

  • www.example.com/page/
  • www.example.com/page 

Para evitar esta duplicación, elige un enfoque para las barras finales en las URL de tus páginas y cíñete a él. (Pronto hablaremos más sobre cómo utilizar redireccionamientos 301 para solucionar este problema).

Lo hemos hecho en nuestro propio blog.

Así, si introduces "https://www.semrush.com/blog" en tu navegador, serás redirigido inmediatamente a "https://www.semrush.com/blog/".

Una redirección a la página "https://www.semrush.com/blog/".

4. Incluir contenido raspado o copiado

El scraping de contenidos se produce cuando alguien copia contenidos de un sitio web y los publica en otro sitio sin permiso ni dando la debida atribución.

Pero Google suele distinguir bastante bien entre la fuente original y el contenido copiado. Ya han escrito anteriormente sobre cómo tratan el contenido raspado, diciendo:

No debería preocuparte mucho ver los efectos negativos de la presencia de tu sitio en Google si observas que alguien raspa tu contenido.

5. Tener versiones separadas para móvil y escritorio

Una forma de estructurar tu sitio para hacerlo apto para móviles es utilizar URL distintas para las versiones de escritorio y móvil.

Por ejemplo, puedes utilizar "ejemplo.com" para los usuarios de ordenadores de sobremesa. Y "m.ejemplo.com" para los usuarios de móviles.

Este enfoque te permite adaptar el contenido y el diseño específicamente a los dispositivos móviles, para garantizar una experiencia más fácil de usar.

Pero si no se implementa correctamente, el uso de URL separadas para las versiones móvil y de escritorio puede dar lugar a problemas de contenido duplicado.

Cómo evitar el contenido duplicado 

El primer paso para abordar el contenido duplicado en SEO es averiguar dónde se produce en tu sitio (si es que se produce). 

Aquí tienes dos formas de encontrarlos:

Audita tu sitio para identificar contenido duplicado

Comprobar regularmente si hay contenido duplicado en tu sitio te ayudará a solucionar los problemas desde el principio.

Puedes peinar tus páginas manualmente si tu sitio es lo suficientemente pequeño. Pero eso es ineficaz. Y puede que te pierdas algunas páginas

Por ello, te sugerimos que pases tu sitio por la herramienta Auditoría del sitio de Semrush.

Para empezar, abre la herramienta, introduce tu URL en la barra de búsqueda y haz clic en "Iniciar auditoría".

Barra de búsqueda de la herramienta Auditoría del sitio

A continuación, se te pedirá que configures los ajustes básicos del rastreo. Esto incluye establecer un límite para las páginas comprobadas y una frecuencia de auditoría. Puedes seguir esta guía paso a paso para configurar tu auditoría para conocer los ajustes.

Cuando estés listo, haz clic en "Iniciar auditoría del sitio".

Ventana "Configuración de la auditoría del sitio"

Cuando tu auditoría esté lista, verás un panel similar a éste: 

Panel general de Auditoría del Sitio

Haz clic en la pestaña "Problemas" para ver una lista completa de los problemas técnicos y el número de páginas a las que afectan.

Informe "Problemas" en la herramienta Auditoría del Sitio

A continuación, introduce "duplicado" en la barra de búsqueda situada encima de la lista de cuestiones técnicas.

Buscar problemas que contengan la palabra "duplicado" en la herramienta Auditoría del Sitio

La Auditoría de Sitios marca las páginas como contenido duplicado si su contenido es idéntico en al menos un 85%. También marca los títulos y meta descripciones duplicados.

Problemas de contenido duplicado, etiquetas de título y meta descripción encontrados en la Auditoría del Sitio

Si tu dominio tiene páginas duplicadas, verás un enlace "Por qué y cómo solucionarlo" en la misma línea. 

Haz clic en él para ver una ventana emergente con más información sobre el problema en cuestión y cómo puedes solucionarlo.

Por qué y cómo solucionar la ventana emergente de problema de contenido duplicado

Supervisar las páginas indexadas en Google Search Console

Google Search Console (GSC) es una herramienta gratuita que puedes utilizar para ver si todas tus páginas están indexadas. Y cuáles no.

La herramienta también te dice por qué no se indexan las páginas. Y una de esas razones es el contenido duplicado.

Sección "Por qué no se indexan las páginas" en GSC

Para empezar, configura GSC. Si no estás seguro de cómo hacerlo, consulta la guía de Semrush sobre Google Search Console para obtener un recorrido paso a paso.

A continuación, haz clic en la pestaña "Páginas" de la sección "Indexación" del menú de la izquierda.

Navegar a la sección "Indexación" en GSC

Verás un gráfico que te indica cuántas páginas están indexadas. Y cuántas páginas no lo son.

La sección "Indexación de páginas" muestra cuántas páginas están indexadas y cuántas no

Desplázate hacia abajo para ver las razones por las que no se indexaron tus páginas.

Para obtener una lista de tus páginas duplicadas, haz clic en el error "Duplicado, Google eligió una canónica diferente a la del usuario" si lo tienes.

"Duplicado, Google ha elegido una canónica diferente a la del usuario" error resaltado

Al hacerlo, se abrirá un informe que te mostrará un gráfico de cuántas páginas afectadas has tenido a lo largo del tiempo. Y una lista de páginas con duplicados. 

Páginas afectadas con sección de ejemplos en GSC

Puedes solucionar el problema utilizando uno de los métodos que indicamos a continuación. Y haz clic en "Validar corrección" para que Google compruebe tu sitio.

“Botón de validar corrección resaltado

Cómo solucionar problemas de contenido duplicado

Ahora, es el momento de repasar lo que puedes hacer para evitar problemas relacionados con el contenido duplicado. O remediar los problemas actuales.

Aquí tienes dos métodos que puedes utilizar:

Implementar etiquetas canónicas

Las etiquetas canónicas (también llamadas etiquetas rel="canonical") son fragmentos de código HTML que especifican la URL preferida para contenidos duplicados o muy similares.

Una etiqueta canónica indica a los motores de búsqueda qué versión de tu página quieres que indexen y muestren en los resultados de búsqueda.

Puedes encontrar la etiqueta en la sección <head> del código HTML de un sitio web. Aquí tienes un ejemplo de su aspecto:

Sección de la etiqueta canónica del código HTML de un sitio web

Las etiquetas canónicas autorreferenciales (es decir, las etiquetas de una página que apuntan a sí misma) también pueden proteger tu contenido de los scrapers. Esto se debe a que indica a los motores de búsqueda que la página en la que se encuentran es la fuente original y autorizada. 

Si los scrapers copian tu contenido y no incluyen esta etiqueta correctamente, es más probable que los motores de búsqueda reconozcan tu página como la original.

Añadir una etiqueta canónica a tu página variará en función del sistema de gestión de contenidos que utilices: WordPress, Webflow, etc.

La forma más sencilla de hacerlo en WordPress es con el plugin Yoast SEO.

Primero, accede a tu cuenta de WordPress.

A continuación, añade Yoast SEO a tu sitio de WordPress haciendo clic en "Plugins" > "Añadir nuevo" en el menú de la izquierda.

Añadir un nuevo plugin a un sitio WordPress

Escribe "Yoast SEO" en la barra de búsqueda. A continuación, busca el plugin y haz clic en "Instalar ahora".

"Yoast SEO" seleccionado en el panel de plugins

Tras instalar el plugin y configurarlo, haz clic en "Páginas" en la barra lateral y navega hasta una de tus páginas duplicadas.

Navegar a "Páginas" en el menú de la barra lateral de WordPress

A continuación, abre la barra lateral de Yoast SEO haciendo clic en el logotipo de Yoast SEO que se encuentra en la esquina superior derecha de tu pantalla.

Logotipo de Yoast SEO resaltado en la esquina superior derecha de la "Página duplicada".

Desplázate por la barra lateral hasta que veas "Avanzado". Haz clic en él para desplegarlo e introduce el enlace canónico en el espacio bajo "URL canónica".

Sección "Avanzado" de la barra lateral de Yoast SEO

Si la página es un duplicado, añade en el espacio la URL de la página que quieres que Google indexe. Si estás en la página que quieres indexar, introduce la URL de esa página para crear una etiqueta canónica autorreferente.

Una vez que hayas insertado la etiqueta canónica, la Auditoría del sitio de Semrush para probar su implementación. Y comprueba si ha disminuido el número de páginas duplicadas.

Para leer más: 

Implementa redireccionamientos 301 cuando sea necesario

Una redirección 301 redirige permanentemente a los usuarios y a los motores de búsqueda de una URL a otra. Este método es el mejor para los duplicados que no necesitas conservar (como cuando has cambiado de HTTP a HTTPS o cuando has trasladado una página a una nueva URL). 

Páginas URL A y URL B redirigidas a una tercera página con URL C

Digamos que has cambiado la URL de tu página "Acerca de" de "www.url.com/about-the-company" a "https://url.com/about".

Querrás redirigir la URL antigua a tu nueva URL. Para que los usuarios y los motores de búsqueda lleguen a la página correcta.

Algunas empresas de alojamiento implementarán automáticamente una redirección 301 cuando cambies la URL de una página. Pero los pasos exactos para implementar una redirección 301 dependen de tu servidor y del sistema de gestión de contenidos (CMS) que utilices. 

Para obtener instrucciones detalladas, consulta nuestra guía sobre redireccionamientos 301.

Monitoriza y audita tu contenido con Semrush 

El contenido duplicado puede tener un impacto negativo en el SEO. Puede reducir tu potencial de clasificación y perjudicar la rastreabilidad de tu sitio web.

Pero hay formas de evitar los problemas de contenido duplicado. Y resuelve los problemas antes de que empiecen a afectar al rendimiento de tu sitio web.

Utiliza la herramienta Auditoría del sitio de Semrush para controlar regularmente la salud de tu sitio. Y comprueba rápidamente si tienes algún problema de contenido duplicado en tu sitio web.

Compartir
Author Photo
Hava Salsi is a Swiss-based content writer specializing in B2B SaaS, HR, and tech. With over 5 years of experience working with startups and businesses around the world, she produces engaging, user-centric content that ranks highly and drives conversions.