¿Qué es el contenido duplicado?
El contenido duplicado es aquel que es una copia exacta de una pieza que se encuentra en otro sitio. Sin embargo, el término también puede referirse a contenido casi idéntico (como, por ejemplo, si cambias solo el producto, nombre de la marca o ubicación).
Modificar algunas palabras normalmente no es suficiente para que una página no se considere contenido duplicado. Este tipo de piezas afectan negativamente a tu posicionamiento en las búsquedas orgánicas.
El contenido duplicado también abarca las piezas de tu web que se encuentran en varias páginas o en webs diferentes. Sin embargo, existen métodos para prevenir o minimizar el daño del contenido duplicado a través de procedimientos técnicos.
En esta guía, vamos a profundizar en las causas del contenido duplicado, las mejores formas de evitarlo y cómo asegurarse de que tus competidores no copien tu contenido y se atribuyan el mérito.
El impacto del contenido duplicado
Las páginas que se crean con exactamente el mismo contenido se ramifican en los resultados de búsqueda de Google y, en ocasiones, pueden acarrear penalizaciones. Los problemas más comunes del contenido duplicado son:
- Aparece la versión incorrecta de una página en las SERP.
- Las páginas no funcionan bien en los resultados de búsqueda o experimentan problemas de indexación.
- Provocan fluctuaciones o descensos en las métricas de una web (tráfico, posicionamiento o criterios E-A-T).
- Otras acciones inesperadas de los motores de búsqueda como resultado de señales de priorización confusas.
Aunque nadie sabe a ciencia cierta qué elementos del contenido prioriza o no Google, el gigante de los buscadores siempre ha aconsejado a los webmasters y creadores de contenidos que "creen páginas para los usuarios, no para los buscadores".
Si tenemos en cuenta esta directriz, el punto de partida para cualquier webmaster o SEO debería ser crear contenidos originales que aporten valor a los usuarios. Sin embargo, no siempre es fácil ni posible. Factores como las plantillas de contenido, la funcionalidad de búsqueda, las etiquetas UTM, el intercambio de información o la sindicación de contenidos, no están exentos de los riesgos de la duplicación.
Para garantizar que tu propia web no contenga piezas duplicadas, deberás tener una arquitectura clara, realizar mantenimiento de forma regular y poseer conocimientos técnicos para combatir en la medida de lo posible la creación de contenidos idénticos.
Métodos para prevenir el contenido duplicado
Existen muchos métodos y estrategias diferentes para evitar la creación de contenido duplicado en tu web e impedir que otros sitios se beneficien de tus piezas:
Taxonomía
Como punto de partida, conviene echar un vistazo general a la taxonomía de tu web. Ya sea nuevas o no, rastrear tus páginas, mapearlas y asignarles un H1 único y una palabra clave es un buen comienzo. Organizar tu contenido en clústeres de temas puede ayudarte a desarrollar una estrategia meticulosa que impida la duplicación.
Etiquetas canonical
Probablemente, el elemento más importante para combatir la duplicación de contenido en tu propia web sean las etiquetas canónicas.
El elemento rel=canonical es un fragmento de código HTML que indica a Google que el editor es el propietario del contenido, aunque pueda encontrarse en otro sitio. Estas etiquetas le señalan a Google qué versión de una página es la "principal".
Las etiquetas canónicas pueden utilizarse para las versiones impresa y web del contenido, para las versiones móvil y de escritorio de una página, o para páginas orientadas a múltiples ubicaciones. También se pueden utilizar para cualquier otro caso en el que existan páginas duplicadas que procedan de la versión principal.
Hay dos tipos de etiquetas canónicas, las que apuntan a una página y las que apuntan desde una. Las que apuntan a otra página indican a los motores de búsqueda que otra versión es la "original".
Las que se apuntan desde una página sirven para indicar que ese contenido es la versión maestra, también conocidas como canonical autorreferentes. Las etiqueta canonical que apuntan a sí mismas son fundamentales para identificar y eliminar el contenido duplicado, además, se tratan de una buena práctica en la industria.
Metaetiquetas
Otro elemento técnico útil en el que fijarse al analizar el riesgo de contenido duplicado, son las etiquetas meta robots y las señales que envías a los motores de búsqueda desde tus páginas.
Las etiquetas meta robots son muy eficaces si quieres excluir una página concreta, o páginas, de ser indexadas por Google y preferirías que no aparecieran en los resultados de búsqueda.
Añadiendo la etiqueta meta robots "no index" al código HTML de una página, le indicas a Google que no quieres que se muestre en las SERP. Este método es preferible frente al bloqueo robots.txt, ya que esta técnica permite el bloqueo una página o archivo específico, mientras que el robots.txt suele reservas para tareas a mayor escala.
Aunque estas etiquetas pueden utilizarse por muchas razones, Google entenderá la directriz y excluirá las páginas duplicadas de las SERP.
Organizador de parámetros
Los parámetros URL indican a los motores de búsqueda cómo rastrear los sitios de forma eficaz. Los parámetros suelen causar la duplicación de contenido, ya que crean copias de una página. Por ejemplo, si hubiera varias páginas diferentes de un mismo producto, Google las consideraría contenido duplicado.
Sin embargo, la organización de parámetros facilita un rastreo más eficaz. Especialmente para los sitios amplios y aquellos que tienen funcionalidades de búsqueda integradas, es importante organizar los parámetros a través de Google Search Console y las herramientas para webmasters de Bing.
Si le indicas a Google las páginas parametrizadas en las herramientas correspondientes, le quedará claro que no deben rastrearse y qué medidas adicionales debe tomar, si es así.
URL duplicadas
Varios elementos estructurales de las URL pueden causar problemas de duplicación. Muchos de ellos se deben a la forma en que los motores de búsqueda entienden las URL. Si no se indica lo contrario, una URL diferente siempre significará una página diferente.
Si se producen errores a la hora de señalarlas, se producirán fluctuaciones en las métricas de tu web (tráfico, posicionamiento o criterios E-A-T). Como ya hemos visto, los parámetros de URL causados por las funcionalidades de búsqueda, los códigos de rastreo y otros elementos de terceros, pueden hacer que se creen múltiples versiones de una página.
Las formas más comunes de que se produzcan versiones duplicadas de URL son: versiones HTTP y HTTPS de páginas, www. y no-www., y páginas con barras finales y sin ellas.
En el caso de www. frente a no-www. y barras finales o no, debes identificar la versión más utilizada y ceñirte a ella en todas las páginas para evitar riesgo de duplicación. Además, las redirecciones deben configurarse para dirigir a la versión de la página que debe indexarse, por ejemplo, mysite.com > www.mysite.com.
Por otro lado, las URL HTTP representan un problema de seguridad, ya que las versiones HTTPS utilizan el cifrado (SSL), más seguro.
Redirecciones
Las redirecciones son muy útiles para eliminar el contenido duplicado. Las páginas duplicadas pueden redirigirse y retroalimentar a la versión principal de la página.
Si tienes una página con gran volumen de tráfico que esté duplicada desde otra página, crear una redirección puede ayudarte a solucionar el problema.
Al utilizar redireccionamientos para eliminar el contenido duplicado, hay dos cosas importantes que debes recordar: redirige siempre a la página con mayor rendimiento para limitar el impacto en las métricas de tu web y, si es posible, utiliza una redirección 301.
Si quieres más información sobre qué redireccionamientos aplicar, consulta nuestra guía sobre redireccionamientos 301.
¿Qué pasa si han copiado mi contenido en contra de mi voluntad?
¿Qué debes hacer si han copiado tu contenido y no has utilizado una etiqueta canónica para indicar que el tuyo es el original?
- Utiliza Search Console para identificar con qué regularidad se indexa tu sitio.
- Ponte en contacto con el webmaster responsable de la web que ha copiado tu contenido y solicita que se te acredite o se elimine la página.
- Utiliza etiquetas canónicas autorreferenciadas en todas las piezas nuevas que crees para garantizar que tu contenido sea reconocida como la "fuente original" de la información.
Monitoriza el contenido duplicado
Para evitar el contenido duplicado, debes empezar por crear contenido único y de calidad para tu web. Sin embargo, las prácticas para evitar que otros te copien pueden ser más complejas. La forma más segura de evitar el contenido duplicado es pensar detenidamente la estructura de tu web y centrarte en tus usuarios. Cuando la duplicación de contenido se deba a factores técnicos, las tácticas que hemos visto deberían ayudarte a solucionar los problemas derivados.
Al considerar los riesgos de las piezas duplicadas, es importante enviar las señales adecuadas a Google para que marque tu contenido como la fuente original. Presta especial atención si tu contenido está sindicado o descubres que ha sido utilizado anteriormente por otras fuentes.
Dependiendo de cómo se haya producido la duplicación, puedes emplear una o varias tácticas para señalar que el contenido tiene una fuente original y las otras versiones son duplicados.