Cómo detectar contenido escrito con IA y el plagio

Semrush Team

mar 15, 20247 min de lectura
Cómo detectar contenido escrito con IA y el plagio

TABLA DE CONTENIDOS

¿Se recordará el 30 de noviembre de 2022 como el día que cambió para siempre la redacción de contenidos tal y como la conocemos?

Ese día marcó el lanzamiento de ChatGPT y, desde entonces, cientos de herramientas de redacción, asistentes de redacción y aplicaciones de creación de contenidos basadas en IA han inundado Internet. 

¿El objetivo? Ayudar a los redactores de contenidos, a los profesionales del marketing y a los expertos en SEO a crear contenidos de forma más rápida, sencilla y eficaz.

Aunque algunas de estas herramientas pueden ser muy útiles para aportar ideas, desarrollar la estructura básica de un artículo o generar titulares publicitarios pegadizos, la redacción propiamente dicha puede resultar complicada. 

En su estado actual, el contenido de IA puro está muy lejos de ser ideal. Aunque a veces puede parecer que está bien escrito y que suena profesional, también puede ser engañoso, irrelevante o simplemente erróneo (AKA alucinación artificial). También puede ser penalizado por los motores de búsqueda y afectar negativamente a tu clasificación en las SERP.

A medida que proliferen las herramientas de escritura con IA, será fundamental que los profesionales del marketing de contenidos y del SEO examinen sus contenidos para asegurarse de que son auténticos, fiables y libres de plagio.

¿Qué es la detección de contenidos mediante IA?

En resumen, la detección de contenidos mediante IA es un proceso que utiliza una combinación de técnicas de aprendizaje automático y de procesamiento del lenguaje natural para averiguar si el texto ha sido escrito por un humano o generado por la IA.

Las herramientas que utilizan este proceso se denominan "detectores de contenido de IA" o "detectores de IA" y se entrenan en grandes conjuntos de datos de contenido escrito por humanos y por máquinas para identificar patrones en cada tipo de escritura.

¿Cómo lo hacen? 

Analizando dos características principales del texto: la perplejidad y la irrupción.

En otras palabras, lo predecible o impredecible que suene para el lector, así como lo variadas o uniformes que sean las frases.

Si alguna vez has probado ChatGPT u otros grandes modelos lingüísticos para escribir, especialmente textos largos, te darás cuenta de que los textos de la IA tienden a ser más predecibles y genéricos en lo que se refiere a la elección de palabras. Lo mismo ocurre con la estructura de las frases. Las herramientas de escritura de IA tienden a producir frases de longitud similar y estructura más convencional. 

La escritura humana, en cambio, tiende a ser más dinámica, con una narración menos previsible y un vocabulario más rico. También es probable que tenga más erratas que el contenido escrito por la IA. Error humano, ¿verdad?

¿Qué es la detección de plagio? ¿Y el contenido de la IA se considera plagio?

A diferencia de la detección de IA, que todavía es relativamente nueva y está evolucionando, la detección de plagio existe desde hace tiempo.

Creadas en respuesta a los crecientes casos de plagio en el mundo académico, las herramientas de comprobación del plagio comparan el texto con grandes bases de datos de contenido web existente, así como con trabajos de investigación, revistas, periódicos y publicaciones, para ver si hay coincidencias entre ellos.

En lugar de buscar patrones predecibles en las palabras o en la estructura de las frases, como hacen las herramientas de detección de IA, los comprobadores de plagio buscan coincidencias exactas, o a veces imprecisas, en palabras clave, frases y oraciones enteras.

La mayoría de los comprobadores de plagio funcionan de forma similar, pero sus resultados pueden variar en función de las bases de datos a las que tengan acceso.

Desde el lanzamiento de ChatGPT, la comprobación del plagio se ha vuelto aún más relevante. Aunque el contenido generado por la IA no se considere técnicamente plagio porque no copia frases o trozos de texto palabra por palabra, puede parafrasear el contenido con el que ha sido entrenada. Y en tales casos, un comprobador de plagio también puede marcar este texto como plagio.

Cómo detectar el plagio y el contenido generado por IA

Entonces, ¿cómo sabemos qué tipo de contenido tenemos delante? 

Por ejemplo, si trabajas con redactores externos para el blog de tu empresa, ¿cómo sabes si el contenido que escriben es original? 

La forma obvia es dejar que los comprobadores de plagio y las herramientas de software de detección de IA hagan el trabajo. Sin embargo, sobre todo para la IA, hay otra forma: buscar las llamadas características "parecidas a la IA". 

Estos signos comunes de contenido generado por IA incluyen:

  • Información incorrecta y obsoleta
  • Falta de profundidad y personalidad
  • Lenguaje repetitivo

Información incorrecta y obsoleta

Aunque la escritura de la IA pueda parecer bien redactada, siempre es importante comprobar la exactitud de la información real. Como la mayoría de los robots se entrenan con conjuntos de datos limitados (en el tiempo, la forma o la fuente), puede que no tengan acceso a la información más reciente y completa. 

Falta de profundidad y personalidad

Como las herramientas de IA no escriben realmente, sino que generan texto basándose en patrones de sus datos de entrenamiento, no "entienden" lo que escriben del mismo modo que los humanos. Esto da lugar a respuestas muy superficiales y poco profundas, a una falta de pensamiento crítico y de análisis profundo del tema. 

Tampoco tienen personalidad, por lo que la mayoría de los textos generados por IA carecen de un toque personal y pueden sonar robóticos y sin emoción. 

A diferencia de una herramienta de IA, un periodista o redactor puede mantener conversaciones reales con expertos en la materia sobre la que escribe. Este tipo de conversaciones conducen a entendimientos más profundos, historias interesantes y opiniones afines de una forma que es difícil de reproducir con la IA.

Lenguaje repetitivo 

Otro rasgo común de la IA es el uso de las mismas palabras o frases una y otra vez.

Puede ser el resultado de una palabra clave específica utilizada en el mensaje que una IA repite palabra por palabra. También puede carecer de contexto o simplemente tener información de entrenamiento limitada y repetitiva.

Los modelos de IA también están diseñados para ser cautos y neutrales en general, por lo que pueden basarse en patrones lingüísticos más conservadores, que a veces pueden parecer repetitivos.

Las mejores herramientas de detección de contenido y plagio con IA para los profesionales del marketing de contenidos

La otra forma de detectar el lenguaje de IA y el plagio es mediante herramientas de detección especializadas. Aunque puede que no sean precisas al 100%, pueden ser bastante útiles si tu IA y tus habilidades de detección de plagios no están a la altura, que es lo que nos ocurre a la mayoría, ¿no?

Comprobador de Plagio de The Apps Cloud 

d6xI0E1JyHGk75KaJW7hy6YJS391vY_X8KchMQFpyOEfTOpqXpiqsS-Ud8cxmD0EYyKY81xBhlzg6eOtUDAgEmhyHRVlaQHigM2pCjUL5WeKF4nhoIby2EyftZFbHL4E8QI_xjwAe-i2HbGzRhcvIA4

Si ya tienes una cuenta en Semrush y buscas tanto contenido de IA como un detector de plagio para tus proyectos de redacción, entonces el Comprobador de Plagio de The Apps Cloud es para ti.

Diseñado específicamente para el App Center Semrush, el Comprobador de Plagio resulta muy útil cuando necesitas comprobar rápidamente un texto en busca de plagio, escritura generada por IA y legibilidad.

Esta herramienta gratuita permite comprobar el plagio en 34 idiomas diferentes, y la detección de contenidos generados por IA solo está disponible en inglés. 

Te permite comprobar textos de hasta 6.000 caracteres de longitud y genera un informe detallado en el que se destaca el porcentaje de contenido AI y plagiado, así como cualquier problema gramatical.

Para empezar, tienes que crear una cuenta gratuita en Semrush y luego obtener el Comprobador de Plagio del App Center. Después, solo tienes que copiar y pegar el texto para iniciar tu investigación.

Copyleaks

p_OSfODxtTVuI8InBtolE1LJCDiK3qHJh63fIofFIFyb2McQ9U3G31E1yh8cx4PUatYeUyl7cvP4JZWeKcGUlRiLgYK-ZG_iX40XLrcR4sasz5-v-rH_VEfB5-NX8FAhauwsXG8at9HMwYP4ccwgnrE

Según un estudio recente realizado por investigadores de la Universidad de Cornwell, Copyleaks fue validado como el detector de contenidos de IA más preciso, con un 99,1% de exactitud y una cobertura completa del modelo que incluye GPT-4 y Bard.

Fundada en 2015, Copyleaks cuenta con millones de usuarios, entre los que se encuentran las principales instituciones educativas y empresas. 

La versión básica (gratuita) de su detector de IA está disponible directamente en su web, sin necesidad de registrarse. Sin embargo, las funciones ampliadas, como más idiomas admitidos, detección priorizada y procesamiento más rápido, están disponibles mediante suscripción. 

Su detección de plagio es un producto independiente y permite escanear archivos de texto normales, URL y código fuente en busca de escritura artificial y plagio, comparar textos, códigos y sitios entre sí, así como extraer textos de imágenes.

El precio por escanear 100 páginas o 25.000 palabras comienza en 10,99 $ al mes.

Originality.ai

WHHsKV8CdfxfomiPAtEkOkLIAWCbjDAM2Kr7LXXL9gOBwgq_qjT9gLzV7mXo5MZuEaez0E1BfcXHUmdPm6ch_cWRRSWP0jVnqRqIoRfXQj_O4a73rNaMqxtLMQ5dP8TrbsaSm2VyPttO1PGOJAVdYsY
Fuente: https://originality.ai

Originality.ai también se presenta a sí mismo como "el comprobador de IA más preciso de Chat GPT, Bard, Paraphrasing y GPT-4", y afirma tener un 99% de precisión en la detección de contenidos de IA. La herramienta está diseñada específicamente para profesionales de contenidos y SEO que necesitan asegurarse de que los contenidos que publican son originales y están libres de plagio. 

La herramienta no tiene una versión gratuita o con anuncios porque utiliza técnicas de procesamiento del lenguaje natural que requieren mucha más potencia de cálculo. A diferencia de la mayoría de las herramientas de detección de contenidos mediante IA, Originality.ai también proporciona un escaneado completo del sitio, en lugar de un escaneado de un solo documento, y no tiene límite de caracteres.

Una de las características más llamativas de esta herramienta es que no solo detecta el plagio y la escritura artificial, sino también el plagio parafraseado, es decir, puede saber si el contenido ha sido parafraseado o no.

La suscripción básica de Originality.ai comienza en 14,95 $ al mes y proporciona acceso a todas las funciones de la herramienta, incluidas las futuras. El acceso limitado está disponible por un pago único de 30 $.

Comprueba el contenido de la IA con seguridad

A medida que más y más empresas añaden herramientas de redacción con IA a sus conjuntos de herramientas de marketing, la corrección y comprobación del plagio y el lenguaje de IA en los contenidos creados con estas herramientas se está convirtiendo en la norma.

Aunque el contenido generado por IA es cada vez mejor y más parecido al humano, sigue necesitando nuestra atención para asegurarnos de que el borrador final es original, digno de confianza y tiene ese toque personal que hace que una historia destaque.

Compartir
Author Photo
From this account we share helpful ways to use the Semrush toolkit to achieve your SEO goals!