Lo que Google Trends nos enseña sobre cuándo confiar en los datos

Chris Lewis

may 13, 20248 min de lectura
Lo que Google Trends nos enseña sobre cuándo confiar en los datos

Para hacer nuestro contenido accesible a más usuarios, hemos traducido este artículo del inglés al español mediante traducción automática. Haz clic aquí para leer el artículo original. Si detectas algún problema en el contenido, no dudes en escribirnos a report-osteam@semrush.com.

Es muy fácil que la gente confíe en los datos. Quizá demasiado fácil. Un estudio de 2018 de la Universidad de Stanford demostró que es un 70% más probable que las personas confíen en las afirmaciones que contienen un número que en las que no lo contienen. 

Aún más alarmante, casi el 60% de los participantes creyeron un titular falso que contenía una estadística, frente a sólo el 40% que creyó el mismo titular sin la estadística. 

Y aquí está lo verdaderamente sorprendente: ninguno de esos dos últimos párrafos, salvo las dos primeras frases, era cierto. Que yo sepa, no hubo ningún estudio de Stanford, y yo me inventé esas cifras. Ese hipervínculo es en realidad un enlace al infame partido Cal/Stanford de 1982 "con la banda en el campo".

Aunque no lamento tanto haberte engañado, ilustra la cuestión: Definitivamente, los números (y las personas) pueden falsear la verdad. En el mundo del marketing de contenidos, vemos muchas cifras engañosas que intentan generar confianza en el público. Y lo que es aún más aterrador, muchos productores de contenidos ni siquiera se dan cuenta de que lo están haciendo. 

¿No estás seguro de lo que quiero decir? Te lo mostraré con mi ejemplo favorito: Google Trends.

Tres reglas básicas para el análisis (honesto) de datos

Si no estás familiarizado, Google Trends es una herramienta increíble que te permite consultar el volumen de búsqueda relativo de cualquier cosa. Por ejemplo, quería saber cuándo "Old Town Road" empezó a arruinarme la vida, así que saqué un gráfico de interés del último año. 

Confiar en los datos de Google Trends - SEMrush

Bastante intuitivo, ¿verdad? Según este gráfico, el golpe alcanzó su punto álgido hacia mediados de abril de 2019. Para contextualizar, la remezcla de Billy Ray Cyrus se publicó el 5 de abril de 2019, por lo que Tendencias lo comprueba. 

Ahora, probablemente puedas empezar a ver por qué es una herramienta enorme para los vendedores de contenidos. Proporciona datos gratuitos, altamente personalizables y fidedignos, y la gente los cree porque proceden de Google. 

Pero analicemos más detenidamente la información que recibimos. Puede que notes algo único en el eje Y, lo que nos lleva a la primera regla.

#1. No compares manzanas con naranjas

En todos los gráficos de Tendencias, 100 representa el volumen máximo de búsqueda en el gráfico; en este caso, es el día en que más se buscó "Old Town Road". 

Este es el caso de este gráfico y de todos los gráficos de Tendencias, porque todos los gráficos tendrán, en algún momento, su punto más alto. Todos los demás valores del gráfico son relativos a ese valor 100. 

En otras palabras, cada número a lo largo de la línea es un porcentaje del plazo en su punto máximo. Por tanto, como la cifra ronda el 50 al final del gráfico, podemos suponer que en el último día del intervalo, se buscó aproximadamente la mitad de lo que se buscó en su punto álgido. 

Sin embargo, el principal problema que vemos es que algunos creadores de contenidos intentan comparar términos en gráficos separados sin darse cuenta de que son completamente independientes entre sí. 

Si buscara "Bebé tiburón", vería igualmente un punto a 100 en alguna parte (como haría con cualquier término). No sería justo comparar esos 100 con los 100 de "Old Town Road", porque no tenemos ni idea de cuáles son los volúmenes de búsqueda reales.

Confiar en los datos de Google Trends - SEMrush

Para hacerlo correctamente, tendrías que utilizar la práctica función "Comparar" de Tendencias, donde puedes ver que "Old Town Road" tuvo casi el doble de volumen máximo de búsquedas, aunque "Baby Shark" existe desde hace más tiempo. 

Confiar en los datos de Google Trends - SEMrush

Como el interés de búsqueda es relativo, técnicamente no podemos decir: "Tuvo un volumen de búsqueda de 78", porque en realidad, el valor 78 está representando el 78% del volumen máximo de búsqueda. 

Observando de nuevo la batalla "Old Town Road"/"Baby Shark" por la atención de mi joven sobrino, puede que te hayas dado cuenta de algo: aunque "Old Town Road" tuvo el máximo más alto y se ha mantenido por encima de "Baby Shark" desde su lanzamiento, el gráfico de barras "Promedio" del extremo izquierdo muestra la barra de "Baby Shark" significativamente más alta; 26 a 15, para ser exactos (que, como se ha comentado en el Punto 1, sólo significa 26% y 15% del volumen más alto del gráfico, que fue "Old Town Road" en abril de 2019). 

Eso te llevaría a creer que "Baby Shark", de media, fue un ~80% más buscado que "Old Town Road". Por supuesto, eso es engañoso, debido al intervalo de tiempo que seleccionamos, en el que "Old Town Road" no existía. Si vas a comparar cosas, siempre tienen que haber tenido la misma oportunidad de conseguir volumen de búsqueda durante el periodo de tiempo seleccionado. 

Cómo aplicar la regla

Los creadores de contenidos deben ser responsables y rendir cuentas de las cifras y la información que presentan. Eso significa que tienen que hacer ("hacer hacer hacer hacer") la diligencia debida necesaria para comprender sus datos, lo que representan y que las afirmaciones que hacen son justas.

Una prueba que me gusta utilizar es: Si yo fuera un editor que no quisiera cubrir esta noticia, ¿qué diría? Este enfoque te permite ser crítico con tus datos y te permite resolver preventivamente los problemas antes de que surjan. 

#2. Mantente transparente

Es fácil dejarse llevar por la primera idea que descubres y olvidarse del resto. Pero eso podría significar que están esperando a ser reveladas otras conclusiones pertinentes para la historia general.

Veamos la popularidad de las búsquedas de Lil Nas X en todo el país: 

Confiar en los datos de Google Trends - SEMrush

Así que Georgia es la que más busca, ¿no? No necesariamente. Como explica Google, "Cada punto de datos se divide por el total de búsquedas de la geografía y el intervalo de tiempo que representa para comparar la popularidad relativa. De lo contrario, los lugares con mayor volumen de búsqueda siempre estarían mejor clasificados.

En pocas palabras, Lil Nas X ocupa un porcentaje mayor de búsquedas en Georgia que la proporción en California. Si fuera sólo por volumen, California siempre sería el nº 1, porque tiene la mayor población. Ahora bien, puede que esa sea la conclusión que buscas (y sería justo e interesante hacerla), pero no es totalmente lo que parecía a primera vista. 

Cómo aplicar la regla

Al igual que los creadores de contenidos deben pensar críticamente sobre la calidad de los datos que presentan, también deben pensar críticamente sobre lo que no muestran y las implicaciones asociadas. Da un contexto completo a tus datos, y di por qué se incluyen algunas cosas y otras no. 

¿Formas fáciles de hacerlo? Incluye una sección de metodología al final de tus artículos, fuentes gráficas y datos apropiados, y no dudes en añadir información en el texto asociado a tu contenido. Cuanto más transparente seas con tus datos, más confianza generarás en tu público. 

#3. Comprende la muestra con la que trabajas

Quizá la advertencia más aterradora y de la que más se abusa de los datos de Tendencias es que todo lo que presenta -cada punto de datos, gráfico, comparación, clasificación estatal y demás- se basa en una muestra. Y hay que admitir que Trends lo maneja e interpreta para hacerlo más interesante (y normalmente, relevante), para una búsqueda. 

Google no está consultando los cientos de millones de búsquedas que recibe al hacerlas, sino que está utilizando una muestra muy pequeña de sus búsquedas. No les culpo: esta herramienta gratuita emplearía una tonelada de recursos para hacer ese tipo de análisis correctamente, sobre todo con datos que cambian constantemente. Según admite el propio Google, los datos de Tendencias "son una muestra aleatoria de los datos de búsqueda de Google que pueden extraerse desde 2004 y hasta 36 horas antes de tu búsqueda". 

¿Qué significa eso? Tus resultados serán drásticamente diferentes cada vez que busques. 

Hace aproximadamente un año, quise encontrar el plato casero más común en cada estado. Pensé que encontrar la "receta_____ " más popular en cada estado durante el último año crearía una infografía interesante.

Escribí "receta" como las tendencias que quería ver, y utilicé la herramienta "búsquedas relacionadas" de cada estado para ver qué aparecía. Éste fue mi resultado en Alaska: 

Confiar en los datos de Google Trends - SEMrush

Podrías imaginar un mapa estado por estado con una imagen de la receta como contenido divertido. Pero mira lo que pasa cuando actualizo mi página:

Confiar en los datos de Google Trends - SEMrush

Comprueba las marcas de tiempo: Estas capturas de pantalla se tomaron con 1 minuto de diferencia y tienen datos considerablemente distintos. Es importante saber que todas las variables de mi búsqueda eran idénticas y contenían fechas, por lo que, en teoría, no deberían ser diferentes en absoluto. 

Puedes ver lo tentador que sería crear una mala ciencia de datos utilizando estos resultados. 

Cómo aplicar la regla

Prueba, prueba y prueba tus datos; esto es válido para todos los tipos de contenido, pero especialmente para cualquier cosa que pueda actualizarse en directo, cambiar o que no sea necesariamente perenne. Cuando construyo contenidos interactivos, dedico mucho tiempo a intentar romper la versión final antes de sentirme cómodo poniéndola en Internet. Si alguien va a encontrar fallos, prefiero que sea yo. 

Con respecto a tu conjunto de datos, es útil que te preguntes ¿Podría otra persona reconstruir mi trabajo y llegar al mismo resultado, si dispusiera de las mismas herramientas? Si no es así, sé transparente sobre por qué y qué hiciste para llegar a las conclusiones a las que llegaste. Si tu objetivo es la construcción de enlaces, los editores apreciarán e incluso a menudo citarán la transparencia. 

Por qué importa todo esto

Para que el contenido tenga éxito en Internet, necesitamos poder confiar en él. Como profesionales del marketing de contenidos o como cualquiera que se preocupe por los datos, tenemos la responsabilidad de utilizar herramientas como Trends con prudencia y honestidad. Aquí tienes ejemplos de cómo hacerlo: 

  • Detallar las metodologías sobre cómo y cuándo se extrajeron los datos.

  • Explicar las limitaciones de un estudio.

  • Exponer claramente los posibles sesgos.

  • Atribuye correctamente tu información.

  • Enumera el tamaño de las muestras y los márgenes de error.

En algunos contenidos estarán más presentes que en otros, e incluso admitiré que me preocupa socavar mi propio contenido. Pero, al fin y al cabo, prefiero dar a la gente una visión honesta de lo que están viendo y dejarles que decidan por sí mismos las conclusiones. Es probable que los editores, los medios de comunicación y la historia piensen lo mismo. 

Compartir
Compartir
Author Photo
Chris Lewis is a Creative Strategy Supervisor at Fractl, a content marketing agency in Delray Beach, Florida. He spends his free time watching the Oakland A’s, hanging out with his dog Biscuit, and creating irreverent data visualizations about his everyday life.