• Seguridad de datos y servicios de Google

Aclaración sobre la filtración de datos de Google: Lo que hay que saber

  • Felix Rose-Collins
  • 3 min read
Aclaración sobre la filtración de datos de Google: Lo que hay que saber

Introducción

Durante las recientes vacaciones, surgieron publicaciones en las redes sociales sobre una supuesta filtración de datos relacionados con los algoritmos de clasificación de Google. Los debates iniciales en torno a estas filtraciones se centraron en la "confirmación" de creencias arraigadas de figuras como Rand Fishkin, pero carecían de contexto sobre la verdadera naturaleza de los datos.

El contexto importa: Almacén de IA documental

Los datos filtrados parecen estar relacionados con Document AI Warehouse de Google, una plataforma pública de Google Cloud utilizada para analizar, organizar, buscar y almacenar datos. Esta documentación pública se titula "Document AI Warehouse overview". Publicaciones en plataformas como Facebook sugieren que los datos filtrados son una "versión interna" de esta documentación pública, lo que indica que podría no ser exclusiva de las operaciones de búsqueda de Google.

¿Filtración de datos de búsquedas internas?

La publicación original en SparkToro no afirmaba que los datos procedieran de Google Search, sino que la fuente que los proporcionó a Rand Fishkin hizo esta afirmación. Fishkin, conocido por su meticulosidad, señaló que la afirmación de que los datos procedían de Google Search procedía de la persona que le envió el correo electrónico, no de fuentes verificadas.

Fishkin citó el correo electrónico:

"He recibido un correo electrónico de una persona que afirma tener acceso a una filtración masiva de documentación de la API desde dentro de la división de Búsqueda de Google".

A pesar de ello, los ex-Googlers consultados por Fishkin sólo pudieron confirmar que los datos se parecían a información interna de Google, pero no verificaron explícitamente que procedieran de Google Search.

Opiniones de ex-Googlers

Ex-Googlers comentaron:

  • "No tenía acceso a este código cuando trabajaba allí. Pero esto ciertamente parece legítimo".

  • "Tiene toda la pinta de ser una API interna de Google".

  • "Es una API basada en Java. Y alguien dedicó mucho tiempo a cumplir las propias normas internas de Google en materia de documentación y nomenclatura."

  • "Necesitaría más tiempo para estar seguro, pero esto coincide con la documentación interna que conozco".

  • "Nada de lo que he visto en una breve revisión sugiere que esto sea otra cosa que legítimo".

Estas declaraciones ponen de manifiesto que, aunque los datos parecen auténticos, no hay pruebas definitivas de que procedan de la Búsqueda de Google.

Mantener la mente abierta

Es fundamental mantener la mente abierta ante estos datos, ya que muchos de ellos siguen sin verificarse. Sacar conclusiones precipitadas o utilizar los datos para confirmar creencias preexistentes puede conducir a un sesgo de confirmación, en el que uno interpreta la información de una manera que refuerza sus puntos de vista existentes.

Definición de sesgo de confirmación:

"El sesgo de confirmación es la tendencia a buscar, interpretar, favorecer y recordar información de forma que confirme o apoye las creencias o valores previos de uno".

Preguntas clave sobre la filtración de datos de Google

  1. Contexto de la información filtrada: ¿Están los datos relacionados con la búsqueda de Google o con otros fines?

  2. Finalidad de los datos: ¿Se utilizaron para los resultados reales de la búsqueda o para la gestión o manipulación interna de los datos?

  3. Confirmación de los ex-Googlers: Los ex-Googlers no confirmaron que los datos sean específicos de Google Search, sólo que parecen proceder de Google.

  4. Análisis abierto: Para evitar el sesgo de confirmación, evite utilizar los datos para confirmar creencias arraigadas.

  5. Relación con el Almacén Documental AI: Las pruebas sugieren que los datos pueden estar relacionados con una API externa para crear un almacén de documentos y no con la Búsqueda de Google.

Opiniones de expertos sobre los datos "filtrados

Ryan Jones, experto en SEO:

  • Incertidumbre sobre si los datos son para producción o para pruebas.

  • Falta de claridad si es para búsqueda web u otros verticales como Google Home o Noticias.

  • Especulación de que algunos campos sólo se apliquen a los conjuntos de datos de formación, no a todos los sitios.

tuiteó DavidGQuaid:

Conoce Ranktracker

La plataforma todo en uno para un SEO eficaz

Detrás de todo negocio de éxito hay una sólida campaña de SEO. Pero con las innumerables herramientas y técnicas de optimización que existen para elegir, puede ser difícil saber por dónde empezar. Bueno, no temas más, porque tengo justo lo que necesitas. Presentamos la plataforma todo en uno Ranktracker para un SEO eficaz

¡Por fin hemos abierto el registro a Ranktracker totalmente gratis!

Crear una cuenta gratuita

O inicia sesión con tus credenciales

"No sabemos si esto es para la búsqueda de Google o para la recuperación de documentos en la nube de Google. Las APIs parecen pick & choose - así no es como espero que se ejecute el algoritmo - qué pasa si un ingeniero quiere saltarse todas esas comprobaciones de calidad - esto parece que quiero construir una app de almacén de contenidos para mi base de conocimiento empresarial."

Conclusión

De momento, no hay pruebas concretas de que los datos "filtrados" procedan de Google Search. El contexto y la finalidad de los datos siguen siendo ambiguos, con indicios que apuntan a que se trata de una API externa para la gestión de documentos y no de un componente central del algoritmo de búsqueda de Google. Es esencial abordar esta información con cautela y evitar sacar conclusiones definitivas sin más comprobaciones.

Felix Rose-Collins

Felix Rose-Collins

Ranktracker's CEO/CMO & Co-founder

Felix Rose-Collins is the Co-founder and CEO/CMO of Ranktracker. With over 15 years of SEO experience, he has single-handedly scaled the Ranktracker site to over 500,000 monthly visits, with 390,000 of these stemming from organic searches each month.

Empieza a usar Ranktracker... ¡Gratis!

Averigüe qué está impidiendo que su sitio web se clasifique.

Crear una cuenta gratuita

O inicia sesión con tus credenciales

Different views of Ranktracker app