BigQuery para Google Analytics

Data & Analytics
CLIENTE
Empresa Líder de Energía

Google Analytics ha sido históricamente nuestra base de datos por excelencia para la elaboración de reportes. Sin embargo, cuando hablamos de sitios webs con miles de visitas al día, esta base de datos se torna ineficiente, ya que los tiempos de consulta a veces son eternos.
Si a esto sumamos que la mayoría de las veces los datos utilizados son variados, de distintos formatos y provenientes de distintas fuentes, es evidente que tenemos necesidad de evolucionar hacia una herramienta de almacenamiento de datos mejor que los contenga a todos.

Reto: Definición del reto y objetivos a alcanzar

Disponibilizar los datos en un warehouse, para unificarlos y ganar ownership sobre ellos. El objetivo es avanzar aún más lejos, para no solo consultarlos sino también “machacarlos”, es decir, analizar a fondo su comportamiento y generar a partir de ello una toma de decisiones data-based.

 

Proyecto: Procesos desarrollados para alcanzar los objetivos

Elección de Google Cloud Platform, sobre todo por su estrecha relación con Google Analytics. La gran ventaja es que este conector está incluido en la plataforma de GAU o GA4, lo cual facilita el paso de datos de un sitio a otro.

Para consultar datos de GA, Looker Studio necesita primero extraer todos para luego filtrar sobre ellos de acuerdo a lo que nos interesa en el informe.

Después de una correcta selección de variables y métricas, se genera esta capa intermedia entre GA y GDS, que eficientiza la consulta al no haber datos innecesarios en las consultas.

Resultados: Qué se ha conseguido con el proyecto (prioridad a la mejora MEDIBLE)

Velocidad de carga 20 veces mayor. Informes más eficientes para la toma de decisiones. Menor fricción con un informe decanta en un mayor uso.

Mejor trazabilidad del viaje del usuario online en el sitio web, al conectar mediante el warehouse el ID (anónimo) de cada cliente, y obtener así un dato enriquecido que Google Analytics solo no ofrecía.

Los datos extraídos fueron el input necesario para la elaboración de modelos predictivos. Es gracias a ellos que pudimos segmentar a los usuarios en base a su comportamiento (clusterización), y pudimos realizar una predicción del comportamiento futuro.