Descubre cómo solucionar problemas de rendimiento de BigQuery con GCP🚀☁️

Descubre cómo solucionar problemas de rendimiento de BigQuery con GCP🚀☁️

07 abril, 2021
Compartir:

Como sabemos, BigQuery es la oferta de análisis de datos más conocida  y una de las más importantes de Google. Su principal función es permitir que empresas de todos los tamaños logren ejecutar cargas de trabajo analíticas. 

Para que puedas aprovechar BigQuery al máximo, es importante comprender y monitorear las cargas de trabajo para que sus aplicaciones se ejecuten de manera confiable. 

Gracias a Google Cloud, monitorear el uso de tu organización a escala nunca ha sido tan fácil. Descubre acá cómo supervisar la reserva de BigQuery y optimizar el rendimiento. 

Comprensión de las cargas de trabajo y las reservas

El primer paso es analizar la utilización histórica de ranuras en toda la organización. Con las reservas, puedes asignar capacidad, o espacios, a grupos designados de proyectos de GCP en su organización. Al organizar proyectos, considera la posibilidad de agruparlos según cargas de trabajo, equipos o departamentos. En la práctica, esto podría tener el siguiente aspecto: dividir las unidades de negocio, como marketing o finanzas, y separar las cargas de trabajo persistentes conocidas como las canalizaciones ETL de las cargas de trabajo más ad-hoc, como los paneles. 

Cómo funciona la programación

Para comprender mejor por qué es importante el aislamiento, es importante comprender el programador de BigQuery . BigQuery usa una noción de equidad para asignar espacios. Primero, BigQuery asigna espacios en el nivel de reserva. Desde dentro de una reserva, los espacios se asignan igualmente entre todos los proyectos activos, donde activo significa un proyecto que actualmente está ejecutando una consulta. Desde dentro de cada proyecto activo, las ranuras se asignan a todos los trabajos en ejecución para garantizar que cada trabajo pueda avanzar.

 

Mejorar y supervisar el rendimiento 

Para monitorear el desempeño, analizaremos las causas raíz comunes, las señales que se deben buscar y los posibles pasos para la mitigación. Nuestro objetivo por el bien de este ejemplo será un mayor rendimiento para sus consultas.

Comenzaremos comparando los datos de las vistas para comprender las diferencias en el rendimiento de las consultas, tomaremos dos consultas similares y compararemos sus datos de trabajo .

Los datos de estas vistas muestran varias estadísticas de trabajo que afectan el rendimiento de la consulta. Al comprender cómo las estadísticas de estos campos variaron entre diferentes ejecuciones, podemos identificar las posibles causas raíz de la lentitud y los pasos para la mitigación. La siguiente tabla resume los principales indicadores clave y la causa raíz correspondiente.

Si te interesa puedes profundizar acá

Fuente: Blog Google Cloud Platform


¿Te gustaría conocer más? Déjanos tus datos 👉 acá y te contactaremos para ver cómo podemos ayudarte y aportar a tu negocio. Podemos hacerte una demostración completamente gratis. 

¿Cómo implementar el trabajo remoto sin afectar tu productividad?


Suscríbete a nuestro newsletter
para estar siempre al día


SUSCRIBIRME
Suscribirme

POST QUE TE PUEDEN INTERESAR