Modelado de datos en Power BI
Power BI es considerada una herramienta de autoservicio por la facilidad que representa el interactuar con la última capa de datos, es decir, una vez que el modelado de datos está listo, el usuario final puede crear nuevos informes o visualizaciones a partir del conjunto de datos final. Para lograr esto se requiere de un trabajo técnico previo que generará esa última capa de datos con características que le darán cierto nivel de escalabilidad para cumplir con esa característica de autoservicio.
Entrando un poco más en detalle en esa parte técnica, el inicio al cual denominamos preparación de datos es dónde se planea y se toman decisiones para generar el modelo de datos. Elecciones tales como de dónde y cómo obtener los datos, dónde y cómo desarrollar consultas para depurar los datos, transformar y modelar los mismos, dónde se harán los cálculos para presentar un número final en los informes, así como evaluar el objetivo final del informe son algunas variables que se toman en consideración para dejar un modelo de datos final que requiera de muy poco o nula modificación y perdure a través del tiempo.
Para poder llegar a informes impactantes y que sean de gran utilidad para las empresas se requiere de una preparación sólida de los datos ya que al igual que en las construcciones de cualquier tipo es indispensable contar con cimientos sólidos para poder continuar construyendo sobre ellos y llegar así a resultados sorprendentes.
El camino para llegar a dichos resultados no será tan fácil como suele ser el diseño de la última capa de los informes ya que durante el desarrollo del modelo de datos nos enfrentamos a requerimientos particulares que le van agregando complejidad y que deben ser considerados para cumplir con cierto nivel de escalabilidad porque se busca que sean proyectos de utilidad durante un periodo prolongado de tiempo.
La longevidad del proyecto se verá afectada por diversas variables tales como:
¿Cómo seguirán siendo proveídos los datos y cómo se les dará mantenimiento?
¿Quién será el responsable de proveer dicho mantenimiento?
¿Quién es el responsable del desarrollo de los reportes e informes?
¿Quién o quienes tendrán acceso a cada uno de los reportes o conjuntos de datos?
¿Los usuarios tendrán acceso condicionado a los conjuntos de datos?
¿Cuál será el proceso para solicitar nuevos informes o agregar nuevas funcionalidades a los reportes existentes?
Todas estas preguntas deben estar resueltas una vez que el proyecto final esté en productivo para garantizar su operación continua y estabilidad.
Lo que se busca con este tipo de preparación de datos es limitar el uso de fuentes manipulables de datos que puedan generar inconsistencias en la información y se conviertan en un factor para que los informes dejen de funcionar o requieran de una revisión exhaustiva para identificar los errores.
Para ayudar en este proceso Power BI utiliza una interfaz robusta llamada Power Query que sirve para realizar transformaciones de datos complejas que se van agregando como pasos de diferente tipo como pueden ser, renombramiento de columnas, cambio de tipos de datos, agregación de columnas calculadas, entre otras, pero es de fundamental importancia utilizar un estándar y crear guías para el nombramiento de columnas, categorización de datos, así como la optimización de los mismos con tipos apropiados de datos ya que después de agregar un número importante de pasos se volverá complejo recordar por qué se utilizó cada uno de esos pasos.
Los datos también deberán estar optimizados para tener un buen desempeño en su manejo y refrescamiento, para lograr esto se pueden aplicar parametrizaciones para limitar el tamaño de los registros como pueden ser filtros de fechas o la parametrización de actualizaciones incrementales para limitar el número de registros que pasan por el proceso de actualización.
No olvides suscribirte a nuestro blog en donde en futuros posts mencionaremos con más detalle las herramientas que integra Power BI para ejecutar distintas tareas en el proceso de modelado de datos.