Diseñando un proyecto de Power BI
En un proyecto de implementación de Power BI la información tiene que ser integrada y transformada puesto que rara vez está estará disponible tal y como la necesitamos. Sin este proceso de diseño nuestro proyecto de Power BI no cumplirá con su objetivo principal, agregar valor al negocio.
Este proceso de diseño se puede realizar de diferentes maneras y dependerá en gran medida de la forma en la que queramos trabajar con los datos, ya que podremos hacerlo en cualquiera de las capas que integran nuestro proyecto.
A continuación mencionaré las que considero las dos principales capas de un proyecto de Power BI en las cuales debemos llevar a cabo nuestro proceso de integración y transformación de datos puesto que traen consigo un mayor número de beneficios.
La que definiré como primera capa, es aquella que corresponde a las fuentes de datos, que pueden ser desde bases de datos SQL hasta archivos de Excel.
Iniciar con la integración y transformación de datos en esta capa, de inicio nos otorga una gran ventaja. Las consultas que se realizan para obtener los datos tal y como los necesitamos en general son más eficientes en esta capa, simplemente porque si se realizan en capas posteriores se agrega un paso para almacenar la información en la memoria cache del sistema y después se manipula para obtenerla como necesitamos. Si profundizamos un poco más en esta opción, podemos mencionar también que tendremos como alternativa utilizar un proceso de ETL para generar nuevas tablas en la fuente de datos que ya contendrán la información que necesitamos y con el formato correcto para utilizar en nuestro proyecto de Power BI y en consecuencia obtendremos un mejor desempeño.
Al pasar a la segunda capa para continuar con nuestro proceso de integración y transformación nos encontraremos con Power Query, que es la tecnología de transformación integrada en Power BI. Describiéndolo de manera muy general, Power Query es una plataforma de low-code cuya finalidad principal es reducir de manera considerable el desarrollo de código de forma manual, puesto que integra diversas herramientas en una sola para facilitar el proceso de transformación de los datos.
Un punto importante para considerar en Power Query y que debemos tener presente al realizar nuestras consultas aquí, es el correcto desarrollo de estas para permitir que la funcionalidad de plegado de consultas sea aplicable en nuestro modelo. El plegado de consultas es una característica que le permite a Power Query optimizar el procesamiento de datos al traducir las consultas realizadas aquí en consultas con código nativo de la fuente de datos que incrementarán sustancialmente su desempeño y en consecuencia reducirán el tiempo de carga de los datos a Power BI, lo cual sin duda es especialmente valioso en proyectos que requieren de una gran cantidad de datos para generar sus informes.
Adicionalmente en Power Query podemos parametrizar filtros, los cuales nos permitirán controlar el número de registros importados a nuestro modelo procedentes de grandes tablas de datos. Una de las ventajas de utilizar estos parámetros es que en Power Query se habilitará la posibilidad de utilizar actualizaciones incrementales para optimizar el tiempo de carga de nuevos registros a nuestro modelo, esto nos permitirá establecer un rango de fechas específico para limitar el número de registros que se importarán al modelo en lugar de importar todos los datos cada vez que se realiza una actualización.
Otra característica de utilidad en Power Query y que de igual forma impactará de manera positiva el desempeño de nuestro modelo de datos, es la posibilidad de ocultar columnas que actualmente no se utilizan para los informes y de esta manera obtendremos un ahorro en la memoria consumida. Adicionalmente, si en algún punto esa columna fuera necesaria para algún informe, resultará mucho más fácil simplemente mostrarla de nuevo cuando sea necesaria que volver a la primera capa y modificar nuestras consultas para importarla a nuestro modelo.
Otra gran ventaja que nos da Power Query y que nos ayuda a generar un proyecto de Power BI que realmente sea de autoservicio, es la posibilidad de diseñar nuestro proyecto para los usuarios finales mediante el renombramiento de campos y columnas para que sean fácilmente identificables y utilizables para el futuro diseño de informes. Es muy común que a nivel de base de datos se utilicen abreviaciones y nombres sin espacios o incluso unidos por un guion bajo por que sólo así son admitidos por el motor de base de datos, pero resultan ser de difícil identificación para el usuario final. Power Query nos permite ampliar el número de caracteres para que el campo o columna sea más descriptivo para el usuario final e incluso nos permite utilizar espacios y caracteres especiales. Esto más allá de ser útil para el usuario final, nos será de gran ayuda también a nosotros cuando tengamos que retomar el proyecto para hacerle adiciones y podamos identificarlos fácilmente.
Si te encuentras en el proceso de implementar una solución de BI no dudes en contactarnos y en conjunto podremos desarrollar una solución de Business Intelligence con Power BI que se adapte a tus necesidades y genere valor a tu negocio.