Lire l'article
Comment aborder Power Query ? Et qu'est - ce qu'un ETL (Extract Transform & Load). N’hésitez pas à lire l’intégralité de cet article car celui - ci vous permettra de tout savoir sur Power Query dans Power BI et la "data prep".
Power Query apparaît pour la première fois dans Excel 2010 sous la forme d’un “Add-on”. Power Query sert donc d’ETL (Extract Transform & Load) et power pivot, vient se greffer sur celui – ci, afin de modéliser les données traitées dans Power Query. Le logiciel Power Query ayant été créé cinq ans avant Power BI, celui-ci a été intégré à Excel en premier lieu. C’est en 2015 lors de l’avènement de Power BI que Power Query est intégré à Power BI.
Power Query a pour vocation de gérer toute la partie en amont de Power BI. C'est - à - dire, la “data prep”, considérée comme la tâche la plus difficile selon certains experts. Power Query fait donc ce que l’on peut qualifier de “gros œuvre". Soit de : fractionner, pivoter, regrouper ou encore concaténer et bien évidemment calculer sur n’importe quelle requête.
Pour activer l’éditeur de logiciel Power Query, il faut tout d’abord se rendre sur Power BI et cliquer sur le bouton : “transformer les données”. Ensuite pour reverser les données déjà traitées dans Power BI il faut simplement cliquer sur le bouton : ”fermer et appliquer”.
Power Query permet aussi de travailler avec plusieurs requêtes et donc une infinie possibilités de jeux de données importées. En effet, à droite de l’écran est précisé la requête en cours de traitement ainsi que les étapes appliquées. Ce qui signifie que toutes les modifications que la requête a subies sont listées et modifiables. On peut également, en bas de la page, prendre connaissance du nombre de colonnes et du nombre de ligne de la requête.
Power Query possède plusieurs fenêtres qui sont, elles - mêmes divisées en plusieurs sous-parties. Prenons l’exemple de la fenêtre “Accueil” qui possède six sous-parties contenant plusieurs fonctions. Tout d’abord, la première : “Nouvelle requête” vise principalement à importer des jeux de données. Ils pourront ensuite être gérés et paramétrés par la deuxième sous-partie : “paramètre de la source de donnée”.
Ensuite, la sous-partie la plus utilisée sur Power Query est celle dite : “paramètres”. Les sous-parties : “Requête”, “Trier”, “Transformer”, agissent directement sur la requête afin de la modifier. De plus, ce qu’il faut retenir de la fenêtre “Accueil”, est bien la fonction “Combinée”. En effet, celle-ci est une des fonctions les plus importantes sur Power Query. Enfin, une fonction est dédiée à l’intelligence artificielle.
Ensuite, la fenêtre “Transformer” permet de modifier les colonnes, les lignes et les valeurs d’une requête. La partie tableau permet de travailler exclusivement sur les lignes. Les parties suivantes permettent de modifier les colonnes dans leur intégralité ou selon le type de celles-ci. Power Query définit donc trois types de colonnes. Les colonnes où les valeurs sont des textes, les colonnes où les valeurs sont des nombres et les colonnes où les valeurs sont une date ou une heure. Sans oublier de préciser qu’il est possible, sur la fenêtre “Transformer” d’intégrer du code en R ou en Python.
Enfin, la fenêtre “Colonne” permet d'ajouter des colonnes quel que soit leurs types. On peut donc créer des colonnes des trois types : “texte, nombre et dates et heures”. La fenêtre “Affichage”, quant à elle, permet d’aller collecter des informations sur une requête sans la modifier. Puis, la fonction “Distribution des Colonnes”, permet d’afficher le nombre de valeurs distinctes dans une colonne. Enfin, les fenêtres “Outils” : permet de créer des diagnostics, et la fenêtre “Aide” : permet de demander de l’aide aux autres utilisateurs qui forment la communauté Power BI. Cette brève présentation de Power Query et de la manière dont ce logiciel a été construit et pensé, vous permet surtout de comprendre le sens de Power Query et les manipulations que vous effectuez sur vos jeux de données.
L’essentiel à retenir se trouve bien dans les fonctions de Power Query. Tout d’abord, la fonction “Merge” ou : “Fusionner des “Requêtes” en français, permet de créer des jointures entre différentes requêtes. La fonction “Paramètres”, permet de créer une liste de variables pouvant être stockées et gérées et pouvant être réutilisées. Les fonctions “Pivoter” et “Dépivoter” les colonnes permettent de passer d’un modèle horizontal à un modèle vertical et inversement. Avec la fonction “Colonnes Personnalisées” on peut faire des opérations entre les colonnes. Enfin, avec la fonction “Regrouper par”, on peut créer des groupes au sein d’une colonne.
En définitive, il existe une infinie possibilité de traitement de données sur Power Query, qui permet de transformer et de structurer les données pour en simplifier l’analyse sur Power BI. Si vous souhaitez explorer davantage ce sujet, Mype-Consulting propose des formations à ce sujet, en présentiel ou en distanciel pouvant être pris en charge par votre CPF.