Formation Power Query : qu'est ce que c'est ?

8 juin 2022

Microsoft Power BI est une solution d'analyse de données qui permet de créer des visualisations de données personnalisées et interactives avec une interface simple pour que les utilisateurs finaux.

Microsoft Power BI se décompose en deux :

  • D’un côté Power BI Desktop, qui permet de créer des rapports attrayants et fondamentaux et de les partager avec d’autres utilisateurs
  • De l’autre, l’Éditeur Power Query permet de se connecter à une ou plusieurs sources de données, modeler et transformer les données en fonction de vos besoins, puis charger ce modèle dans Power BI Desktop.

Cet article traitera de l’utilisation de Power BI (plus spécifiquement Power Query) et vous guidera dans sa conception.

Si vous souhaitez une présentation plus globale de Power BI voici notre article portant sur ce sujet.

Tout d’abord, présentons, globalement le logiciel Power BI Desktop. Ce dernier se compose en trois vues :

  • La vue Rapport : c’est là où vous utilisez des requêtes que vous avez créées pour générer des visualisations attrayantes, organisées comme vous souhaitez qu’elles apparaissent et avec plusieurs pages, que vous pouvez partager avec d’autres utilisateurs.
  • La vue Données : elle vous permet de consulter les données de votre rapport dans un format de modèle de données, où vous pouvez ajouter des mesures, créer des colonnes et gérer les relations.
  • La vue Relations : elle vous permet d’obtenir une représentation graphique des relations qui ont été définies dans votre modèle de données et de les gérer ou de les modifier si nécessaire.

Ces trois vues se retrouvent dans l’ordre dans le volet gauche de Power BI.

Power BI Desktop est fourni avec l’Éditeur Power Query. Ce dernier est un éditeur de requêtes qui s’utilise dans Excel et Power BI Desktop. Il s’agit d’une interface, qui permet à l’utilisateur, de se connecter ou d’importer des données via des fichiers Excel / XML, des bases de données Access / SQL Server / Oracle ou d’autres formes de base de données et de les transformer. L’objectif de cette transformation est de structurer les données pour en simplifier l’analyse.

La première étape de Power Query est d’importer des données. Pour ce faire vous pouvez simplement lancer Power BI, il vous sera proposé d’importer les données à partir d’Excel ou de SQL Server.

Si ces deux options ne vous correspondent pas alors il vous suffit d’aller dans le menu Accueil, puis dans la section « Données » et enfin d’ouvrir le menu déroulant de l’option « Obtenir les données » et de choisir le type de données. Les types de données les plus souvent utilisés par les utilisateurs sont affichés en premier. Mais vous pouvez aussi cliquer sur « Plus… » pour accéder à un plus grand choix.

Une fois votre source de données sélectionnée, une fenêtre s’ouvre vous permettant de sélectionner vos tables à traiter. Pour se faire cocher les tables qui vous intéressent et cliqué sur « Transformer les données » (si vous souhaitez modeler vos données) sinon cliqué sur « Charger ». Dans notre cas, nous souhaitons transformer nos données, donc nous cliquons sur « Transformer les données ».

Une fois vos données importées, il est essentiel de s’assurer qu’elles sont présentées dans un format idéal pour l’analyse. En effet, il est essentiel de les préparer afin d’effectuer au mieux notre analyse. Pour ce faire, il faut normaliser le plus possible nos données. Afin d’obtenir des tables de faits et des tables de dimensions. Ce traitement peut passer par une fusion, un tri, un renommage, un changement de format etc. Il vous est également possible d’ajouter / de retirer des colonnes, de faire des calculs d’agrégats, des statistiques conditionnelles etc. Pour ce faire, vous pouvez utiliser les différents volets de Power BI (« regrouper », « fusionner », « transformer », « ajouter », « insérer » etc) ou de créer des formules dans la barre de formule.

Voici quelques exemples possibles pour normaliser vos données.

Les différents menus déroulants sont également très utiles. Ils sont présents pour toutes les colonnes et leurs contenus varient selon la nature de la colonne (numérique, texte, date). À gauche de chaque nom de colonnes il est possible de changer la nature de cette dernière. Ci-dessous un exemple de menu déroulant pour une colonne textuelle.

Enfin, un clic droit sur une colonne révèle également de nouvelles options. On observe qu’il est possible de cette façon de supprimer des doublons, remplacer des valeurs, fractionner / renommer / déplacer / dépivoter des colonnes….

Nos différentes étapes se retrouvent dans la section « Étapes appliquées » à droite. Ces dernières constituent le cœur de chaque requête. Une étape correspond à une ligne de code. À droite dans la section « Propriété » notre requête prend le nom de notre source par défaut, il peut être utile de la modifier. À gauche, se trouve le panneau de requêtes, il permet de renommer notre base de données, de regrouper des requêtes et de créer des requêtes en utilisant du code M grâce à l’éditeur avancé.

Exemple de code M via l’éditeur avancé :

*

Il est également possible créer des fonctions avec des paramètres. Un paramètre sert de moyen de stocker et de gérer facilement une valeur qui peut être réutilisée. Les paramètres sont utiles pour modifier dynamiquement la sortie de vos requêtes en fonction de leur valeur et peuvent être utilisés pour :

  • Modification des valeurs d’argument pour des transformations et des fonctions de source de données particulières.
  • Entrées dans des fonctions personnalisées.

Vos paramètres peuvent être facilement géré dans la fenêtre Gérer les paramètres.

 

 

Noter que Power Query offre deux façons simples de créer des paramètres :

  • La première évoquée précédemment en créant un nouveau paramètre grâce à la fenêtre Gérer les paramètres
  • La seconde à partir d’une requête existante. A noter que les valeurs de votre requête doivent être constante simple et non structurée (telle qu’une date, un texte ou un nombre)

Enfin, si vous souhaitez avoir une « vue de tableau » de toutes vos requêtes montrant les liens entre les tables. Il vous suffit d’afficher les dépendances de la requête pour ce faire aller dans l’onglet « Affichage » puis « Dépendances de la requête ».

Cette vue peut s’avérer très utile si vous effectuez un grand nombre de transformation via des requêtes intermédiaires. Voici un exemple dans un classeur.

Une fois vos données préparées avec Power Query, cliquer sur « Fermer et appliquer » en haut à gauche.

Une fois, cela fait, il vous reste à construire un modèle de données. Ce dernier se trouve dans la vue « Relations » et vous permettra par la suite de créer des graphiques, des tableaux de bord, des rapports ou tout autres visualisations de données via Power BI Desktop.

Cette vue permet notamment de gérer le nombre et le type de relation entre les tables.

On parle alors de cardinalité regroupée en 4 options :

 

  • Plusieurs à un (*:1) : C’est le type de relation par défaut est le plus courant. Cette relation signifie que la colonne d’une table donnée peut avoir plusieurs instances d’une valeur, tandis que la table liée, souvent appelée table de recherche, n’a qu’une seule instance d’une valeur.
  • Un à un (1:1) : Dans ce cas, la colonne d’une table n’a qu’une seule instance d’une valeur particulière et la table liée n’a qu’une seule instance d’une valeur donnée.
  • Un à plusieurs (1:*) : Dans ce cas, la colonne d’une table n’a qu’une seule instance d’une valeur particulière, tandis que la table liée peut avoir plusieurs instances d’une valeur.
  • Plusieurs à plusieurs (*:*) : Ce modèle établit des relations plusieurs-à-plusieurs entre des tables, ce qui élimine la nécessité d’avoir des valeurs uniques dans les tables. Les solutions de contournement précédentes, comme la présentation de nouvelles tables uniquement pour établir des relations, sont également supprimées.

Ces différentes cardinalités peuvent être gérées en cliquant ici :

Une fois votre modèle de données finalisé, vous êtes en mesure de créer différents types de visualisation de données. Vous retrouverez ces dernières dans la section « Visualisations » de Power BI Desktop.

Si vous souhaitez transformer à nouveau vos données grâce à Power Query, il vous suffit d’aller dans « Transformer les données » dans la section « Accueil ».

 

Si vous souhaitez en savoir plus sur une notion statistique, n'hésitez pas à consulter notre article portant sur la régression linéaire simple et comment l'effectuer sur Excel.

Articles en relation

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram