Comparaisons Multi-Critères dans Power Query

24 septembre 2023

Dans le monde moderne des données, il est souvent nécessaire de faire des analyses complexes pour dénicher des informations cachées qui peuvent être utiles à la prise de décisions éclairées. Power Query, une fonctionnalité de Power BI, permet justement de faire cela de manière efficace et structurée. Dans cet article, nous verrons comment effectuer des analyses comparatives du salaire des hommes et des femmes en utilisant plusieurs critères, notamment la tranche d'âge et l'ancienneté.

Nous vous invitons à regarder notre vidéo YouTube qui traite de ce cas pratique.

Référence

Voici un aperçu de la requête d’origine que nous allons traiter :

Tout d'abord, nous allons créer une référence de la requête afin de faire notre analyse sur les données de base, mais sans les détruire.

Grâce à cette référence, notre nouvelle requête est liée en permanence avec la requête de base. 

Regrouper par

La première fonction que nous utiliserons sera la fonction Regrouper par, située dans la fenêtre Transformer.

Dans les paramètres avancés de la fonction nous mettons en place deux regroupements : par le sexe et par la tranche d'âge. La fonction Regrouper par nous permet de créer une nouvelle colonne et comme nous souhaitons analyser le salaire en fonction du sexe et de la tranche d'âge, nous implémentons le calcul de la moyenne de la colonne "Salaire temps plein" dans cette nouvelle colonne.

Ainsi, nous obtenons une requête à trois colonnes qui se compose du sexe, de la tranche d'âge, ainsi que de la moyenne du salaire en fonction des deux colonnes précédentes.

Pivoter

Pour comparer le salaire en fonction du sexe, il est plus judicieux de créer deux colonnes côte à côte avec l’une représentant le salaire des femmes et l'autre, le salaire des hommes. Ainsi, la comparaison est beaucoup plus facile. Pour cela, il faut cliquer sur la colonne sexe et ensuite utiliser la fonction Pivoter la colonne.

Dans la colonne de valeur, nous mettons la colonne à analyser, c'est-à-dire le salaire. Il ne faut pas oublier d'aller dans les options avancées et choisir de ne pas agréger.

Ainsi, nous avons la moyenne des salaires des femmes et des hommes par tranche d'âge.

Il est maintenant possible de calculer la différence entre le salaire des hommes et le salaire des femmes. Nous ajoutons une colonne personnalisée qui soustrait les colonnes Masculin et Féminin.

On peut également exprimer cette différence par un pourcentage en  divisant la différence calculée précédemment par le salaire des hommes.

Enfin, nous obtenons notre requête comparative sur la différence de salaire hommes/femmes en fonction de la tranche d’âge.

Autre cas de figure

Ce type de traitement est applicable sur toutes les requêtes avec des attributs qui se répètent. Pour le démontrer nous allons créer une requête "Analyse du salaire" mais cette fois par rapport à la tranche d'ancienneté. Pour ce faire nous dupliquons notre requête comparative et dans le duplicat nous nous rendons dans l'étape appliquées Lignes groupées où nous allons changer les paramètres de la fonction Regrouper par. Une fois dans la fonction, nous remplaçons Tranche d'âge par Tranche d'ancienneté.

Nous pouvons voir que nous obtenons le même rendu que précédemment mais les valeurs de différences sont maintenant basées sur la tranche d’ancienneté et non sur les tranches d’âges.

Pour conclure, Power Query offre un large éventail d'options pour effectuer des analyses comparatives multi-critères, allant de l'étude des inégalités salariales entre les sexes à l'examen des tendances en matière de dépenses énergétiques. En effet, cette méthode d’analyse, bien qu’intéressante, est aussi applicable à d’autres jeux de données différents. Chez MYPE nous avons utilisé cette succession d'étapes dans d'autres projets très différents de celui-là, à la fois pour analyser la moyenne des dépenses d'électricité par filiale au fil des années dans un grand groupe, ou même la consommation d'énergie des bureaux de poste sur deux ans chez La Poste.

Les fonctionnalités comme Regrouper par et Pivoter la colonne permettent de simplifier le processus et de rendre les données plus accessibles pour des analyses plus approfondies. Il s'agit d'un outil inestimable pour toute personne cherchant à extraire des insights significatifs de grands ensembles de données.

Merci d'avoir lu cet article, vous pouvez retrouver nos vidéos explicatives sur Power BI sur notre chaîne YouTube ou en cliquant ici, nous abordons aussi ces pratiques durant nos formations Power BI.

Articles en relation

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram