GROUP BY – une fonction clé dans Power BI

20 décembre 2022

QU’EST CE QU’UN GROUP BY ?

 

Le Group By est l’une des 5 fonctionnalités les plus importantes sur Power Query parmi  d'autres telles que : la fusion,  les paramètres , les colonnes personnalisées et les fonctions.

Cette fonctionnalité permet de réunir les mêmes valeurs dans une ou plusieurs colonnes en une seule ligne groupée.

C’est comme faire des agrégations sur un tableau croisé dynamique sur excel en beaucoup plus simple ou bien retourner le résultat d’une formule NB SI ou encore Somme SI.

 

POURQUOI ? 

Un Group By me permet de savoir par exemple : 

  • Le dernier achat d’un client 
  • La date de l’incident le plus critique de mon entreprise ou encore l’incident critique lui-même.
  • Le nombre d'employés que compte l’entreprise selon leur contrat

COMMENT FAIRE UN GROUP BY ?

Tout d’abord cette fonctionnalité se trouve dans l’onglet Transformer de Power Query. 

On peut regrouper grâce à une colonne que l’on nomme colonne de regroupement en effectuant les opérations suivantes : 

  • Somme 
  • Moyenne
  • Médiane
  • Min
  • Max
  • Compter les lignes

 

Voyons tout ça à travers un exemple : 

 

À ma disposition un tableau regroupant les 250 meilleurs films notés par les internautes.

Si je veux encore plus catégoriser ces films en sortant les meilleurs par décennie,

je peux ainsi faire un Group By en prenant la colonne décennie en tant que colonne de regroupement et en recherchant le plus petit rang (qui s’avère être le meilleur) .

 

NB : On n’oublie pas de dupliquer la requête afin de ne pas perdre la requête initiale étant donné que cette opération va déstructurer  nos données.

 

ETAPE 1 : GROUP BY

Les meilleurs films par décennie

À présent j’ai le rang de ces meilleurs films.

En faisant une fusion (MERGE, l’équivalent d’une recherche V sur Power Query)  je peux  ainsi avoir le titre de ces films.

 

ETAPE 2 : FUSION

 

Et maintenant je peux catégoriser ces informations là en calculant par exemple le pourcentage de films par décennie.

Ainsi cette fois je vais faire un groupe By en prenant la colonne décennie en tant que colonne de regroupement mais cette fois ci je vais juste compter les lignes :

ETAPE 1 : GROUP BY

 

 

À présent je peux calculer le pourcentage.

 

ETAPE 2: COLONNE PERSONNALISÉE

 

 

 

Articles en relation

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram