Lire l'article
QU’EST CE QU’UN GROUP BY ?
Le Group By est l’une des 5 fonctionnalités les plus importantes sur Power Query parmi d'autres telles que : la fusion, les paramètres , les colonnes personnalisées et les fonctions.
Cette fonctionnalité permet de réunir les mêmes valeurs dans une ou plusieurs colonnes en une seule ligne groupée.
C’est comme faire des agrégations sur un tableau croisé dynamique sur excel en beaucoup plus simple ou bien retourner le résultat d’une formule NB SI ou encore Somme SI.
POURQUOI ?
Un Group By me permet de savoir par exemple :
COMMENT FAIRE UN GROUP BY ?
Tout d’abord cette fonctionnalité se trouve dans l’onglet Transformer de Power Query.
On peut regrouper grâce à une colonne que l’on nomme colonne de regroupement en effectuant les opérations suivantes :
Voyons tout ça à travers un exemple :
À ma disposition un tableau regroupant les 250 meilleurs films notés par les internautes.
Si je veux encore plus catégoriser ces films en sortant les meilleurs par décennie,
je peux ainsi faire un Group By en prenant la colonne décennie en tant que colonne de regroupement et en recherchant le plus petit rang (qui s’avère être le meilleur) .
NB : On n’oublie pas de dupliquer la requête afin de ne pas perdre la requête initiale étant donné que cette opération va déstructurer nos données.
ETAPE 1 : GROUP BY
Les meilleurs films par décennie
À présent j’ai le rang de ces meilleurs films.
En faisant une fusion (MERGE, l’équivalent d’une recherche V sur Power Query) je peux ainsi avoir le titre de ces films.
ETAPE 2 : FUSION
Et maintenant je peux catégoriser ces informations là en calculant par exemple le pourcentage de films par décennie.
Ainsi cette fois je vais faire un groupe By en prenant la colonne décennie en tant que colonne de regroupement mais cette fois ci je vais juste compter les lignes :
ETAPE 1 : GROUP BY
À présent je peux calculer le pourcentage.
ETAPE 2: COLONNE PERSONNALISÉE