Lire l'article
(Écrit par un humain)
Dans le monde de l'analyse de données, la flexibilité et la puissance des outils utilisés peuvent grandement améliorer la qualité et l'efficacité du travail. L'intégration de Python dans Power Query de Power BI offre aux utilisateurs la possibilité de manipuler et d'analyser leurs données de manière plus dynamique et personnalisée. Nous verrons dans cet article comment utiliser les boucles FOR et WHILE dans Power Query pour traiter des données de manière conditionnelle.
Nous vous invitons à regarder notre vidéo YouTube qui traite de ce cas pratique.
Pour débuter, l'intégration d'une boucle for dans Power Query commence par l'ouverture de l'interface Exécuter le script Python.
Avant toute chose, il est crucial d'importer les librairies nécessaires, en l'occurrence pandas, qui est essentielle pour le traitement des données. La première tâche consiste à créer une colonne nommée Nombre_colonne_numérique qui sera initialisée à zéro. Cette colonne est destinée à stocker les valeurs calculées pendant le traitement.
Ensuite nous implémentons une boucle FOR pour parcourir chaque colonne du dataset. Dans cette boucle nous appliquons une vérification des valeurs dans chaque colonne pour déterminer lesquelles sont de type numérique. Si une colonne contient des valeurs numériques le script incrémente la colonne nommée Nombre_colonne_numérique afin de déterminer leurs nombres. Ce processus permet de déterminer et de retourner le nombre total de colonnes numériques dans le dataset.
Une fois le script exécuté après avoir cliqué sur OK, Power BI va proposer de développer la colonne Value pour sélectionner et afficher les colonnes traitées dont la colonne Nombre_colonne_numérique.
Maintenant pour implémenter un boucle WHILE nous pouvons modifier la précédente étape ou exécuter un nouveau script python. Cette fois ci nous allons importer la librairie random qui va permettre de générer des nombres aléatoires. Dans le script nous allons drabord initialiser une nouvelle colonne Nombre_Aléatoire à zéro ainsi qu'une variable index_ligne, également à zéro.
La première boucle WHILE stocke, dans la colonne Nombre_Aléatoire, des nombres aléatoires entre 0 et 5 pour les lignes dont l'index de ligne est inférieur à 100. À la fin de celle-ci nous incrémentons la variable index_ligne.
Une seconde boucle WHILE continue le processus pour les index de ligne jusqu'à 500, en générant des nombres aléatoires entre 5 et 15.
Ensuite nous implémentons une troisième boucle qui s'applique aux lignes dont l'index est inférieur à 1000 et retourne des valeurs aléatoires entre 15 et 100.
Enfin, nous pouvons cliquer sur OK et nous pouvons constater le script s'exécute correctement.
Pour conclure, l'utilisation des boucles FOR et WHILE dans Power Query avec Python offre une méthode puissante pour traiter et analyser les données augmentant ainsi la flexibilité et l'efficacité des analyses réalisées dans Power BI. Ces techniques permettent de manipuler des ensembles de données complexes et de réaliser des analyses dynamiques, cruciales pour la prise de décision basée sur les données.
Merci d'avoir lu cet article, vous pouvez retrouver nos vidéos explicatives sur Power BI sur notre chaîne YouTube ou en cliquant ici, nous abordons aussi ces pratiques durant nos formations Power BI.