Comment utiliser Python dans les traitements Power QUERY

28 avril 2024

(Écrit par un humain)

L'utilisation de Python dans Power Query représente une avancée significative pour les analystes de données cherchant à exploiter la puissance de la programmation pour améliorer et personnaliser le traitement des données. Cette intégration permet d'effectuer des manipulations complexes de données de manière efficace et dynamique pour enrichir les analyses dans Power BI. Nous allons voir dans cet article comment cela est  il possible.

Nous vous invitons à regarder notre vidéo YouTube qui traite de ce cas pratique.

Configuration Initiale

Tout d'abord il est cruciale de s'assurer que l'environnement Python est correctement configuré pour travailler avec Power BI. Nous devons nous rendre dans "Fichier", "Options et paramètres", "Options" et enfin "Création de script Python". Nous devons maintenant spécifier le chemin d'accès aux répertoires où Python est installé et s'assurer qu'il s'agit de la dernière version disponible. Une fois sélectionné il faut valider en cliquant sur "OK".

Création et Exécution de Scripts Python

Une fois la configuration validée nous pouvons commencer à intégrer Python dans nos requêtes de données. Pour ce faire nous sélectionnons "Transformer" puis "Exécuter le script Python". Cette action ouvre une interface qui précise que 'dataset' contiendra toutes les données actuelles de votre requête.

Par exemple si nous travaillons avec des données issues d'une requête nommée "Paris Airbnb" le 'dataset' inclura toutes les informations de cette table.

Exemples d'Utilisation de Scripts Python

Pour illustrer l'utilisation de Python dans Power Query nous allons ajouter en codant une nouvelle colonne appelée "Hello World" où chaque cellule retourne la chaîne de caractères "Hello World".

Après avoir écris ce script et l'avoir exécuté en cliquant sur OK nous pouvons voir que l'apparence de notre requête a changé en montrant la nouvelle colonne ajoutée.

Vous pouvez également utiliser Python pour des transformations plus complexes. Par exemple pour convertir les points en virgules dans une colonne. Pour ce faire nous pouvons rajouter cette action dans le programme précédent.

Après modification nous pouvons voir que notre programme a correctement été exécuté. Nous pouvons aussi ajuster le type de données pour garantir leurs intégrité en attribuant aux colonnes le type le plus correspondant à leurs valeurs.

Génération de Données avec Python

Un autre usage puissant de Python est la génération de données comme pouvoir créer une colonne de nombres aléatoires en utilisant la bibliothèque "numpy". Cela peut être particulièrement utile pour des simulations ou pour ajouter une dimension de variabilité aux données existantes.

Voici comment implémenter cette génération aléatoire de nombres compris entre 1 et 100.

Après avoir exécuté et validé nos scripts Python les nouvelles colonnes sont maintenant disponibles dans notre requête. Nous pouvons par la suite les exploiter dans Power BI Desktop pour des analyses approfondies en les intégrant dans des visuels ou des rapports.

Pour conclure l'intégration de Python dans Power Query offre aux utilisateurs de Power BI une flexibilité sans précédent pour manipuler et analyser les données. Que ce soit pour des modifications simples, pour des calculs ou de la génération de données le langage Python s'avère être un outil inestimable qui peut significativement augmenter la valeur de vos analyses dans Power BI.

Merci d'avoir lu cet article, vous pouvez retrouver nos vidéos explicatives sur Power BI sur notre chaîne YouTube ou en cliquant ici, nous abordons aussi ces pratiques durant nos formations Power BI.

Articles en relation

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram