Analyser les données du Titanic avec Power BI

15 novembre 2024

(Écrit par un humain)

Dans le domaine en rapide évolution de la Dataviz la maîtrise des outils analytiques est essentiel pour extraire des informations précieuses à partir de grandes quantités de données. Avec son interface riche et ses fonctionnalités avancées Power BI s'avère être un allié précieux pour travailler avec des données. Nous verrons dans cet article comment exploiter Power BI à travers les étapes fondamentales d'un projet de Data Science qui la collecte, le nettoyage, la structuration des données et leurs analyse descriptive.

Nous vous invitons à regarder notre vidéo YouTube qui traite de ce cas pratique.

Collecte des données

La collecte des informations constitue la base de tout projet de Dataviz. Dans ce sens Power BI simplifie l'importation des données grâce à une interface intuitive et des connecteurs qui supporte une multitude de sources de données. Pour commencer nous pouvons lancer Power BI Desktop et sélectionner Obtenir les données. Ensuite selon la nature des données souhaitées nous avons le choix du connecteur à utiliser. Pour prendre l'exemple d'un dataset sur les passagers du Titanic au format csv nous allons choisir le connecteur Texte/CSV et sélectionner notre fichier. Après ça Power BI va nous permettre de charger les données mais aussi de prévisualiser la table afin de s'assurer que les colonnes sont correctement interprété par l'ETL avant l'importation définitive.

Transformation et nettoyage des données

Une fois les données collectées il est crucial de passer au nettoyage pour s'assurer de la qualité des informations présenter. Pour ce faire Power BI dispose de l'outil Power Query pour ce processus. Pour commencer nous allons dupliquer notre table d'origine pour préserver les données initiales. Les différentes étapes de cette partie de nettoyage sont l'attribution du type adéquat aux données, la suppression des éléments vides ou encore les remplacer par des valeurs fixes ou calculées dynamiquement.

Dans notre cas nous allons utiliser la fonction FillNa() pour remplacer ces éléments vides par des valeurs moyennes. Pour ce faire nous pouvons passer par l'exécution d'un script Python pour appliquer cette fonction sur la colonne Age de notre table grâce à ce programme :

Exploration des données

Afin d'explorer les données que nous avons importé nous allons les illustrer grâce aux visuels proposés dans Power BI Desktop. Pour ce faire nous devons d'abord cliquer sur Appliquer pour retrouver nos tables dans l'interface de Power BI Desktop.

Nous allons commencer notre exploration en présentant la distribution des coûts des billets des passagers du Titanic grâce au visuel Histogramme. Afin d'améliorer la lisibilité de nos informations nous divisons la colonne Fare en 8 compartiments. Aussi, dans le but d'affiner l'analyse nous affichons aussi la proportion des voyageurs qui ont survécu à l'incident.

Un autre moyen de présenter la distribution des coûts des billets est de les afficher en fonction de l'âge des passagers grâce au visuel Nuage de points.

Nous pouvons également comparé la distribution des classes du bateau dans lesquelles les passagers séjournaient en fonction de leurs âges grâce au visuel Box and Whisker. Ce visuel n'étant pas disponible par défaut nous devons donc cliquer sur Obtenir plus de visuels et se connecter pour se le procurer. Il permet distinguer pour chaque classe de l'embarcation la concentration en âge des passagers les empruntant.

Il est également possible de réaliser une matrice de corrélation grâce au langage Python pour une analyse plus poussée. Vous pouvez retrouver notre vidéo explicative ici.

Pour conclure Power BI permet de transformer les données brutes en insights compréhensibles et dynamique ouvrant ainsi la porte à des applications analytiques plus avancées et à une meilleure prise de décision basée sur les données. Les capacités de visualisations des informations sont très fournies et permettent même de déterminer des données qui ne sont pas présentes dans les datasets initiaux. Dans cet article nous avons couvert un cas pratique qui utilise les différentes capacités qu'offre le logiciel mais il est possible de l'exploiter davantage grâce à ses nombreuses fonctionnalités que nous présentons lors de nos formations.

Merci d'avoir lu cet article, vous pouvez retrouver nos vidéos explicatives sur Power BI sur notre chaîne YouTube ou en cliquant ici, nous abordons aussi ces pratiques durant nos formations Power BI.

Articles en relation

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram