Lire l'article
(écrit par un humain)
Saviez-vous que vous pouvez exploiter les infobox Wikipédia pour créer une base de données enrichie dans Power BI ? Ce sont les petits encadrés situés à droite des pages (avec les infos sur la ville, le maire, la superficie, etc.). Ils ont tous une structure standardisée — c’est cette régularité qui va nous permettre d’enchaîner les imports de manière automatisée.
Dans cet article, nous verrons comment automatiser l’importation de ces infobox pour des dizaines, voire des centaines de villes françaises, et créer par la suite des visuels dynamiques dans Power BI.
Pour commencer :
Une fois les données chargées, repérez la première table (souvent celle affichant les informations de haut en bas). C’est celle qui correspond à l’infobox.
Important : allez dans l’étape Source de l’éditeur Power Query et modifiez la fonction utilisée.
Cela permet de garantir que l’importation fonctionnera de manière fiable sur toutes les pages.
Ensuite, développez la table dont le Class name est infobox.
L’infobox est souvent une table avec deux colonnes (label / valeur). Pour la rendre plus claire on va:
Nous allons créer un paramètre pour automatiser l’importation des infobox d’autres villes :
Testez avec "Lille" : vous verrez apparaître le bon maire (Martine Aubry), la bonne région, etc.
Pour pouvoir appliquer la même logique à une liste entière de villes :
Cette fonction va vous permettre d’automatiser l’appel à l’infobox pour chaque ville de votre liste.
Préparez une liste de 20 ou 100 villes françaises (par exemple les 100 plus peuplées). Copiez-la depuis Internet, puis :
Dans votre requête contenant la liste des villes :
Développez ensuite la colonne retournée pour voir apparaître tous les indicateurs des infobox.
Pour avoir une table propre, avec une colonne par indicateur (Population, Superficie, Maire, etc.) :
Résultat : une ligne = une ville, et chaque colonne = un indicateur.
Avec cette base de données, plusieurs visuels sont possibles :
Et bien sûr, tous vos visuels sont dynamiques et filtrables.
Cette méthode est idéale pour automatiser la collecte de données structurées depuis le web. Elle repose sur des techniques essentielles en Power BI :
Nous abordons ces cas concrets lors de nos formations Power BI, en présentiel ou à distance. Vous apprendrez à gagner du temps et à créer des dashboards à partir de sources variées comme Wikipédia.