Comment combiner 100 infobox Wikipédia dans Power BI (et construire une base de données complète sur les villes françaises)

23 mai 2025

(écrit par un humain)

Saviez-vous que vous pouvez exploiter les infobox Wikipédia pour créer une base de données enrichie dans Power BI ? Ce sont les petits encadrés situés à droite des pages (avec les infos sur la ville, le maire, la superficie, etc.). Ils ont tous une structure standardisée — c’est cette régularité qui va nous permettre d’enchaîner les imports de manière automatisée.

Dans cet article, nous verrons comment automatiser l’importation de ces infobox pour des dizaines, voire des centaines de villes françaises, et créer par la suite des visuels dynamiques dans Power BI.

Étape 1 : Importer l’infobox d’une ville dans Power BI

Pour commencer :

  1. Ouvrez Power BI Desktop
  2. Cliquez sur "Obtenir les données" > "Web"
  3. Collez l’URL de la page Wikipédia de la ville (par exemple : Marseille)

Une fois les données chargées, repérez la première table (souvent celle affichant les informations de haut en bas). C’est celle qui correspond à l’infobox.

Important : allez dans l’étape Source de l’éditeur Power Query et modifiez la fonction utilisée.

Cela permet de garantir que l’importation fonctionnera de manière fiable sur toutes les pages.

Ensuite, développez la table dont le Class name est infobox.

Étape 2 : Nettoyer et préparer la table

L’infobox est souvent une table avec deux colonnes (label / valeur). Pour la rendre plus claire on va:

  • Renommer les colonnes (ex : "Indicateur", "Valeur")
  • Supprimer les lignes où la colonne "Indicateur" est identique à "Valeur"

Étape 3 : Créer un paramètre dynamique

Nous allons créer un paramètre pour automatiser l’importation des infobox d’autres villes :

  1. Dans Power Query, allez dans "Accueil" > "Gérer les paramètres"
  2. Créez un nouveau paramètre nommé Ville (type texte), avec une valeur par défaut comme "Marseille"
  3. Remplacez manuellement dans l’URL de la source le nom de la ville par ce paramètre (Ville)

Testez avec "Lille" : vous verrez apparaître le bon maire (Martine Aubry), la bonne région, etc.

Étape 4 : Transformer votre requête en fonction

Pour pouvoir appliquer la même logique à une liste entière de villes :

  • Faites un clic droit sur la requête
  • Cliquez sur "Créer une fonction"

Cette fonction va vous permettre d’automatiser l’appel à l’infobox pour chaque ville de votre liste.

Étape 5 : Créer la liste des villes

Préparez une liste de 20 ou 100 villes françaises (par exemple les 100 plus peuplées). Copiez-la depuis Internet, puis :

  • Dans Power BI, cliquez sur "Entrer des données"
  • Collez la liste

  • Supprimez les colonnes inutiles (classement, population, etc.)
  • Gardez uniquement le nom des villes

Étape 6 : Appeler la fonction pour chaque ville

Dans votre requête contenant la liste des villes :

  • Cliquez sur "Ajouter une colonne"
  • Choisissez "Appeler une fonction personnalisée"
  • Sélectionnez la fonction créée précédemment

Développez ensuite la colonne retournée pour voir apparaître tous les indicateurs des infobox.

Étape 7 : Réorganiser les données (pivot)

Pour avoir une table propre, avec une colonne par indicateur (Population, Superficie, Maire, etc.) :

  • Allez dans l’onglet Transformer
  • Cliquez sur "Pivoter la colonne"
  • En colonne de valeurs, sélectionnez "Valeur"
  • Option avancée : choisissez "Ne pas agréger"

Résultat : une ligne = une ville, et chaque colonne = un indicateur.

Étape 8 : Créer vos visuels dans Power BI

Avec cette base de données, plusieurs visuels sont possibles :

  • Une carte géographique pour visualiser la population par ville
  • Un segment hiérarchique : Région > Département > Ville
  • Une matrice pour comparer les villes sur plusieurs critères (ex : superficie, parti du maire, etc.)

Et bien sûr, tous vos visuels sont dynamiques et filtrables.

Pour aller plus loin...

Cette méthode est idéale pour automatiser la collecte de données structurées depuis le web. Elle repose sur des techniques essentielles en Power BI :

  • Paramètres dynamiques
  • Fonctions personnalisées
  • Traitement de données semi-structurées
  • Reformatage avec pivot/dépivot

Nous abordons ces cas concrets lors de nos formations Power BI, en présentiel ou à distance. Vous apprendrez à gagner du temps et à créer des dashboards à partir de sources variées comme Wikipédia.

Articles en relation

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram