Mettre en place une actualisation incrémentielle

24 décembre 2021

L'actualisation incrémentielle vise à étendre les opérations d'actualisation planifiée en fournissant une gestion et une création automatique des partitions pour les tables de jeux de données qui charge fréquemment des données nouvelles et mises à jour.

Pour la majorité des ensembles de données qu'il s'agisse d'une ou plusieurs tables contenant par exemple des données de transaction qui changent fréquemment, ils peuvent croître de façon exponentielle comme une table de fait dans un schéma de base de données relationnel.

Avantages et fonctionnement de l'actualisation incrémentielle

L'actualisation incrémentielle comporte plusieurs avantages comme tout d'abord :

  • Une actualisation plus rapide des données : pour qu'il y ait que les données les plus récentes actualiser
  • Une actualisation plus fiable les données : connexion aux données sur le long terme permettant d'éviter une perte des données volatile l'exécution plus rapide des requêtes aux données sources et éviter les problèmes d'interférence
  • Une consommation des ressources réduite : étant donné qu'il y a moins de données actualiser la consommation des ressources mémoire et des autres ressources sur Power BI diminue
  • L'activation des jeux de données volumineux : comme certains, je donnais peuvent avoir des milliards de lignes qui croissent de manière exponentielle sans la nécessité de réaliser l'ensemble du jeu de données à chaque opération d'actualisation.
  • L'installation facile : la méthode des stratégies pour planifier l'actualisation incrémentielle étant définie sur power bi en seulement quelques étapes et une fois le rapport publié le service applique de manière automatique les stratégies d'actualisation

Configurer une actualisation incrémentielle

Création de paramètres et filtre des données

Pour configurer l'actualisation incrémentielle sur Power BI, il faut tout d'abord aller sur Power Query sur la table sur laquelle nous voulons appliquer l'actualisation. Ensuite vérifier que la colonne date est bien au format date/heure puis créer de nouveaux paramètres au format date/heure le premier paramètre s'appellera range start avec en valeur actuelle la première valeur de la colonne date et le deuxième range end qui a la dernière valeur de la colonne date en valeur actuelle.
Il faut ensuite appliquer un filtre date/heure personnalisé sur la colonne date, il faut ensuite choisir de conserver les lignes postérieures ou égales à notre paramètre range start et antérieur au deuxième paramètre range end et fermer et appliquer.

                                                 

Définition d'une stratégie

En retournant sur Power BI Desktop, dans le panneau champs faire clique droit sur le nom de la requête et sélectionner actualisation incrémentielle. C'est dans la fenêtre apparente que nous pouvons maintenant définir la stratégie de l'actualisation incrémentielle.

Dans cette même fenêtre il y a trois paramètres à remplir obligatoirement (table, stocker les lignes ou la colonne, actualiser les lignes ou la colonne) et 2 autres facultatif :

  • Table : Par défaut c'est la requête sélectionné dans le vue Données qui est utilisée et l’activation de l’actualisation pour la table et possible avec le curseur sur la droite
  • Stocker les lignes ou la colonne : Définit la période historique où les lignes avec une date/heure comprises dans cette période sont incluses dans le jeu de données
  • Actualiser les lignes ou la colonne : Spécifie l'intervalle de mise à jour incrémentiel auquel toutes les lignes de date/heure de cette période sont incluses dans les partitions de récupération et sont mises à jour à chaque opération de restauration.
  • Détecter les changements de données : Une actualisation incrémentielle de 10 jours est plus efficace qu'une actualisation complète de 5 ans. Avec l'option Data Change Detection, vous pouvez sélectionner la colonne date/heure à utiliser pour identifier et mettre à jour uniquement les jours où les données ont changé. Il ne peut pas s'agir de la même colonne utilisée pour diviser les données à l'aide des paramètres RangeStart et RangeEnd.
  • Actualiser uniquement les éléments complets du mois : Par exemple, imaginons que vous ayez programmé un rafraîchissement à 4h00 chaque matin. Si de nouvelles lignes de données apparaissent dans la table de source de données dans les quatre heures entre minuit et 4h00, vous souhaiterez peut-être les ignorer. L’actualisation de certaines métriques métier, comme le nombre de barils par jour dans l’industrie du pétrole et du gaz, n’a aucun sens si elle concerne des jours partiels.

Articles en relation

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram