Les séries chronologiques et leurs paramètres dans Power BI

18 mai 2022

Qu’est-ce qu’une série chronologique ?

Les séries chronologiques (temporelles ou chroniques) sont des séries statistiques portant sur des observations qui dépendent du temps. Plus précisément, on s’intéresse à l’évolution au cours du temps d’un phénomène, dans le but de le décrire, de l'expliquer et de prévoir ses valeurs futures.

Ainsi, nous disposons d’observations à des dates différentes, c’est-à-dire d’une suite de valeurs numériques indicées par le temps.

On note généralement pour une série chronologique de taille n :

  • t1, t2, t3, … ,tn comme étant les n instants successifs d’observation
  • ytj comme étant la valeur mesurée à l’instant tj

Ainsi, on notera la série chronologique {yt} t T, avec T comme étant l’ensemble ordonné T = {t1, t2, t3, …, tn}.

Les dates d’observations sont généralement ordonnées de manière régulière dans le temps : on manipule des séries journalières, mensuelles, trimestrielles ou annuelles.

Aujourd’hui, les séries chronologiques sont abordées dans des domaines variés tels que l’économétrie, la médecine, la météorologie, ou encore la démographie. Plus concrètement, le nombre mensuel de vente de voitures neuves ou le nombre annuel de naissance sont des séries chronologiques.

Ci-dessous une série chronologique annuelle de la capitalisation boursière de Google et Facebook.

Comment se compose une série chronologique ?

Nous pouvons décomposer une série chronologique en plusieurs éléments de base :

  • Une tendance générale (fi )i=1,...,n.
    Elle représente l’évolution à long terme de la grandeur étudiée et traduit l’aspect général de la série.

 

  • Les variations saisonnières (si )i=1,...,n.
    Elles sont liées au rythme imposé par les saisons météorologiques, les activités économiques et sociales etc….
  • La composante résiduelle ou bruit (ei )i=1,...,n.
    Elle correspond aux variations résiduelles qui subsistent quand on a éliminé toutes les autres composantes. Elle peut être de différentes natures.

Estimation

1. La tendance

 

Afin d’estimer la tendance générale (fi), deux cas existent :

  • 1er cas : Notre tendance (fi) semble avoir l’allure d’une fonction connue (linéaire, exponentielle).
    • Dans ce cas, on ajuste la tendance (fi) par la méthode des moindres carrés, on parle alors de fi en fonction de i.
      • Inconvénients :
        • Estimation moins bonne.
        • Un ajustement correct n’est pas toujours possible.
      • Avantages :
        • Facilité de prévisions pour la tendance aux dates np + 1, np +2 ou p est la périodicité des variations saisonnières (p = 4 : série trimestrielle).

 

  • 2ème cas: Notre tendance est quelconque.
    • Dans ce cas, on effectue un lissage par moyennes mobiles, c’est-à-dire, on estime la tendance à l’aide des moyennes mobiles (MM) (ou de moyennes mobiles centrées (MMC) si leurs variations saisonnières sont paires).

  • Inconvénients :
    • Les moyennes mobiles peuvent être influencées par des valeurs aberrantes (une solution est d'utiliser les médianes mobiles de même ordre).
    • Perte de données : Si une série sur n années contient p mois chacune (np observations), alors on ne pourra calculer une estimation de la tendance que pour np – p + 1 ou np – p mois (selon p), soit une année de moins que la série.
  • Avantages :
    • Bonne estimation.
    • Meilleure estimation que la méthode des moindres carrés. La tendance est proche des valeurs.

 

 

2. Les variations saisonnières

Afin de modéliser une série chronologique, deux modèles de décomposition sont étudiés.

  • Le modèle additif :
    • On calcule les données sans tendance Yt – fi.
    • On calcule la moyenne des données sans tendance du mois j sur les n années et ceux sur chacun des p.
    • Grâce à la série corrigée des variations saisonnières (CVS). On peut réévaluer la tendance par ajustement, calculer la série ajustée et calculer les variations accidentelles. Ainsi, on suppose les 3 composantes : tendance, variations saisonnières et composante résiduelle comme étant indépendantes les unes des autres. On considère que la série Yt s’écrit comme la somme de ces 3 composantes : Yt = fi + si + ei.
    • Tendance obtenue par lissage : L’estimation de la tendance est plus proche que par un ajustement, on obtient une meilleure description.
    • Graphiquement, l’amplitude de la composante saisonnière et du bruit reste constante au cours du temps. Des fluctuations de la tendance d’amplitude constante sont également observées.

  • Le modèle multiplicatif :
    • On calcule les données sans tendance Yt / C.
    • On calcule la médiane ou la moyenne (en incluant ou excluant les valeurs extrêmes) des données sans tendance du mois j sur les n années et ceux sur p mois.
    • Grâce à la série corrigée des variations saisonnières (CVS). On peut réévaluer la tendance par lissage, calculer la série ajustée et calculer les variations accidentelles. Ainsi, on suppose que les variations saisonnières dépendent de la tendance. On considère que Yt s’écrit de la manière suivante : Yt = fi × si + ei.
    • Lors d’une tendance ajustée, on peut faire des prévisions très facilement : On prévoit la tendance en calculant l’année n+1. Selon le modèle de composition, on ajoute ou on multiplie par le coefficient saisonnier corrigé du mois.
    • Graphiquement, l’amplitude de la composante saisonnière et du bruit n’est plus constante au cours du temps : elles varient proportionnellement à la tendance.

Comment différencier ces modèles ?

 

Afin de choisir quels modèles utiliser on emploie principalement la méthode de la bande :

  • Cette méthode est une méthode graphique qui consiste à tracer la courbe qui passe par les minima sur une période, ainsi que la courbe qui passe par les maximas sur une période :
    • Si les courbes sont à peu près parallèles, on choisit un modèle additif

 

  • Sinon, on peut envisager un modèle multiplicatif.

Enfin, on peut sélectionner le modèle multiplicatif quand l'importance de l'effet saisonnier augmente au fur et à mesure du temps et que les valeurs de la série varie lorsque les valeurs de la série diminuent. Enfin, on sélectionne le modèle additif lorsque l'importance de l'effet saisonnier ne varie pas, quand bien même la série augmente ou diminue.

 

Comment paramétrer une série chronologique dans Microsoft Power Pi ?

 

Sur le logiciel Microsoft Power Pi, il est très simple de configurer un graphique en tant que série chronologique.

Pour commencer, sélectionner « Graphique en aires » dans la section « Visualisations ».

 

Enfin, afin de remplir au mieux nos axes, il suffit de se demander : Qu’est-ce que je cherche à analyser ?

Dans notre cas, nous effectuerons notre exemple sur le premier graphique de cet article, c’est-à-dire la série chronologique annuelle de la capitalisation boursière de Google et Facebook.

Afin d’y répondre efficacement, il suffit de se poser trois grandes questions :

  • Qu’est-ce que (j’analyse) ? Dans notre cas, la capitalisation boursière (ne pas oublier de convertir au format nombre entier et d’en faire la somme) nous permet de remplir le champ « Valeurs »
  • Comment ? Dans notre cas, les dates permettent de remplir le champ « axe »
  • Combien ? Dans notre cas, les différents noms de nos entreprises permettent de remplir le champ « légende »

 

Ainsi, nos paramètres ressembleraient à cela :

 

Ces différentes questions peuvent également être utiles afin de remplir efficacement un TCL dans Excel.
Vous voilà prêt à expliquer à quelqu’un qu’est-ce qu’une série chronologique et ses principales caractéristiques. De plus, vous êtes également capable de créer efficacement un « graphique en air » portant sur les séries chronologiques sur Microsoft Power Pi.

Pour en savoir plus sur la Capitalisation Boursière d'une Entreprise vous pouvez consulter notre analyse ici.

Merci pour votre temps et à très bientôt !

Articles en relation

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram