Leçon 2 : analyse historique et prévision
Comment analyser un historique ?

Le calcul de statistique de base

La notion d'historique


Une série chronologique est composée d'un historique, c'est-à-dire d'une suite de valeurs ordonnées dans le temps à périodicité constante : par exemple, l'indice mensuel des prix à la consommation de la France entière publié par l'INSEE en base 100 en 1980. La «suite» des valeurs de janvier 1995 jusqu'à septembre 2000 au mois le mois représente l'historique de l'indice des prix à la consommation. Les ventes mensuelles, pour un article, de mars 1997 à février 2000 serviront de base historique afin d'élaborer la prévision.

Un historique doit réunir certaines propriétés :

  • il ne se compose que de valeurs connues et calculées, qui sont effectivement réalisées.
  • il est représentatif de ce que l'on cherche à prévoir. Un historique des livraisons ne permet pas de prévoir la demande !
  • il est homogène dans le temps.
  • il comprend un nombre minimal d’observations.

Il semble logique d'écrire que plus l'historique est long, meilleure sera la qualité de l'analyse et par voie de conséquence de la prévision. La longueur minimum d'un historique, c'est-à-dire son nombre de valeurs, est variable selon le but recherché et la périodicité des données. Si l'objectif est de fournir des prévisions de périodicité mensuelle à un horizon de 6/12 mois, nous considérons alors que le minimum de valeurs disponibles est de 3 ans, soit 36 observations mensuelles, alors que la dimension souhaitable d'un historique se situe aux alentours de 4/5 ans (surtout en ce qui concerne le calcul de coefficients saisonniers significatifs).

La moyenne (définition)

La formule générale de la moyenne d'une série chronologique de terme général xt pour laquelle nous disposons de n observations est :

Le calcul de la moyenne présente un intérêt limité : deux séries des ventes peuvent avoir une moyenne identique alors que leur allure générale est très différente. Egalement dans le cas de séries ayant une forte tendance soit à la hausse soit à la baisse, la moyenne variera fortement à chacune des nouvelles réalisations. C'est pourquoi il est préférable de présenter avec la moyenne un coefficient permettant de prendre en compte la dispersion.

La dispersion (définition)

La variance d'une série chronologique permet d'évaluer la dispersion autour de la moyenne. Nous devons distinguer deux cas, selon que nous sommes en présence de toute la population de façon exhaustive ou que nous disposons seulement d'un échantillon de réalisations considéré comme représentatif de la population totale.

 

La formule de la variance dans le cas d'un échantillon (variance empirique) est donnée par :

Dans le cas du calcul de la variance d'une série chronologique, la deuxième formule est la seule retenue ; en effet, nous ne connaissons pas toutes les valeurs, aussi bien les réalisations futures que celles qui sont très éloignées dans le passé ; la série chronologique constitue donc un échantillon représentatif de la série des ventes vraie mais inconnue.
Dans la littérature statistique ou économique, on préfère présenter la racine carrée de la variance appelée écart-type (sx) :

Cet écart-type est l'un des indicateurs fondamentaux de la difficulté à prévoir une chronique, il présente l'avantage de s'exprimer dans la même unité que l'historique. Pour pouvoir interpréter sa valeur, il convient de le rapporter à la moyenne.

Coefficient de variation

Le coefficient de variation se définit comme étant le rapport de l'écart-type à la moyenne calculé à partir de la série brute :

 

Typologie des historiques des ventes en fonction de ce coefficient :

Il rend compte de la difficulté prévisionnelle d'un historique. Plus il est élevé, plus la variance de la série est importante rapportée à la moyenne et, donc, plus la tâche du prévisionniste est a priori délicate. Nous pouvons classer les historiques des ventes en fonction de ce coefficient :

  • inférieur à 0,5 : a priori facile à prévoir,
  • compris entre 0,5 et 1 : de dispersion moyenne,
  • supérieur à 1 : la variance de la série est importante rapportée à sa moyenne et donc, cette série peut s'avérer difficile à prévoir.

Néanmoins le coefficient de dispersion de la série brute ne préjuge pas complètement des difficultés ultérieures : une série fortement fluctuante peut être largement "expliquée" par des coefficients saisonniers très marqués et/ou par un facteur explicatif très influent.

 

Leçon 2 : analyse historique et prévision