Revue de l'OFCE 2005/4
Revue de l'OFCE
2005/4 (no95)
360 pages
Editeur
Les éditions du Net

Revue anciennement éditée par www.pressesdesciencespo.fr

Numéros antérieurs disponibles sur www.persee.fr

DOI 10.3917/reof.095.0327
A propos de cette revue Site Web
Acheter en ligne

Ce numéro ou un abonnement.

Ajouter au panier Ajouter au panier - Revue de l'OFCE
Revue de l'OFCE 2005/4 (no95) 20 €

Versions papier et électronique : le numéro est expédié par poste.
Il est également accessible immédiatement en ligne.

Abonnement particuliers (4 nos) 2013 56 €

Tous les numéros en ligne sont immédiatement accessibles.

ATTENTION : cette offre d'abonnement est exclusivement réservée
aux particuliers. Pour un abonnement institutionnel, veuillez
vous adresser à l'éditeur de la revue ou à votre agence d'abonnements.

Cairn.info respecte votre vie privée
Alertes e-mail

Recevez des alertes automatiques relatives à cet article.

S'inscrire Alertes e-mail - Revue de l'OFCE

Être averti par courriel à chaque nouvelle parution :
d'un numéro de cette revue
d'une publication de Guillaume Chevillon
d'une citation de cet article

Votre adresse e-mail

Gérer vos alertes sur Cairn.info

Cairn.info respecte votre vie privée
Article précédent Page 327-356

Vous consultezAnalyse économétrique et compréhension des erreurs de prévision

AuteurGuillaume Chevillon[*] [*] Je remercie David Hendry et Xavier Timbeau pour leurs remarques...
suite
du même auteur

Département analyse et prévision de l’OFCE

1 Prévoir, c’est porter un jugement sur les événements ou évolutions possibles à venir en utilisant comme outils le passé et le présent. Pour réussir une telle entreprise, quatre conditions sont à remplir : (1) une certaine régularité dans le fonctionnement du monde est tout d’abord nécessaire, (2) il faut par ailleurs que cette régularité fournisse une information sur l’avenir, (3) que la méthode choisie pour établir la prévision capture une part de cette régularité et (4) enfin qu’elle exclue au maximum le « bruit » ou les irrégularités passés. Les deux premières conditions sont constitutives du système économique, les deux dernières sont fonctions de la méthode de prévision ou de la théorie économique choisies. Il en résulte que les prévisions sont toujours entachées d’erreur et qu’il est possible d’en établir plusieurs pour un même événement à venir (qui constitue l’ objet de la prévision). Des outils d’analyse doivent donc être développés afin de comparer et de hiérarchiser les prévisions pour discerner ce qui fait qu’on puisse, ou non, en qualifier certaines de « bonnes ».

2 La qualité d’une prévision est définie par le critère d’évaluation considéré. Ainsi, si on s’intéresse à l’inflation en France en 2006, il est probable que le prévisionniste soit indifférent entre une erreur de + 0,1 % et de – 0,1 %, i.e. symétrique autour de l’hypothèse centrale. En revanche le sismologue qui s’attache à déterminer la date de la prochaine éruption de l’Etna accordera une valeur nettement (infiniment ?) plus grande à une prévision en deçà de la date d’éruption ! Il apparaît clair que, dans ces deux contextes, les méthodes choisies se ressentiront des critères retenus pour leur évaluation.

3 De manière générale, trois qualités sont recherchées : l’ exactitude , la précision et la certitude , et on privilégiera l’une ou l’autre selon les cas. Pour bien comprendre leur différence, si nous supposons que nous disposions en 2005 de deux prévisions de l’inflation en France en 2006 : une à 1,95 ± 0,45 % et l’autre à 2,0 ± 0,2 %. Laquelle préférer ? La première est davantage précise dans son énoncé, au centième de point de pourcentage près contre un dixième pour la seconde. En revanche, cette dernière est nettement plus certaine , car l’intervalle de confiance lui correspondant est assez étroit (en tout 0,4 %) contre une incertitude de 0,90 % dans le premier cas. Enfin, si on découvre, fin 2006, que l’inflation se monte à 1,9 %, la première prévision est finalement plus proche — dans son scénario central — de la réalisation. Mais laquelle peut être dite la plus exacte ? Ceci dépend du critère considéré — et donc de l’utilisation faite de cette prévision. Et encore ! Que dire des deux déclarations « l’inflation se portera à 12,314 % en 2006 » et « l’inflation sera d’environ 2 % ». La première est très précise, i.e. présentant un fort degré de détail dans son assertion, et certaine (car elle n’autorise, de manière péremptoire, aucune marge d’erreur autour du scénario central), mais très éloignée de la vérité, l’autre est moins précise et certaine, mais plus proche de la réalisation. Toutes ces déclarations peuvent pourtant être qualifiées d’inexactes ! Pour mesurer et hiérarchiser l’exactitude, les économistes utilisent souvent le critère de moyenne quadratique d’erreur de prévision (MQEP, voir définition plus bas) qui combine l’écart à la réalisation (la moyenne d’erreur de prévision) et l’incertitude entourant le scénario central (la variance de l’erreur).

4 Ces quelques réflexions nous amènent à nous demander comment quantifier a priori l’exactitude d’une prévision. Pour ce faire, des informations sont nécessaires : comment est-elle obtenue ? sous quelle hypothèses ? quelle incertitude envisage-t-elle ? quel est son but, son utilité ? Avec tous ces éléments, il est possible d’analyser une prévision, et c’est le propos de cet article de montrer comment les outils de l’économétrie permettent d’en établir et d’en contrôler les caractéristiques. Les méthodes de prévision ne sont malheureusement pas parfaites et n’ont pas vocation à devenir de purs exercices mathématiques sans contenu économique. En revanche l’utilisation de modèles simples nous permet d’analyser une partie des conséquences de notre ignorance quant à la manière dont fonctionne l’économie et aussi aux chocs qui peuvent l’affecter. Aujourd’hui, l’économétrie des séries temporelles permet essentiellement de comprendre pourquoi certaines méthodes de prévision couramment utilisées depuis des décennies présentent les propriétés qui les rendent populaires. Cette démarche s’inscrit dans un contexte de formalisation de la prévision là où les experts utilisaient auparavant leur capacité de jugement, pourtant encore nécessaire aujourd’hui ; il ne peut s’agir toutefois de s’affranchir de modèles structurels essentiels pour une vision complète de l’économie et pour leurs capacités à effectuer des variantes, mais d’utiliser des compléments ayant des propriétés contrôlables de robustesse aux chocs. Le modèle de l’OFCE qui sert de bases aux prévisions de l’économie françaises demeure par exemple un outil incontournable, mais certaines variables clefs peuvent faire l’objet d’une étude complémentaire.

5 Cet article s’organise comme suit : la première section présente un bref historique des méthodes utilisées en prévision économique afin de dégager ensuite, dans le cadre d’un modèle simple tiré des travaux de M. P. Clements et D. F. Hendry, les principaux apports de l’analyse économétrique. La section 3 montre toutefois les limites de la modélisation dans ce cadre, mais cette analyse permet également de comprendre comment pallier les problèmes de prévision, ce qu’aborde la section 4. Après nous être intéressés aux méthodes d’évaluation des prévisions dans la section 5, nous illustrons l’usage de ces méthodes par une application à la prévision des importations françaises.

1 - La prévision en économie

6 Pour comprendre les mérites propres des méthodes de prévision, il est essentiel d’en connaître les deux grandes classes, d’ailleurs non mutuellement exclusives : il existe d’une part des modèles purement statistiques sans représentation économique et d’autre part des modèles dits structurels dont l’ambition est de fournir une image du fonctionnement effectif de l’économie.

7 Mais afin de bien présenter l’état actuel de la recherche, il nous semble essentiel de rappeler brièvement les développements de la prévision économique au XX e siècle, car chaque grande vague d’avancées a rencontré des écueils qui ont permis d’améliorer la compréhension des limitations des diverses méthodes[ 1] [ 1] L’exposition historique doit en grande part à l’article...
suite
.

1.1 - Modèles structurels keynésiens

8 La complexité et l’interdépendance des systèmes économiques a longtemps été un frein puissant à toute tentative de prévision, ce qui fit que les premières ne virent le jour qu’après l’émergence de modèles macroéconomiques simples. Après la publication de la Théorie Générale de J. M. Keynes en 1936 et grâce à de notables avancées techniques de la Statistique, s’ensuivit un vif développement de l’activité économique de construction, d’estimation et d’analyse de modèles visant à représenter le comportement des agents macroéconomiques. Ce bouillonnement intellectuel amena à la création de l’ Econometric Society et de sa publication prestigieuse, la revue Econometrica[ 2] [ 2] À l’origine, les deux branches de l’économie théorique...
suite
, qui devint le médium naturel de diffusion des idées et avancées de la Commission Cowles à l’université de Chicago au cours des années 1940 et 1950. La facilité d’usage des systèmes d’équations à base de modèles IS-LM permit leur généralisation dans les cercles universitaires et gouvernementaux s’attachant à l’analyse et à la prévision des politiques économiques. Les méthodes d’estimation économétrique étant encore peu développées, les principaux débats portaient sur des calibrages des coefficients de réaction. Les besoins naissants de planification entraînèrent la généralisation de modèles input-output qui visaient à prévoir les tensions sur les capacités productives. L’augmentation de la quantité et de la qualité des données disponibles mena à une généralisation de modèles très détaillés de l’économie, comportant des centaines d’équations. Cette abondance d’information ne put empêcher un enlisement des macro-modèles (comme le fameux modèle Wharton conçu autour de Lawrence Klein) car ils subirent un cuisant échec dans les années 1970 alors que la stagflation apparaissait et que le chômage prenait son envol.

9 L’apparition de doutes quant au manque de fondements micro-économiques — i.e. représentant les préférences, comportements et anticipations des agents – aboutit à la remise en cause théorique des « systèmes d’équations ». La critique principale provint de Lucas (1976) qui remit en cause la stabilité des paramètres des modèles non « structurels ». Pour lui, il fallait rechercher les paramètres fondamentaux du comportement économique, ceux qui se révèlent stables. Cette approche tend à privilégier l’élaboration de modèles de faible taille, plus robustes aux chocs et changements de politique économique.

10 Par ailleurs, les capacités prévisionnelles des macro-modèles se virent bien souvent dépassées par de simples extrapolations statistiques. La macroéconomie purement keynésienne précéda de peu la prévision économétrique structurelle keynésienne dans sa perte de faveur. Une relative dissociation s’opéra entre les approches de modélisation (pour étudier la réaction de l’économique à une politique) et de prévision (où il s’agit d’obtenir la valeur future, assortie d’un intervalle d’incertitude, d’une ou plusieurs variables).

1.2 - Modèles statistiques

11 À la suite de la baisse d’intérêt pour l’utilisation de modèles théoriques en prévision, l’une des réponses fut une réorientation vers des méthodes alternatives plus empiriques. Un modèle non-structurel élabore des prévisions dites inconditionnelles, i.e. qui s’attachent à déterminer l’évolution de l’économie en supposant que les règles de gouvernance économique ne soient pas modifiées — contournant ainsi la critique de Lucas qui niait le pouvoir prévisionnel des modèles économiques en fondant son analyse sur leur manque de robustesse (de stabilité) vis-à-vis d’une intervention de politique économique — alors que les modèles structurels établissent des prévisions conditionnées aux décisions de politique économique. Cette propriété même, conjuguée à la faiblesse des modèles structurels et aux avancées importantes des techniques statistiques a entraîné un fort intérêt pour ces nouvelles méthodes de prévision.

12 En réalité, les développements techniques étaient pour bonne part déjà connus et utilisés par les économètres car ils dataient d’avant l’émergence de la théorie keynésienne ; la borne initiale fut plantée dans les années 1920 par Slutsky et Yule, lorsque ceux-ci constatèrent que des équations différentielles linéaires, gouvernées par des chocs aléatoires constituaient un cadre simple et puissant pour la représentation et la prévision des variables économiques et financières. Ces équations différentielles (discrètes) stochastiques, appelées autorégressives, permettent d’exprimer une variable à l’instant présent comme la somme pondérée de ses valeurs passées et d’un choc purement aléatoire. L’exemple le plus simple en est le modèle autorégressif d’ordre 1, noté AR(1) où la variable y à l’instant t , y t , est donnée par :

13  ε t suit une loi aléatoire (en général Gaussienne) de moyenne nulle et où les propriétés de y t dépendent de la valeur α . Les processus autorégressifs sont liés de manière proche à ceux dits de moyenne mobile, étudiés aussi par Slutsky et Yule, où, à présent, y t est exprimé comme la somme pondérée de chocs présent et passés. Le cas non trivial le plus simple en est la moyenne mobile d’ordre 1 (MA(1) pour « moving average ») : Les représentations AR et MA sont, pour ce qui est des variables stationnaires[ 3] [ 3] La stationnarité au sens faible de ...
suite
, les deux facettes d’une même dynamique et il est possible de passer de l’une à l’autre, mais au prix d’une perte d’efficacité dans l’estimation. Le très fort développement des modèles du type Slutsky-Yule doit son origine aux travaux, dans les années 1930, de H. Wold qui montra alors que — sous des hypothèses de stationnarité — toutes les séries temporelles peuvent être représentés comme modèles autorégressifs ou de moyenne mobile. Les algorithmes de prévision, d’estimation et de représentation de ces modèles furent développés dans les décennies 1940 et 1950, époque de forte avancée de l’économétrie, par Wiener, Kolmogorov et Kalman[ 4] [ 4] Pour une présentation des modèles espaces-états et du...
suite
.
L’heure de la désillusion vis-à-vis des modèles keynésiens coïncida avec la publication par Box et Jenkins du livre référence en matière d’analyse et de prévision des séries temporelles. Une des idées phares de ces auteurs fut l’apport d’une nouvelle méthode pour représenter les tendances. À la place d’une fonction linéaire du temps, ils suggérèrent le concept de tendance stochastique qui est générée par la somme des chocs passés, conférant, de ce fait, à chacun d’entre eux un impact permanent. En termes de prévision, ceci implique une absence de retour à long terme vers une tendance précise, mais, au contraire, la présence à chaque instant d’une tendance locale fluctuante. Les variables présentant un comportement de tendance stochastique sont non-stationnaires et dites intégrées (on parle aussi de présence d’une racine unitaire). La contribution principale de Box et de Jenkins est, toutefois, l’élaboration d’un cadre opérationnel pour la prévision grâce à la clarification d’une méthode de formulation, d’estimation, d’évaluation d’un modèle et de prévision des séries qui reprennne les travaux de Slutsky-Yule et définisse les modèles ARMA, présentant conjointement des propriétés autorégressives et de moyenne mobile.
Les travaux de Box–Jenkins, s’ils ont focalisé essentiellement sur des modèles univariés, ont en revanche préparé un rapprochement de l’économétrie et de l’analyse statistique à la suite de Sims qui proposa au début des années 1980 une nouvelle méthode de représentation des interactions entre variables prenant la forme d’une représentation autorégressive d’un vecteur de séries temporelles interdépendantes ( i.e. sans différenciation d’endogènes et d’exogènes) : les VAR (pour Vector Auto-Regression) qui permettent, entre autres, d’observer la propagation de chocs dans l’économie (méthode dite de réponse à l’impulsion). Prenons par exemple le cas de deux variables x t et y t représentées par un VAR d’ordre 2 ( i.e. qui implique des retards des variables jusqu’à t – 2, ce qu’on note VAR(2)) et donné par : soit Ainsi un choc unitaire sur ε x,t se transmet-il dans l’économie suivant le schéma (on suppose que toutes les autres variables sont nulles pour dissocier l’impact spécifique de ce choc) : L’effet du choc sur ε x,t équivaut à une variation identique de x t et l’impulsion se résorbe et les variables retournent vers leur état initial, ainsi que le montre la figure 1.

...
Réponse d’un système de deux équations à une impulsion unitaire sur x t et sa propagation dans le système à mesure que l’horizon progresse

Réponse d’un système de deux équations à une impulsion unitaire sur x t et sa propagation dans le système à mesure que l’horizon progresse

Depuis les années 1980, de nombreuses méthodes ont été développées sur les fondements des processus VAR. Celles-ci comprennent entre autres le concept de cointégration selon lequel il existe des combinaisons linéaires de variables non-stationnaires qui forment de nouvelles variables stationnaires. Le but des sections suivantes est de montrer de manière simple comment ces méthodes économétriques permettent d’appréhender les problèmes qui se présentent au prévisionniste.

2 - Les modèles économétriques de prévision

2.1 - Un monde parfait

14 Notre but ici est d’analyser les échecs récurrents des prévisions et, de ce fait de tâcher de trouver des méthodes pour améliorer les modèles et les rendre robustes , i.e. insensibles à certains défauts. Les premiers modèles de prévision reposaient sur deux hypothèses fondamentales :

15 1. Le modèle utilisé constitue une représentation exacte de l’économie ;

16 2. La structure de l’économie a été stable et le restera,

17 qui fondent ce qu’on peut nommer une théorie de l’optimalité[ 5] [ 5] Voir Clements & Hendry (1998) et Makridakis & Hibon...
suite
. Prenons l’exemple simple d’un modèle autorégressif d’ordre 1, dit AR(1), où la valeur d’une variable y à l’instant t , y t , est fonction de sa valeur à la période précédente, y t- 1 , à laquelle s’ajoute une erreur imprévisible (qui suit une loi Normale d’espérance nulle et de variance) :

18  avec | α |<1 pour que y t soit stationnaire ( i.e. de moyenne et variance constante). Ceci fournit, pour h ≥ 1 : et, notant E [.| y t ] l’espérance mathématique, sachant y t , il peut sembler naturel d’utiliser comme prévision de y t+h générée à l’instant t la valeur ŷ t+h|t donnée par : La propriété essentielle de l’espérance (conditionnelle) est qu’elle est — selon les hypothèses 1 et 2 ci-dessus — parmi les prévisions ŷ t+h | t de y t+h à l’instant t , celle qui minimise le critère de moyenne quadratique d’erreur de prévision, défini par : En effet pour toute autre prévision t+h | t : et le deuxième terme de cette équation est positif (et nul si et seulement si ŷ t+h | t= t+h | t ). Dans un tel contexte, le modèle le plus « exact » (ici, dont les paramètres estimés sont les plus précis) fournira les meilleures prévisions. Par extension, selon la théorie de l’optimalité, le modèle qui reflète le mieux les propriétés des variables dans l’échantillon de données dont on dispose fournira les prévisions les plus justes. Par ailleurs, quand on connaît la manière dont sont générées les données, les seules informations qui puissent permettre d’améliorer la précision sont celles concernant des faits à venir (tels que des changements de politique économique, de taux d’intérêts…).
La justesse des prévisions est aussi, dans ce cas, fonction décroissante de l’horizon h car la somme des chocs futurs (les ε t+h ) augmente la variance de l’erreur de prévision (qui converge vers une valeur limite si y t est stationnaire). Enfin, il est possible de quantifier l’erreur de prévision car MQEP h=1=Var[ ε t ]= σ 2 ε . Le prévisionniste serait donc à même de fournir un intervalle de confiance sûr autour de son hypothèse centrale : dans le cadre d’innovations ε t suivant une loi Normale, un intervalle de confiance à 95 % autour de la prévision s’écrit : où dans le cadre du modèle AR(1),  et donc est bornée (et ceci est toujours le cas lors de la prévision de variables stationnaires) puisque : Le graphique 2 présente une simulation de prévision sur la base du modèle AR(1) ci-dessus, estimé pour 80 observations : la MQEP h permet d’établir l’incertitude autour de la prévision et on constate que sur cet exemple, y 90 sort de l’intervalle de confiance à 95 %.

...
Donnée simulée y t suivant un AR et sa prévision ŷ t à partir de la 80 e observation. Les bandes autour de la prévision indiquent des incertitudes croissantes de 5 % en 5 %

Donnée simulée y t suivant un AR et sa prévision ŷ t à partir de la 80 e observation. Les bandes autour de la prévision indiquent des incertitudes croissantes de 5 % en 5 %

19 Malheureusement, ces hypothèses ne sont pas vérifiées généralement. Il est possible de fournir de multiples contre-exemples pour chacune des propriétés présentées ci-dessus. C’est pour cette raison que de nouvelles théories se sont révélées nécessaires et ont vu le jour au cours des années 1990.

2.2 - Un cadre pour la prévision

20 Six points sont à prendre en compte dans l’élaboration d’un modèle :

  1. la nature du processus probabiliste qui génère les données (noté PGD),
  2. le niveau de connaissance à son sujet,
  3. la dimension du système,
  4. la forme d’analyse,
  5. l’horizon de prévision et
  6. la complexité mathématique du système.

Ainsi, le PGD peut il être stationnaire, ou alors peut être ramené à un processus stationnaire (par exemple en utilisant des relations de co-intégration), ou enfin non-stationnaire et sujet à évolutions (comme lorsque les paramètres changent, ou s’il passe par divers régimes…). On peut par ailleurs le connaître de manière sûre (et se retrouver dans le cadre présenté plus haut de la théorie de l’optimalité), ou n’avoir qu’à estimer ses paramètres car on connaît sa forme générale, ou enfin ignorer à la fois la forme et les paramètres du PGD. Le système peut être univarié (scalaire), ou peut constituer un processus vectoriel estimable ou non (auquel cas des hypothèses d’identification sont nécessaires a priori ). Il peut s’agir d’une analyse sur des propriétés asymptotiques (à partir de très grands échantillons) ou, au contraire, se fondant sur une étude d’échantillons de taille finie et en faisant, le cas échéant, appel à des simulations. Il est possible qu’on ne s’intéresse qu’à la prochaine valeur ou à un horizon de prévision s’étendant sur plusieurs périodes. Et enfin, le système étudié peut être linéaire ou non.

21 Toutes ces hypothèses ont leur importance car les sources d’erreurs résultant du modèle en dépendent ; par ailleurs, la méthode de prévision doit être définie pour pouvoir traiter ces problèmes. Ainsi, au vu des avancées récentes en économie et économétrie, on doit naturellement se placer dans le cadre d’un PGD vectoriel non-stationnaire inconnu mais estimable, soumis à des modifications non anticipables. On suppose cependant qu’il est possible de se ramener à un modèle linéaire, même si on ne dispose que d’un échantillon de taille réduite et qu’on s’intéresse à des prévisions à divers horizons. Ce type de PGD est un des plus généraux pour lesquels il est possible d’établir une analyse en matière de prévision. Dans la section 6, on s’intéressera à un modélisation des importations françaises de biens et services : il s’agit d’une représentation de leur taux de croissance issue d’un modèle plus complexe prenant en compte l’ensemble des interactions ; ici la croissance des importations est fonction des variations récentes de variables exogènes et d’un déséquilibre à la période précédente entre la demande intérieure, les goulets d’étranglement et une tendance déterministe représentant l’ouverture croissante de l’économie française.

3 - Limitations des modèles

22 Pour comprendre les difficultés rencontrées par les modèles économétriques lorsqu’ils sont appliqués à la prévision, il est utile de décomposer les sources principales d’erreurs selon leur origine afin d’en établir une taxinomie et, ensuite, de les hiérarchiser. Il nous faut, dans ce but, spécifier un processus probabiliste ayant généré les données et un modèle de celui-ci — a priori distinct — utilisé en prévision. En macroéconomie, le consensus des vingt dernières années s’est établi autour de données intégrées générées par un système co-intégré et dont les coefficients sont soumis à des variations irrégulières. Le modèle de prévision est souvent formulé en fonction de notions (d’ a priori ) théoriques et il est très certainement empreint d’erreurs de spécification qui peuvent aussi entraîner une mauvaise estimation des paramètres à partir de données potentiellement erronées. Afin d’établir un cadre d’analyse clair, on suppose que le modèle comprend trois composantes : des termes déterministes (des constantes et des tendances linéaires du type α + βt ) dont les valeurs futures sont connues ; des variables stochastiques observées (celles que le modèle tente de caractériser) dont les valeurs futures sont inconnues, et des variables non observées et dont les valeurs passées, présentes et à venir sont inconnues (elles représentent les erreurs du modèle et sont mesurées comme résidus de l’estimation). Chacun de ces éléments est en principe susceptible d’être mal mesuré, mal spécifié, incorrectement estimé, ou de changer de manière non anticipée. On fait ici l’hypothèse qu’on a reformulé le modèle de façon à lui donner une représentation stationnaire (par exemple via un modèle vectoriel de correction d’équilibre). Pour simplifier la présentation, seul un processus de premier ordre est considéré. On suppose par conséquent que le vecteur (de dimension n ) de données y t est généré par :

23  où IN[0,Ω ε ] indique une distribution Gaussienne multivariée d’espérance nulle (E[ ε t ]=0) et de matrice de variance-covariance (Var[ ε t ]) égale à Ω t  ; les éléments ε t et ε t’ à des dates différentes étant indépendants. On suppose, dans ce cadre, que la distribution probabiliste des variables y t est stable dans le temps, et que, par conséquent, les paramètres φ et Π sont constants ; par ailleurs, afin d’établir la stationarité de y t (ou en d’autres termes son caractère non intégré, noté I (0)) les valeurs propres de Π sont toutes de module inférieur à 1. L’espérance de y t est dans ce cas donnée par φ= (E[ y t ]=E[ y t- 1 ]), et ainsi soit φ= (I n – Π) -1 φ . Ceci nous permet de reformuler (2) sous la forme À partir d’un échantillon de données de taille T , { y t t= 1, …, T }, et avec la notation ^ pour les estimateurs et prévisions, il est possible, connaissant la forme du PGD donnée par (2) d’obtenir une prévision ŷ T+h | T de y T+h h= 1, …, H. Celle-ci est obtenue en considérant que les valeurs futures de ε t ( i.e. les ε T+s pour s ≥1) sont en moyenne nulles. En posant : ŷ T+h | T est fourni par un modèle autorégressif vectoriel VAR(1) similaire à celui de l’équation (1) qui relie les variables représentées par le vecteur y t à leur passé : ce qui mène à où les données connues et utilisées lors de la prévision, ŷ T , sont susceptibles de révisions (il existe potentiellement des erreurs de mesure). Ainsi, ŷ T y T a priori mais, si on suppose que les révisions sont nulles en moyenne, E[ ŷ t ]= y t . La prévision correspond donc à la somme de la moyenne  et de l’écart vis-à-vis de celle-ci de la valeur estimée de ŷ T à l’origine de la prévision, à un facteur  près.
En utilisant (3), on ne présuppose pas que le modélisateur connaisse la forme du PGD : il se peut que  pour Π h , car la différence entre les deux est fonction croissante de l’horizon
. Il peut donc être plus judicieux de s’intéresser directement à la relation entre y t+h et y t en estimant sur l’échantillon :  ainsi obtenu permet d’établir une prévision : Ici, le modèle de prévision est formulé de manière à minimiser l’erreur intra-échantillon correspondante. En théorie cette dernière méthode est asymptotiquement optimale ( i.e. pour de grands échantillons). En pra-tique, elle permet souvent de capturer des effets de mémoire longue absents des modèles à court horizon : utilisée via un glissement (annuel par exemple sur données trimestrielles), Δ 4 y t= y t y t- 4 , elle permet de s’extraire de la difficulté des périodicités infra-annuelles de type saisonnier.

4.5 - Données inexactes

35 Lorsque les données sont inexactes, ce qui est toujours le cas pour les variables macroéconomiques vers la partie la plus récente de l’échantillon, l’erreur initiale est transmise à toutes les prévisions alors même que le modèle peut-être adéquat. Il convient donc d’élaborer des méthodes qui permettent de discerner si une anomalie correspond à un choc entraînant une mauvaise spécification du modèle ou si elle résulte simplement d’un problème de mesure des données. Dans le cadre des méthodes précédentes, l’observation d’un fort résidu dans la modélisation de ŷ T est-elle due à une donnée inexacte ou cache-t-elle un choc φ φ * ?

36 Les révisions de données étant souvent très importantes, l’usage d’enquêtes et de sondages s’avère souvent profitable à l’analyse des données les plus récentes. De nombreuses méthodes ad hoc existent pour prendre en compte cet aspect. Parmi celles-ci, le prévisionniste choisit parfois de procéder à une correction du modèle semblable à celle présentée précédemment, mais qui prend la forme d’un lissage des erreurs récentes de prévision, ou une moyenne de ces dernières. Les méthodes utilisées pour un choc peuvent aussi être utilisées dans ce cadre. Mais le jugement du prévisionniste demeure ici essentiel.

4.6 - Combiner les prévisions

37 Nombreux sont les organismes qui établissent des prévisions, et celles-ci sont souvent divergentes. L’expérience a montré qu’en général, la moyenne[ 8] [ 8] Moyenne simple, pondérée, voire analyse en composante...
suite
des prévisions s’avère rétrospectivement plus précise que la plupart de celles-ci, prises individuellement. Il existe d’ailleurs une publication dédiée à cette tâche : Consensus Forecast . La cause en est intuitivement simple : les prévisions sont très probablement proches de la réalité, mais quand certaines pèchent par optimisme d’autres sont coupables de pessimisme. Ainsi les particularités s’effaceraient-elles quand on les additionne. Il a été plus difficile d’expliquer ceci de manière économétrique. En effet, il apparaît difficile de prouver que la moyenne puisse être plus précise que le meilleur des éléments, et ce d’autant plus que, lors d’un choc, la plus forte probabilité est que toutes les prévisions soient biaisées dans la même direction. Pourtant, lorsque chaque modèle n’utilise qu’une fraction de l’information utile, un même choc peut avoir des conséquences opposées sur les prévisions, justifiant de ce fait l’utilisation de leur moyenne.

5 - Évaluer les prévisions

38 Comment, entre plusieurs prévisions, choisir la bonne ? Cela dépend du critère retenu. On peut supposer par exemple que l’erreur de prévision ê T +1 | T , soit nulle en moyenne ; ceci implique en pratique qu’au fil du temps les anticipations seront également sur- et sous-estimées, ce qui s’écrit, en utilisant l’espérance mathématique[ 9] [ 9] On suppose pour faciliter la présentation que le modèle...
suite
 :

39  Un critère d’évaluation qui privilégierait la minimisation de  mettrait ainsi l’accent sur la précision de la prévision . Si on estime, en revanche, qu’il n’est pas important d’obtenir un chiffrage parfait, mais qu’il est essentiel de ne jamais trop se tromper et qu’on souhaite par conséquent pouvoir déterminer un faible intervalle de confiance autour de la prévision, on peut dans ce cas s’astreindre à minimiser la variance :

40 En général, en faisant l’hypothèse que l’erreur ê T + 1| T suit une distribution Normale, y T+ 1 est compris dans 95 % des cas dans l’intervalle :

41  Minimiser  revient donc à privilégier la certitude (théorique) de ŷ T+ 1| T . En pratique, cependant,  , et donc le prévisionniste doit atteindre un équilibre entre précision et certitude. Les travaux théoriques ont tendance à se référer à la moyenne quadratique d’erreur de prévision : qui attribue de l’importance aux deux critères. Pour clarifier la différence entre les critères, reprenons l’exemple d’un choc φ →| φ * à l’instant T dans l’équation (2). Avec les mêmes notations que précédemment (on néglige les erreurs dues à l’estimation des paramètres dans la formule (5)), les prévisions ŷ T+ 1| T et ŷ T+ 2| T+ 1 (si on ignore qu’un choc est survenu) génèrent des erreurs de sorte que MQEP  .
En revanche, s’intéresser à la différence Δ y t=πΔ y t 1 + Δε t fournirait une erreur de prévision  mais  et  ce qui donne une MQPE supérieure à celle du modèle en niveau pour T+1 mais au prix d’une réduction pour les horizons suivants : La prévision de y T+ 1 est ici moins précise, mais plus certaine que celle de Δ y T+ 1 (espérance plus élevée, moindre variance). Selon les valeurs des paramètres et les priorités du prévisionniste l’une ou l’autre méthode serait à privilégier : la prévision en différence se révèle préférable selon ce critère et dans ce cadre pourvu que | φ * - φ | > σ ε . De manière générale, lorsqu’on modifie un modèle pour affiner la précision de la prévision, ceci se fait au détriment de la certitude l’entourant. Il est, par conséquent, essentiel de toujours préciser dans quel but, pour quelle utilité, une prévision est réalisée car selon le type de jugement qui lui est appliqué — il en va des critères comme des Pyrénées — elle peut très facilement se trouver vérité en deçà, erreur au-delà.

6 - Illustration par la prévision des importations

42 Afin d’observer comment s’appliquent les méthodes présentées, nous nous intéressons ici à un modèle de croissance des importations françaises de biens et services, issu du le modèle de l’économie française de l’OFCE (emod.fr, voir Chauvin et al , 2002). Il s’agit d’un mécanisme à correction d’équilibre selon lequel s’établit un équilibre de long terme entre les importations de biens et services en volume ( M t ), la demande intérieure ( D t ), le prix relatif des importations (hors pétrole) vis-à-vis du prix de la valeur ajoutée française ( P M t / P VA t ) et la durée d’utilisation des équipements dans l’industrie ( DUE t , représentant les tensions sur la capacité productive de l’économie)[ 10] [ 10] Données INSEE sauf Banque de France pour la durée d’utilisation...
suite
. En notant en lettres minuscules les logarithmes des variables, cet équilibre, (estimé de 1983(2) à 1999(4), selon une méthode à une étape, voir Banerjee et alii , 1993) est représenté par la relation de cointégration :

43 L’élasticité des importations à leur prix relatif est nettement plus faible que celle retenue dans le modèle emod (0.6), et nous ne prenons pas en compte ici l’écart entre la DUE domestique et celle de nos fournisseurs — supposant que les importateurs peuver librement changer l’origine de leur approvisionnement — mais nous conservons cette expression simple car nous nous intéressons surtout à la comparaison entre les diverses techniques d’ajustement. L’équation d’importations régit leur taux de croissance (Δ m t= m t m t- 1 ) en fonction de ceux des variables mentionnées précédemment et du déséquilibre c t- 1 selon (erreurs standards entre parenthèses, p -valeurs entre crochets) :

44  Le modèle (10) n’est pas rejeté par les tests de spécification (normalité et absence d’autocorrélation des résidus), est stable sur la période d’estimation, et représente bien les variations des importations dans l’échantillon (voir figure 6). En revanche, si les fluctuations du taux de croissance sont effectivement prévues à partir de 2000 ( ), leurs niveau et amplitude présentent des erreurs. Afin d’observer comment améliorer les prévisions en pratique, nous allons tour à tour utiliser des ajustements différents de (10), notée MCE. La méthode la plus simple vise à s’abstraire des problèmes de dynamique et à poser  obtenue par (10) de l’erreur de prévision observée à la période précédente : Cette technique pourrait aussi être utilisée sous de multiples formes : soit une correction sur la base d’un modèle de prévision en niveau ( ) — mais alors il s’agirait de le comparer à d’autres ciblant la même variable — ou alors en corrigeant d’une moyenne mobile des erreurs de prévision récentes.
Sinon, comme nous avons vu que les modèles à correction d’erreur peuvent présenter des faiblesses si le niveau de l’équilibre de long terme se modifie, nous recourrons à un modèle n’utilisant que la dynamique de court terme (modèle CT e ) :

...
Estimation et prévision (2000-2004) du taux de croissance des importations françaises

Estimation et prévision (2000-2004) du taux de croissance des importations françaises

45 Enfin deux modèles purement statistiques peuvent se révéler utiles, soit un processus autorégressif d’ordre 1, AR(1) estimé avant 2000 et qui ne représente pas très bien les variations :

46  ou un modèle ARMA plus général : par estimation on aboutit au modèle ARMA (2,3) Ces deux modèles fournissent respectivement  et  . Les prévisions du taux de croissance des importations obtenues par ces différents modèles sont présentées figure 7 où à partir de 2000 sont reportés le taux de croissance effective, la prévision ainsi que les bornes d’un intervalle de confiance à 95 % (en pointillés). Les modèles DV et AR présentant des erreurs standards très élevées, nous avons également placé deux graphiques sans intervalles de confiance. Le modèle CT existe sous deux formes : l’une où les coefficients sont repris de l’équation (10), notée CT, et l’autre en utilisant (11), notée CT e . Deux éléments semblent importants : (i) les modèles « économétriques » perçoivent mieux les retournements et pics de la série et les corrections IC et CT, CT e ont l’avantage sur MCE de ne pas s’éloigner durablement des valeurs à prévoir — ils sont d’ailleurs plus souvent de même signe que Δ m t  ; (ii) les méthodes « statistiques », AR, ARMA et DV, s’auto-corrigent rapidement mais peuvent générer de fortes erreurs ( cf. 2001(1) et 2002(1) pour DV) et peuvent présenter une très forte incertitude.
Il est difficile de hiérarchiser les techniques de prévision à la seule vue de la figure 7. Nous nous intéressons donc à des critères d’évaluation et reportons ci-dessous les MQEP et MAEP (Moyenne absolue d’erreur de prévision,  ). Comme la fonction de distribution des erreurs n’est pas connue (car elle impliquerait de connaître le véritable mécanisme ayant généré Δ m t ), nous utilisons comme approximation de l’espérance, la moyenne des erreurs entre 2000(1) et 2004(4), soit 20 observations :

...
Prévision (2000-2004) du taux de croissance des importations françaises

Prévision (2000-2004) du taux de croissance des importations françaises


En % CT IC CTe AR ARMA DV MCE MQEP 1.43 1.58 1.59 1.61 1.69 1.77 2.31 MAEP 1.05 1.21 1.15 1.40 1.32 1.28 1.94

47 La méthode la plus précise, au sens de la MQEP, est ici de loin CT e , la technique utilisant les variations de court terme, suivie par IC qui utilise le modèle complet mais corrigé de son erreur récente. Les modèles autorégressifs se situent assez bien eux aussi pour des méthodes qui n’utilisent que le passé récent de la série sans aucun apport de théorie économique. La méthode DV est meilleure en prenant en compte la moyenne absolue car il lui arrive de générer de très fortes erreurs, ce que la moyenne quadratique pénalise fortement. Enfin, le mécanisme à correction d’erreur — le modèle économique — s’avère le moins précis dans cet exercice car il sous-estime de manière permanente le taux de croissance des importations ; les techniques alternatives présentées améliorent effectivement la qualité de la prévision, jusqu’à diviser l’erreur par deux en moyenne : environ 1 point de pourcentage d’amélioration pour CT e  !

48 Quelle méthode choisir parmi celles présentées ci-dessus ? Si le modèle MCE est le meilleur sur l’échantillon, pourquoi ne pas le choisir pour la prévision ? Il n’existe malheureusement pas de réponse générale et le prévisionniste doit se faire son propre jugement ; celui-ci dépend du critère d’évaluation retenu : est-ce principalement le signe ou la valeur de la prévision qui compte, sont-ce les changement d’orientation qui importent, est-il préférable de toujours sur-(ou sous-)évaluer ; le modélisateur se doit de bien choisir sa méthode d’évaluation. Ensuite, il faut s’interroger sur le modèle économique retenu : est-il réellement valable ? Des modèles dont les variables sont sélectionnées uniquement sur la base de leur R 2 dans l’échantillon d’estimation peuvent présenter de forts défauts théoriques qui ne les rendent pas capables de bonnes prévisions. Par ailleurs, l’équation choisie est-elle vraiment stable sur l’échantillon d’estimation ? Une analyse récursive des coefficients est essentielle car comment envisager qu’un modèle dont la pertinence fluctue puisse se maintenir à l’avenir ? Ainsi le modèle MCE est-il le meilleur sur l’échantillon, mais si on l’estimait jusqu’en 1995, se révélerait-il capable de bien prévoir entre 1996 et 2000 ? En l’absence d’une solution réellement économiquement et économétriquement satisfaisante, il peut se révéler plus utile d’utiliser des méthodes statistiques dont les propriétés prévisionnelles sont relativement bien établies. Enfin, puisque de nombreuses corrections permettent d’améliorer la précision, si le prévisionniste n’a pas d’avis a priori sur les types de chocs auquel son modèle risque d’être confronté, il peut se révéler judicieux d’utiliser une moyenne de différentes techniques, ou des scénarios selon les hypothèses envisagées, ou enfin grâce à une analyse comme celle présentée dans la taxinomie du tableau 1, de modifier le modèle de façon à le parer contre les erreurs de spécifications ayant les effets les plus pernicieux pour la prévision.

7 - Conclusion

49 Il est surprenant de remarquer le retard que l’analyse de la prévision a sur les autres domaines économiques et économétriques. Ceci tient évidemment à son objet même : l’avenir. Il est pourtant réconfortant de constater comment les développements se nourrissent les uns les autres. En effet, s’il n’est pas pensable que les échecs récurrents en matière de prévision disparaissent complètement, il est clair – on l’espère du moins après lecture de cet article – que la compréhension de ceux-ci progresse et qu’il est possible, de ce fait, d’envisager de les réduire à l’avenir. Ainsi, si une bonne modélisation des comportements économiques est essentielle, ce n’est pourtant pas un gage de bonne prévision car l’échec provient de la modification de ceux-ci. Il n’y a plus de prévisions optimales quand le monde change. En revanche, une bonne compréhension des phénomènes entraînant des altérations dans un modèle permet d’essayer de les pallier, même sans avoir connaissance de leur apparition. On aboutit ainsi à des prévisions robustes . Dans les exemples présentés ici, il est apparu que les chocs sont difficiles à prendre en compte ex ante , mais qu’il est du moins possible de développer des méthodes (modélisation du taux de croissance, correction…) qui permettent de limiter l’incidence du choc sur les prévisions ultérieures ou qui fournissent des prévisions ni très précises ni très erronées (les méthodes DV et DDV), apportant de ce fait une réponse différente au problème des chocs. De tels modèles qui peuvent paraître absurdes peuvent se révéler utiles dans des contextes particulier, par exemple lors d’une crise importante entraînant des comportements transitoirement aberrants, ou pour des variables erratiques pour lesquelles il n’est pas possible de trouver de modèles satisfaisant : pourquoi un modèle économique que l’on sait théoriquement ou empiriquement imparfait se révélerait-il préférable ? Enfin, si l’analyse des erreurs de prévision n’apporte pas encore de solution idéale, il demeure intéressant de comprendre l’origine de leur émergence dans les chroniques historiques afin d’améliorer les techniques à l’avenir, ne serait-ce qu’en formalisant la compréhension de méthodes ad hoc couramment employées. Ainsi serons-nous capables d’anticiper, peut-être non pas les chocs à venir, mais de savoir quels sont ceux qui pourraient arriver et comment ils affecteront les prévisions ; la taxinomie présentée tableau 1 fournit un exemple d’analyse permettant de déterminer quels sont, pour un modèle donné, les chocs les plus importants à parer, ceux dont l’impact se révélera le plus fort.

50 La conclusion de notre analyse ne peut se formuler qu’en une incitation à formaliser le processus de prévision afin de pouvoir anticiper son échec, quantifier son inexactitude, faciliter sa reproduction, et progresser dans sa compréhension.

Bibliographie

Références bibliographiques

Banerjee A., J. Dolado , J. Galbraith et D. Hendry , 1993 : Co-Integration, Error-Correction, and the Econometric Analysis of Non-stationary Data , Oxford et NewYork : Oxford University Press.

Box G. E. P. et G. M. Jenkins, 1976 : Time Series Analysis, Forecasting and Control , (2 e ed.), San Francisco, CA : Holden-Day. Première parution, 1970.

Chauvin V., G. Dupont , E. Heyer et X. Timbeau , 2002 : « Le modèle France de l’OFCE », Revue de l’OFCE n° 81, pp. 245-300.

Chevillon G. et D. F. Hendry, 2005 : « Non-parametric direct multi-step estimation for forecasting economic processes », International Journal of Forecasting 21 , pp. 201-18.

Clements M. P. et D. F. Hendry, 1998 : Forecasting Economic Time Series , Cambridge : Cambridge University Press.

Clements M. P. et D. F. Hendry, 1999 : Forecasting Non-Stationary Economic Time Series , Cambridge, MA : The MIT Press.

Clements M. P. et D. F. Hendry(eds.), 2002 : A Companion to Economic Forecasting , Oxford : Blackwell Publishers.

Clements M. P et D. F. Hendry, 2004 : « Pooling of forecasts », Econometrics Journal 7 , pp. 1-31.

Diebold F. X., 1998 : « The past, present and future of macroeconomic forecasting », Journal of Economic Perspectives 12 , pp. 172-195.

Hendry D. F., 2000 : « On detectable and non-detectable structural change », Structural Change and Economic Dynamics 11 , pp. 45-65.

Hendry D. F., 2004 : « Robustifying forecasts from equilibrium-correction models », Economic Working Paper 2004-w14 , Nuffield College.

Hendry D. F. et J. A. Doornik, 1997 : « The implications for econometric modelling of forecast failure », Scottish Journal of Political Economy 44 , pp. 437-461, Special Issue.

Johnston H. N., L. Klein et K. Shinjo , 1974 : « Estimation and prediction in dynamic econometric models », in W. Sellekaerts (ed.), Essays in honor of Jan Tinbergen , London : Macmillan.

Lemoine M. et F. Pelgrin, 2003 : « Introduction aux modèles espace-état et au filtre de Kalman », Revue de l’OFCE n° 86, pp. 223-229.

Lucas R. E., 1976 : « Econometric policy evaluation: A critic », in K. Brunner et A. Meltzer (eds.), The Phillips Curve and Labor Market , pp. 19-46, Amsterdam : North-Holland.

Makridakis S. et M. Hibon, 2000 : « The M3 competition: Results, conclusions and implications », Working paper , INSEAD.

Schumpeter, J., 1933 : « The common sense of econometrics », Econometrica 1(1) , pp. 5-12.

Sims C. A., 1980 : « Macroeconomics and reality », Econometrica 48(1) , pp. 1-48.

Stock J. H. et M. W. Watson, 1999 : « A comparison of linear and non linear univariate models for forecasting macroeconomic time-series », in R. F. Engle et H. White (eds.), Cointegration, Causality and Forecasting : A Festschrift in honour of Clive W. J. Granger , pp. 1-44, Oxford : Oxford University Press.

Wallis K. F., 1993 : « Comparing macroeconometric models : A review article », Economica 60 , pp. 225-237.

Wold H. O. A., 1938 : A study in the analysis of stationary time series , Stockolm : Almqvist and Wicksell.

 

Notes

[ *] Je remercie David Hendry et Xavier Timbeau pour leurs remarques et suggestions.
guillaume.chevillon@ofce.sciences-po.frRetour

[ 1] L’exposition historique doit en grande part à l’article de F. X. Diebold (1998) auquel on renvoie vivement le lecteur.Retour

[ 2] À l’origine, les deux branches de l’économie théorique et de l’économétrie ne s’étaient pas encore divisées.Retour

[ 3] La stationnarité au sens faible de y t nécessite que l’espérance mathématique et la variance de y t soient indépendantes de la date t .Retour

[ 4] Pour une présentation des modèles espaces-états et du filtre de Kalman, voir Lemoine et Pelgrin (2003).Retour

[ 5] Voir Clements & Hendry (1998) et Makridakis & Hibon (2000).Retour

[ 6] Pour les définitions, voir Clements et Hendry (1998).Retour

[ 7] En pratique, et ainsi que constaté sur la figure 3, en présence d’un tel choc, les Δ y t sont légèrement modifiés autour de T car Δ y T+ 1 intervient dans l’expression régissant Δ y T+ 2 .Retour

[ 8] Moyenne simple, pondérée, voire analyse en composante principale (voir Stock et Watson, 1999).Retour

[ 9] On suppose pour faciliter la présentation que le modèle est univarié.Retour

[ 10] Données INSEE sauf Banque de France pour la durée d’utilisation des équipements.Retour

Résumé

Cet article présente des résultats récents de l’approche économétrique de la prévision économique. Il s’agit, ici, de déterminer ce qu’on nomme une « bonne » prévision. Nous suggérons une taxinomie des erreurs de prévision afin de comprendre comment obtenir des prédictions robustes vis-à-vis des sources d’erreur les plus pernicieuses : les chocs déterministes affectant la manière dont sont générées les variables. À l’aide des concepts d’exactitude, de précision et de certitude dans le cadre des modèles de prévision, nous montrons que le critère d’évaluation de leur qualité est un élément essentiel qu’on ne peut séparer de la construction du modèle. Une application à la prévision des importations françaises de biens et services illustre notre propos.



This article presents recent results regarding the econometric approach to economic forecasting. We aim to establish here what constitutes a "good" forecast. A forecast taxonomy helps understand how to obtain forecasts that prove robust to the most detrimental source of error: structural breaks that affect the data generating process. The concepts of accuracy, precision and certainty applied to forecast models show that evaluation criteria are paramount in the model design stage. An empirical application to forecasting French imports of goods and services provides an illustration.
JEL codes : E3, E5, G18, G21.

PLAN DE L'ARTICLE

Article précédent Page 327-356

POUR CITER CET ARTICLE

Guillaume Chevillon « Analyse économétrique et compréhension des erreurs de prévision », Revue de l'OFCE 4/2005 (no95), p. 327-356.
URL :
www.cairn.info/revue-de-l-ofce-2005-4-page-327.htm.
DOI : 10.3917/reof.095.0327.