2005
Revue de l’OFCE
Analyse économétrique et compréhension des erreurs de prévision
Guillaume Chevillon
[*]
Département analyse et prévision de l’OFCE
Cet article présente des résultats récents de l’approche économétrique de la prévision économique. Il s’agit, ici, de déterminer ce qu’on nomme une « bonne » prévision. Nous suggérons une taxinomie des erreurs de prévision afin de comprendre comment obtenir des prédictions robustes vis-à-vis des sources d’erreur les plus pernicieuses : les chocs déterministes affectant la manière dont sont générées les variables. À l’aide des concepts d’exactitude, de précision et de certitude dans le cadre des modèles de prévision, nous montrons que le critère d’évaluation de leur qualité est un élément essentiel qu’on ne peut séparer de la construction du modèle. Une application à la prévision des importations françaises de biens et services illustre notre propos.
This article presents recent results regarding the econometric approach to economic forecasting. We aim to establish here what constitutes a "good" forecast. A forecast taxonomy helps understand how to obtain forecasts that prove robust to the most detrimental source of error: structural breaks that affect the data generating process. The concepts of accuracy, precision and certainty applied to forecast models show that evaluation criteria are paramount in the model design stage. An empirical application to forecasting French imports of goods and services provides an illustration.
JEL codes
: E3, E5, G18, G21.
Prévoir, c’est porter un jugement sur les événements ou évolutions possibles à venir en utilisant comme outils le passé et le présent. Pour réussir une telle entreprise, quatre conditions sont à remplir : (1) une certaine régularité dans le fonctionnement du monde est tout d’abord nécessaire, (2) il faut par ailleurs que cette régularité fournisse une information sur l’avenir, (3) que la méthode choisie pour établir la prévision capture une part de cette régularité et (4) enfin qu’elle exclue au maximum le « bruit » ou les irrégularités passés. Les deux premières conditions sont constitutives du système économique, les deux dernières sont fonctions de la méthode de prévision ou de la théorie économique choisies. Il en résulte que les prévisions sont toujours entachées d’erreur et qu’il est possible d’en établir plusieurs pour un même événement à venir (qui constitue l’
objet
de la prévision). Des outils d’analyse doivent donc être développés afin de comparer et de hiérarchiser les prévisions pour discerner ce qui fait qu’on puisse, ou non, en qualifier certaines de « bonnes ».
La
qualité
d’une prévision est définie par le critère d’évaluation considéré. Ainsi, si on s’intéresse à l’inflation en France en 2006, il est probable que le prévisionniste soit indifférent entre une erreur de + 0,1 % et de – 0,1 %,
i.e.
symétrique autour de l’hypothèse centrale. En revanche le sismologue qui s’attache à déterminer la date de la prochaine éruption de l’Etna accordera une valeur nettement (infiniment ?) plus grande à une prévision en deçà de la date d’éruption ! Il apparaît clair que, dans ces deux contextes, les méthodes choisies se ressentiront des critères retenus pour leur évaluation.
De manière générale, trois qualités sont recherchées : l’
exactitude
, la
précision
et la
certitude
, et on privilégiera l’une ou l’autre selon les cas. Pour bien comprendre leur différence, si nous supposons que nous disposions en 2005 de deux prévisions de l’inflation en France en 2006 : une à 1,95 ± 0,45 % et l’autre à 2,0 ± 0,2 %. Laquelle préférer ? La première est davantage
précise
dans son énoncé, au centième de point de pourcentage près contre un dixième pour la seconde. En revanche, cette dernière est nettement plus
certaine
, car l’intervalle de confiance lui correspondant est assez étroit (en tout 0,4 %) contre une incertitude de 0,90 % dans le premier cas. Enfin, si on découvre, fin 2006, que l’inflation se monte à 1,9 %, la première prévision est finalement plus proche — dans son scénario central — de la réalisation. Mais laquelle peut être dite la plus exacte ? Ceci dépend du critère considéré — et donc de l’utilisation faite de cette prévision. Et encore ! Que dire des deux déclarations « l’inflation se portera à 12,314 % en 2006 » et « l’inflation sera d’environ 2 % ». La première est très précise,
i.e.
présentant un fort degré de détail dans son assertion, et certaine (car elle n’autorise, de manière péremptoire, aucune marge d’erreur autour du scénario central), mais très éloignée de la vérité, l’autre est moins précise et certaine, mais plus proche de la réalisation. Toutes ces déclarations peuvent pourtant être qualifiées d’inexactes ! Pour mesurer et hiérarchiser l’exactitude, les économistes utilisent souvent le critère de moyenne quadratique d’erreur de prévision (MQEP, voir définition plus bas) qui combine l’écart à la réalisation (la moyenne d’erreur de prévision) et l’incertitude entourant le scénario central (la variance de l’erreur).
Ces quelques réflexions nous amènent à nous demander comment quantifier
a priori
l’exactitude d’une prévision. Pour ce faire, des informations sont nécessaires : comment est-elle obtenue ? sous quelle hypothèses ? quelle incertitude envisage-t-elle ? quel est son but, son utilité ? Avec tous ces éléments, il est possible d’analyser une prévision, et c’est le propos de cet article de montrer comment les outils de l’économétrie permettent d’en établir et d’en contrôler les caractéristiques. Les méthodes de prévision ne sont malheureusement pas parfaites et n’ont pas vocation à devenir de purs exercices mathématiques sans contenu économique. En revanche l’utilisation de modèles simples nous permet d’analyser une partie des conséquences de notre ignorance quant à la manière dont fonctionne l’économie et aussi aux chocs qui peuvent l’affecter. Aujourd’hui, l’économétrie des séries temporelles permet essentiellement de comprendre pourquoi certaines méthodes de prévision couramment utilisées depuis des décennies présentent les propriétés qui les rendent populaires. Cette démarche s’inscrit dans un contexte de formalisation de la prévision là où les experts utilisaient auparavant leur capacité de jugement, pourtant encore nécessaire aujourd’hui ; il ne peut s’agir toutefois de s’affranchir de modèles structurels essentiels pour une vision complète de l’économie et pour leurs capacités à effectuer des variantes, mais d’utiliser des compléments ayant des propriétés contrôlables de robustesse aux chocs. Le modèle de l’OFCE qui sert de bases aux prévisions de l’économie françaises demeure par exemple un outil incontournable, mais certaines variables clefs peuvent faire l’objet d’une étude complémentaire.
Cet article s’organise comme suit : la première section présente un bref historique des méthodes utilisées en prévision économique afin de dégager ensuite, dans le cadre d’un modèle simple tiré des travaux de M. P. Clements et D. F. Hendry, les principaux apports de l’analyse économétrique. La section 3 montre toutefois les limites de la modélisation dans ce cadre, mais cette analyse permet également de comprendre comment pallier les problèmes de prévision, ce qu’aborde la section 4. Après nous être intéressés aux méthodes d’évaluation des prévisions dans la section 5, nous illustrons l’usage de ces méthodes par une application à la prévision des importations françaises.
1.
La prévision en économie
Pour comprendre les mérites propres des méthodes de prévision, il est essentiel d’en connaître les deux grandes classes, d’ailleurs non mutuellement exclusives : il existe d’une part des modèles purement
statistiques
sans représentation économique et d’autre part des modèles dits
structurels
dont l’ambition est de fournir une image du fonctionnement effectif de l’économie.
Mais afin de bien présenter l’état actuel de la recherche, il nous semble essentiel de rappeler brièvement les développements de la prévision économique au XX
e
siècle, car chaque grande vague d’avancées a rencontré des écueils qui ont permis d’améliorer la compréhension des limitations des diverses méthodes
[
1]
.
1.1.
Modèles structurels keynésiens
La complexité et l’interdépendance des systèmes économiques a longtemps été un frein puissant à toute tentative de prévision, ce qui fit que les premières ne virent le jour qu’après l’émergence de modèles macroéconomiques simples. Après la publication de la Théorie Générale de J. M. Keynes en 1936 et grâce à de notables avancées techniques de la Statistique, s’ensuivit un vif développement de l’activité économique de construction, d’estimation et d’analyse de modèles visant à représenter le comportement des agents macroéconomiques. Ce bouillonnement intellectuel amena à la création de l’
Econometric Society
et de sa publication prestigieuse, la
revue Econometrica
[
2]
, qui devint le médium naturel de diffusion des idées et avancées de la Commission Cowles à l’université de Chicago au cours des années 1940 et 1950. La facilité d’usage des systèmes d’équations à base de modèles IS-LM permit leur généralisation dans les cercles universitaires et gouvernementaux s’attachant à l’analyse et à la prévision des politiques économiques. Les méthodes d’estimation économétrique étant encore peu développées, les principaux débats portaient sur des calibrages des coefficients de réaction. Les besoins naissants de planification entraînèrent la généralisation de modèles
input-output
qui visaient à prévoir les tensions sur les capacités productives. L’augmentation de la quantité et de la qualité des données disponibles mena à une généralisation de modèles très détaillés de l’économie, comportant des centaines d’équations. Cette abondance d’information ne put empêcher un enlisement des macro-modèles (comme le fameux modèle Wharton conçu autour de Lawrence Klein) car ils subirent un cuisant échec dans les années 1970 alors que la stagflation apparaissait et que le chômage prenait son envol.
L’apparition de doutes quant au manque de fondements micro-économiques —
i.e.
représentant les préférences, comportements et anticipations des agents – aboutit à la remise en cause théorique des « systèmes d’équations ». La critique principale provint de Lucas (1976) qui remit en cause la stabilité des paramètres des modèles non « structurels ». Pour lui, il fallait rechercher les paramètres fondamentaux du comportement économique, ceux qui se révèlent stables. Cette approche tend à privilégier l’élaboration de modèles de faible taille, plus robustes aux chocs et changements de politique économique.
Par ailleurs, les capacités prévisionnelles des macro-modèles se virent bien souvent dépassées par de simples extrapolations statistiques. La macroéconomie purement keynésienne précéda de peu la prévision économétrique structurelle keynésienne dans sa perte de faveur. Une relative dissociation s’opéra entre les approches de modélisation (pour étudier la réaction de l’économique à une politique) et de prévision (où il s’agit d’obtenir la valeur future, assortie d’un intervalle d’incertitude, d’une ou plusieurs variables).
1.2.
Modèles statistiques
À la suite de la baisse d’intérêt pour l’utilisation de modèles théoriques en prévision, l’une des réponses fut une réorientation vers des méthodes alternatives plus empiriques. Un modèle non-structurel élabore des prévisions dites inconditionnelles,
i.e.
qui s’attachent à déterminer l’évolution de l’économie en supposant que les règles de gouvernance économique ne soient pas modifiées — contournant ainsi la critique de Lucas qui niait le pouvoir prévisionnel des modèles économiques en fondant son analyse sur leur manque de
robustesse
(de stabilité) vis-à-vis d’une intervention de politique économique — alors que les modèles structurels établissent des prévisions conditionnées aux décisions de politique économique. Cette propriété même, conjuguée à la faiblesse des modèles structurels et aux avancées importantes des techniques statistiques a entraîné un fort intérêt pour ces nouvelles méthodes de prévision.
En réalité, les développements techniques étaient pour bonne part déjà connus et utilisés par les économètres car ils dataient d’avant l’émergence de la théorie keynésienne ; la borne initiale fut plantée dans les années 1920 par Slutsky et Yule, lorsque ceux-ci constatèrent que des équations différentielles linéaires, gouvernées par des chocs aléatoires constituaient un cadre simple et puissant pour la représentation et la prévision des variables économiques et financières. Ces équations différentielles (discrètes) stochastiques, appelées autorégressives, permettent d’exprimer une variable à l’instant présent comme la somme pondérée de ses valeurs passées et d’un choc purement aléatoire. L’exemple le plus simple en est le modèle autorégressif d’ordre 1, noté AR(1) où la variable
y
à l’instant
t
,
y
t
, est donnée par :
où
ε
t
suit une loi aléatoire (en général Gaussienne) de moyenne nulle et où les propriétés de
y
t
dépendent de la valeur
α
. Les processus autorégressifs sont liés de manière proche à ceux dits de moyenne mobile, étudiés aussi par Slutsky et Yule, où, à présent,
y
t
est exprimé comme la somme pondérée de chocs présent et passés. Le cas non trivial le plus simple en est la moyenne mobile d’ordre 1 (MA(1) pour « moving average ») :
Les représentations AR et MA sont, pour ce qui est des variables stationnaires
[
3]
, les deux facettes d’une même dynamique et il est possible de passer de l’une à l’autre, mais au prix d’une perte d’efficacité dans l’estimation. Le très fort développement des modèles du type Slutsky-Yule doit son origine aux travaux, dans les années 1930, de H. Wold qui montra alors que — sous des hypothèses de stationnarité — toutes les séries temporelles peuvent être représentés comme modèles autorégressifs ou de moyenne mobile. Les algorithmes de prévision, d’estimation et de représentation de ces modèles furent développés dans les décennies 1940 et 1950, époque de forte avancée de l’économétrie, par Wiener, Kolmogorov et Kalman
[
4]
.
L’heure de la désillusion vis-à-vis des modèles keynésiens coïncida avec la publication par Box et Jenkins du livre référence en matière d’analyse et de prévision des séries temporelles. Une des idées phares de ces auteurs fut l’apport d’une nouvelle méthode pour représenter les tendances. À la place d’une fonction linéaire du temps, ils suggérèrent le concept de tendance stochastique qui est générée par la somme des chocs passés, conférant, de ce fait, à chacun d’entre eux un impact permanent. En termes de prévision, ceci implique une absence de retour à long terme vers une tendance précise, mais, au contraire, la présence à chaque instant d’une tendance locale fluctuante. Les variables présentant un comportement de tendance stochastique sont non-stationnaires et dites intégrées (on parle aussi de présence d’une racine unitaire). La contribution principale de Box et de Jenkins est, toutefois, l’élaboration d’un cadre opérationnel pour la prévision grâce à la clarification d’une méthode de formulation, d’estimation, d’évaluation d’un modèle et de prévision des séries qui reprennne les travaux de Slutsky-Yule et définisse les modèles ARMA, présentant conjointement des propriétés autorégressives et de moyenne mobile.
Les travaux de Box–Jenkins, s’ils ont focalisé essentiellement sur des modèles univariés, ont en revanche préparé un rapprochement de l’économétrie et de l’analyse statistique à la suite de Sims qui proposa au début des années 1980 une nouvelle méthode de représentation des interactions entre variables prenant la forme d’une représentation autorégressive d’un vecteur de séries temporelles interdépendantes (
i.e.
sans différenciation d’endogènes et d’exogènes) : les VAR (pour Vector Auto-Regression) qui permettent, entre autres, d’observer la propagation de chocs dans l’économie (méthode dite de réponse à l’impulsion). Prenons par exemple le cas de deux variables
x
t
et
y
t
représentées par un VAR d’ordre 2 (
i.e.
qui implique des retards des variables jusqu’à
t –
2, ce qu’on note VAR(2)) et donné par :
soit
Ainsi un choc unitaire sur
ε
x,t
se transmet-il dans l’économie suivant le schéma (on suppose que toutes les autres variables sont nulles pour dissocier l’impact spécifique de ce choc) :
L’effet du choc sur
ε
x,t
équivaut à une variation identique de
x
t
et l’impulsion se résorbe et les variables retournent vers leur état initial, ainsi que le montre la figure 1.
1
Réponse d’un système de deux équations à une impulsion unitaire sur
x
t
et sa propagation dans le système à mesure que l’horizon progresse
Depuis les années 1980, de nombreuses méthodes ont été développées sur les fondements des processus VAR. Celles-ci comprennent entre autres le concept de cointégration selon lequel il existe des combinaisons linéaires de variables non-stationnaires qui forment de nouvelles variables stationnaires. Le but des sections suivantes est de montrer de manière simple comment ces méthodes économétriques permettent d’appréhender les problèmes qui se présentent au prévisionniste.
2.
Les modèles économétriques de prévision
2.1.
Un monde parfait
Notre but ici est d’analyser les échecs récurrents des prévisions et, de ce fait de tâcher de trouver des méthodes pour améliorer les modèles et les rendre
robustes
,
i.e.
insensibles à certains défauts. Les premiers modèles de prévision reposaient sur deux hypothèses fondamentales :
1. Le modèle utilisé constitue une représentation exacte de l’économie ;
2. La structure de l’économie a été stable et le restera,
qui fondent ce qu’on peut nommer une
théorie de l’optimalité
[
5]
. Prenons l’exemple simple d’un modèle autorégressif d’ordre 1, dit AR(1), où la valeur d’une variable
y
à l’instant
t
,
y
t
, est fonction de sa valeur à la période précédente,
y
t-
1
, à laquelle s’ajoute une erreur imprévisible (qui suit une loi Normale d’espérance nulle et de variance) :
avec |
α
|<1 pour que
y
t
soit stationnaire (
i.e.
de moyenne et variance constante). Ceci fournit, pour
h
≥ 1 :
et, notant E [.|
y
t
] l’espérance mathématique, sachant
y
t
, il peut sembler naturel d’utiliser comme prévision de
y
t+h
générée à l’instant
t
la valeur
Å·
t+h|t
donnée par :
La propriété essentielle de l’espérance (conditionnelle) est qu’elle est — selon les hypothèses 1 et 2 ci-dessus — parmi les prévisions
Å·
t+h
|
t
de
y
t+h
à l’instant
t
, celle qui minimise le critère de moyenne quadratique d’erreur de prévision, défini par :
En effet pour toute autre prévision
ỹ
t+h
|
t
:
et le deuxième terme de cette équation est positif (et nul si et seulement si
Å·
t+h
|
t
=
ỹ
t+h
|
t
). Dans un tel contexte, le modèle le plus « exact » (ici, dont les paramètres estimés sont les plus précis) fournira les meilleures prévisions. Par extension, selon la théorie de l’optimalité, le modèle qui reflète le mieux les propriétés des variables dans l’échantillon de données dont on dispose fournira les prévisions les plus justes. Par ailleurs, quand on connaît la manière dont sont générées les données, les seules informations qui puissent permettre d’améliorer la précision sont celles concernant des faits à venir (tels que des changements de politique économique, de taux d’intérêts…).
La justesse des prévisions est aussi, dans ce cas, fonction décroissante de l’horizon
h
car la somme des chocs futurs (les
ε
t+h
) augmente la variance de l’erreur de prévision (qui converge vers une valeur limite si
y
t
est stationnaire). Enfin, il est possible de quantifier l’erreur de prévision car MQEP
h
=1
= Var[
ε
t
] =
σ
2
ε
. Le prévisionniste serait donc à même de fournir un intervalle de confiance sûr autour de son hypothèse centrale : dans le cadre d’innovations
ε
t
suivant une loi Normale, un intervalle de confiance à 95 % autour de la prévision s’écrit :
où dans le cadre du modèle AR(1),

et donc
est bornée (et ceci est toujours le cas lors de la prévision de variables stationnaires) puisque :
Le graphique 2 présente une simulation de prévision sur la base du modèle AR(1) ci-dessus, estimé pour 80 observations : la MQEP
h
permet d’établir l’incertitude autour de la prévision et on constate que sur cet exemple,
y
90
sort de l’intervalle de confiance à 95 %.
2
Donnée simulée
y
t
suivant un AR et sa prévision
Å·
t
à partir de la 80
e
observation. Les bandes autour de la prévision indiquent des incertitudes croissantes de 5 % en 5 %
Malheureusement, ces hypothèses ne sont pas vérifiées généralement. Il est possible de fournir de multiples contre-exemples pour chacune des propriétés présentées ci-dessus. C’est pour cette raison que de nouvelles théories se sont révélées nécessaires et ont vu le jour au cours des années 1990.
2.2.
Un cadre pour la prévision
Six points sont à prendre en compte dans l’élaboration d’un modèle :
-
la nature du processus probabiliste qui génère les données (noté PGD),
-
le niveau de connaissance à son sujet,
-
la dimension du système,
-
la forme d’analyse,
-
l’horizon de prévision et
-
la complexité mathématique du système.
Ainsi, le PGD peut il être stationnaire, ou alors peut être ramené à un processus stationnaire (par exemple en utilisant des relations de co-intégration), ou enfin non-stationnaire et sujet à évolutions (comme lorsque les paramètres changent, ou s’il passe par divers régimes…). On peut par ailleurs le connaître de manière sûre (et se retrouver dans le cadre présenté plus haut de la théorie de l’optimalité), ou n’avoir qu’à estimer ses paramètres car on connaît sa forme générale, ou enfin ignorer à la fois la forme et les paramètres du PGD. Le système peut être univarié (scalaire), ou peut constituer un processus vectoriel estimable ou non (auquel cas des hypothèses d’identification sont nécessaires
a priori
). Il peut s’agir d’une analyse sur des propriétés asymptotiques (à partir de très grands échantillons) ou, au contraire, se fondant sur une étude d’échantillons de taille finie et en faisant, le cas échéant, appel à des simulations. Il est possible qu’on ne s’intéresse qu’à la prochaine valeur ou à un horizon de prévision s’étendant sur plusieurs périodes. Et enfin, le système étudié peut être linéaire ou non.
Toutes ces hypothèses ont leur importance car les sources d’erreurs résultant du modèle en dépendent ; par ailleurs, la méthode de prévision doit être définie pour pouvoir traiter ces problèmes. Ainsi, au vu des avancées récentes en économie et économétrie, on doit naturellement se placer dans le cadre d’un PGD vectoriel non-stationnaire inconnu mais estimable, soumis à des modifications non anticipables. On suppose cependant qu’il est possible de se ramener à un modèle linéaire, même si on ne dispose que d’un échantillon de taille réduite et qu’on s’intéresse à des prévisions à divers horizons. Ce type de PGD est un des plus généraux pour lesquels il est possible d’établir une analyse en matière de prévision. Dans la section 6, on s’intéressera à un modélisation des importations françaises de biens et services : il s’agit d’une représentation de leur taux de croissance issue d’un modèle plus complexe prenant en compte l’ensemble des interactions ; ici la croissance des importations est fonction des variations récentes de variables exogènes et d’un déséquilibre à la période précédente entre la demande intérieure, les goulets d’étranglement et une tendance déterministe représentant l’ouverture croissante de l’économie française.
3.
Limitations des modèles
Pour comprendre les difficultés rencontrées par les modèles économétriques lorsqu’ils sont appliqués à la prévision, il est utile de décomposer les sources principales d’erreurs selon leur origine afin d’en établir une taxinomie et, ensuite, de les hiérarchiser. Il nous faut, dans ce but, spécifier un processus probabiliste ayant généré les données et un modèle de celui-ci —
a priori
distinct — utilisé en prévision. En macroéconomie, le consensus des vingt dernières années s’est établi autour de données intégrées générées par un système co-intégré et dont les coefficients sont soumis à des variations irrégulières. Le modèle de prévision est souvent formulé en fonction de notions (d’
a priori
) théoriques et il est très certainement empreint d’erreurs de spécification qui peuvent aussi entraîner une mauvaise estimation des paramètres à partir de données potentiellement erronées. Afin d’établir un cadre d’analyse clair, on suppose que le modèle comprend trois composantes : des termes déterministes (des constantes et des tendances linéaires du type
α
+
βt
) dont les valeurs futures sont connues ; des variables stochastiques observées (celles que le modèle tente de caractériser) dont les valeurs futures sont inconnues, et des variables non observées et dont les valeurs passées, présentes et à venir sont inconnues (elles représentent les erreurs du modèle et sont mesurées comme résidus de l’estimation). Chacun de ces éléments est en principe susceptible d’être mal mesuré, mal spécifié, incorrectement estimé, ou de changer de manière non anticipée. On fait ici l’hypothèse qu’on a reformulé le modèle de façon à lui donner une représentation stationnaire (par exemple
via
un modèle vectoriel de correction d’équilibre). Pour simplifier la présentation, seul un processus de premier ordre est considéré. On suppose par conséquent que le vecteur (de dimension
n
) de données
y
t
est généré par :
où IN[0,Ω
ε
] indique une distribution Gaussienne multivariée d’espérance nulle (E[
ε
t
] = 0) et de matrice de variance-covariance (Var[
ε
t
]) égale à Ω
t
; les éléments
ε
t
et
ε
t’
à des dates différentes étant indépendants. On suppose, dans ce cadre, que la distribution probabiliste des variables
y
t
est stable dans le temps, et que, par conséquent, les paramètres
φ
et Î sont constants ; par ailleurs, afin d’établir la stationarité de
y
t
(ou en d’autres termes son caractère non intégré, noté I (0)) les valeurs propres de Î sont toutes de module inférieur à 1. L’espérance de
y
t
est dans ce cas donnée par
φ =
(E[
y
t
] = E[
y
t-
1
]), et ainsi
soit
φ =
(I
n
– Î )
-1
φ
. Ceci nous permet de reformuler (2) sous la forme
À partir d’un échantillon de données de taille
T
, {
y
t
où
t =
1, …,
T
}, et avec la notation ^ pour les estimateurs et prévisions, il est possible, connaissant la forme du PGD donnée par (2) d’obtenir une prévision
Å·
T+h
|
T
de
y
T+h
où
h =
1, …,
H.
Celle-ci est obtenue en considérant que les valeurs futures de
ε
t
(
i.e.
les
ε
T+s
pour
s
≥1) sont en moyenne nulles. En posant :
Å·
T+h
|
T
est fourni par un modèle autorégressif vectoriel VAR(1) similaire à celui de l’équation (1) qui relie les variables représentées par le vecteur
y
t
à leur passé :
ce qui mène à
où les données connues et utilisées lors de la prévision,
Å·
T
, sont susceptibles de révisions (il existe potentiellement des erreurs de mesure). Ainsi,
Å·
T
≠
y
T
a priori
mais, si on suppose que les révisions sont nulles en moyenne, E[
Å·
t
] =
y
t
. La prévision correspond donc à la somme de la moyenne

et de l’écart vis-à-vis de celle-ci de la valeur estimée de
Å·
T
à l’origine de la prévision, à un facteur

près.
En utilisant (3), on ne présuppose pas que le modélisateur connaisse la forme du PGD : il se peut que

soit mal spécifié en imposant
a priori
que certains coefficients soient nuls (ce qui revient à omettre des variables), ou en ajoutant des variables inadéquates dans certaines équations. Comme le système est dynamique, le comportement de chaque horizon de prévision diffère et ce, surtout, lors de chocs sur le système. Si une rupture structurelle survient à l’instant
T
de sorte que les paramètres (
φ
,
Î ) deviennent (
φ
*
,
Î
*
) et qu’à partir de
T+
1, les données soient générées par :
alors, en posant

le système devient :
En utilisant les formules précédentes, et en posant
on obtient l’erreur de prévision :
Il est possible de réarranger (5) de manière à faire ressortir les différentes influences en négligeant les termes croisés. On note à l’aide d’un indice
p
les limites, pour un échantillon de taille infinie, des estimateurs :
Î
p
=
lim
T→∞
Î (avec les mêmes mauvaises spécifications). Par ailleurs, on pose deux matrices
[
6]
C
h
et
F
h
et l’opérateur
v
, qui transforme une matrice de taille
p × q
en un vecteur de dimension
pq ×
1 où les colonnes de la matrice sont simplement empilées les unes au-dessus des autres dans le vecteur transformé. Il nous est ainsi possible d’exprimer
ê
T+
h
|
T
par les décompositions présentées dans le tableau 1. Celui-ci combine des effets dont l’origine peut être différente (une modification des propriétés de
ε
t
par exemple). On constate que l’espérance conditionnelle de toutes les composantes est nulle, sauf celle des lignes (
ia
) et (
iia
). Les autres aspects n’induisent donc pas de biais systématique mais altèrent la précision de la prévision
via
la variance de son erreur.
Ainsi des erreurs systématiques de prévision interviennent-elles lorsque la moyenne d’équilibre est non constante (
φ – φ
*
≠ 0) ou mal spécifiée (
φ – φ
p
≠ 0). Prenons le cas de cette dernière hypothèse : en principe les résidus d’estimation sont construits de sorte que leur moyenne soit nulle, et donc que
φ
et
φ
p
coïncident, sauf si la moyenne s’est déjà modifiée par le passé de manière inaperçue. Un modèle bien formulé devrait donc éviter cette faille. En revanche, un choc déterministe prenant la forme d’un changement de moyenne induit, en (
ia
), une erreur qui s’amplifie avec l’horizon car elle est fonction de (I – (Î
*
)
h
) et (Î
*
)
h
→ 0 d’après les hypothèses de stationnarité (qui nécessitent que Î , Î
*
, Î
p
n’aient pas de valeur propre unitaire).
En revanche les composantes dynamiques (
ib
) et (
iib
) sont toutes deux multipliées par un terme d’espérance nulle (
y
T
– φ
) et n’ont donc qu’un faible impact (qui serait d’ailleurs nul à tous horizons si l’origine de prévision était égale à sa moyenne). Enfin les effets de variance résultent principalement des problèmes d’estimation (
iva
) et (
ivb
) ainsi que de l’accumulation de chocs (
v
).
Le but de l’étude du système (2) était de montrer comment analyser la capacité prévisionnelle d’un modèle économétrique et d’apprendre à en tirer les conclusions adéquates. Dans la prochaine section, on s’attachera à montrer comment il est possible de choisir des modèles robustes à certaines erreurs de prévision. Ainsi, grâce à des études comme la taxinomie du tableau 1, on pourra choisir de modifier les modèles pour diminuer leur sensibilité aux chocs ayant les pires conséquences pour la prévision.
1
Taxinomie des composantes de l’erreur de prévision.
(ia) changement de moyenne d’équilibre (ib) changement de pente (iia) équilibre mal spécifié (iib) mauvaise spécification de la pente (iii) incertitudes sur l’origine (iva) estimation de la moyenne d’équilibre (ivb) estimation de la pente (v) accumulation de chocs stochastiques
4.
Obtenir des prévisions robustes
Cette section illustre comment utiliser la taxinomie présentée précédemment dans le cadre de la prévision ; par exemple comment pallier les chocs déterministes, ceux qui entraînent des erreurs d’espérance non nulle. Plusieurs voies s’ouvrent à nous : utiliser des méthodes purement statistiques ou améliorer un modèle existant. La réponse à apporter dépend de l’utilisation qu’on souhaite faire de la prévision. Mais dans les cas exposés ci-dessous, il est important de déterminer la forme du choc que les variables subissent. De manière simple, on s’intéressera donc en premier, dans le cadre du modèle présenté dans la section 3, à un déplacement de la moyenne d’équilibre de
φ
à
φ
*
Les méthodes que nous présentons ci-dessous sont utilisées couramment par les prévisionnistes professionnels : nous tâchons surtout de montrer pourquoi, et sous quelles hypothèses, elles peuvent être gage d’amélioration de la prévision.
A priori
, la nature d’un choc non anticipé n’est pas connue ; pourtant l’intérêt de l’analyse formelle apparaît sous deux angles : elle permet d’une part de savoir dans quel contexte une méthode se révélera utile et ce faisant, sur la base d’une hypothèse concernant les risques de chocs, de choisir parmi les corrections possibles pour certaines variables à prévoir. Ainsi ces techniques peuvent-elles s’insérer dans un modèle plus général qui, quant à lui, permettra d’obtenir des variantes.
4.1.
Transformation des variables
La méthode la plus naturelle vise à trouver une transformation des variables qui ne subisse pas les effets du choc. Ici, dans le cas d’un simple passage de
φ
à
φ
*
il est important d’en visualiser les conséquences pour le processus. Pour ce faire, on présente sur la figure 3 des données en présence ou en l’absence d’un tel choc. Il est aisé de constater qu’il s’agit effectivement d’un simple
déplacement
des variables. De ce fait, si on s’intéresse à la variation des données d’une période à la suivante,
i.e.
à la
différence
de
y
t
, on constate sur le graphique du bas de la figure que celle-ci n’est quasiment pas perturbée par le choc. Ainsi un modèle de prévision pourra-t-il prendre cet aspect en compte et par exemple s’efforcer de prévoir, non pas le niveau de l’indice des prix, mais son taux de croissance : l’inflation. Mathématiquement, en supposant que le choc intervienne à
T
:
alors
Ceci implique que le processus générateur de
Δ
y
t
est quasiment constant sur l’échantillon et pratiquement non affecté par le choc (mis à part en
T+
1)
[
7]
. Il conviendrait donc, dans un tel cas, de modéliser, plutôt que la prévision de
y
T+
1
(par exemple le logarithme de l’indice des prix à la consommation) celle de
Δ
y
T
(l’inflation) et ainsi le modèle utilisé s’avérerait valable pour quasiment toutes les valeurs futures. Cette transformation des variables génère une prévision
via
(7) identique à celle obtenu par (6) en l’absence de choc, mais permet de s’assurer que l’effet du choc n’est plus permanent mais transitoire (ici seule l’observation à
T+
1 est affectée). Malheureusement, ce gain de
robustesse
s’acquiert au détriment d’une perte de certitude : la variance des résidus de (7) est double de celle de (6). Enfin l’utilisation du taux de croissance au lieu du niveau de la variable se révèle intéressant dans le cadre du choc ci-dessus, lors d’un simple déplacement des variables, mais la transformation d’un choc permanent en transitoire peut se révéler plus difficile lorsque la dynamique même de la variable se trouve affectée : si
Î devient
Î
*
et le passage au taux de croissance ne suffit plus.
3
Impact d’un déplacement de moyenne d’équilibre (
Ï•
= 0,
Ï•
*
= 2) pour un processus stationnaire et sa première différence
4.2.
Correction du modèle
L’autre méthode principale pour un choc de
φ
à
φ
*
consiste à corriger un modèle existant. Ainsi peut-il se révéler judicieux de prendre en compte l’erreur de prévision dans l’échantillon à disposition. En utilisant :
alors, sur l’échantillon,
t
= 1, …,
T, i.e.
pré-choc, les estimations de

et de

ne devraient pas être trop éloignées des vraies valeurs des paramètres si le modèle est bien spécifié. Par conséquent, il est probable que les prévisions intra-échantillon (
i.e.
les valeurs estimées) soient de bonne qualité. En revanche, à partir de
T+
1, les erreurs vont souffrir du choc. Il est possible de rendre ce modèle plus robuste en ajoutant, par exemple, à une prévision à
t
, l’erreur faite à la période précédente :
ce qui donne :
Cette méthode implique une erreur de prévision :
et donc la correction revient à différencier l’erreur de prévision. Ce faisant, puisque l’erreur d’anticipation est faible avant le choc (et proche de
ε
T
≈ y
T
- Å·
T
|
T
- 1
de variance Ω
t
= ΣΣ’), on ne contamine pas trop la première prévision :
mais puisque à
T+
1 le choc a déjà eu lieu, l’erreur est de toute manière forte si

ce qui implique que l’amplitude du choc soit supérieure à la variabilité (écart-type) des résidus L’intérêt de cette méthode devient clair à la période suivante, car si
en revanche, l’erreur redevient très faible à
T+
2 car
ce qui fait que la correction a « gommé » le déplacement
φ
→|
φ
*
à peu de frais et ce, sans connaissance de l’existence ou de l’amplitude du choc :
le modèle s’ajuste de lui même
(ce qui ne signifie pas que le choc n’ait pas eu lieu). L’intérêt de cette méthode, comparée à la transformation des données, est qu’elle permet facilement de conserver les bonnes dynamiques du modèle, et donc, quand on souhaite davantage pouvoir anticiper les mouvements de l’économie qu’obtenir un simple chiffrage, elle peut se révéler très fructueuse car elle cible directement la variable utilisée dans le modèle sans transformation. La figure 4 présente les prévisions obtenues par un modèle et sa correction : on constate aisément le gain qu’apporte la modification lorsque le choc intervient à la fin de l’échantillon,
i.e.
la date origine de la prévision.
4
Prévision à partir d’un modèle autorégressif avec ou sans correction consistant à faire coïncider la prévision avec l’origine de prévision à
T =
62
Les barres indiquent l’intervalle de confiance autour de la prévision non corrigée. On constate l’inexactitude de cette dernière et la pertinence de la correction.
4.3.
Les relations de causalité
Un résultat
a priori
contre intuitif résultant de l’analyse des causes d’erreur en matière de prévision concerne l’usage de relations de causalité. L’usage de variables intervenant réellement dans le processus générant la variable à prévoir, n’est pas gage d’amélioration de la précision si leur influence est mal prise en compte, comme par exemple dans l’imposition de relations de cointégration qui se révèle instables : ce fut l’origine de grandes difficultés lors de l’introduction de la rémunération des comptes bancaires courants au Royaume-Uni (Banking Act de 1984) qui a entraîné une modification du coût d’opportunité de détention de monnaie liquide (agrégat M1), ce dont les agents ne se sont que progressivement rendu compte. La banque d’Angleterre n’a pas intégré ce changement dans la conduite de sa politique monétaire (le passage du taux d’intérêt réel à 3 mois à son écart vis-à-vis de celui des dépôts à vue) et a systématiquement sous-estimé le taux de croissance réel de la monnaie car elle a mal pris en compte la modification résultante d’une relation de cointégration entrant dans son modèle (voir Hendry, 2004). La cointégration est le phénomène selon lequel des variables dont le comportement est instable (par exemple présentant une tendance fluctuante ou des changements de volatilité) peuvent présenter des relations qui, quant à elles, sont nettement plus stables. Un exemple peut en être le
spread
de taux entre le PIBOR à un an et à trois mois qui sont représentés sur la figure 5.
5
Taux et
spread
de taux
Le comportement des taux y apparaît erratique (bien qu’il soit possible d’en expliquer les mouvements) tandis que le
spread
oscille pour sa part autour de zéro. Ainsi les taux peuvent être vus comme intégrés (et imprévisibles par leur passé seul) et leur différence (une combinaison linéaire des deux) comme ayant une moyenne et une variance constantes (le
spread
ne sort jamais d’une bande de ± 1 %).
Ainsi, de manière générale, si
x
t
est un vecteur de variables intégrées d’ordre 1 (
i.e.
variables non-stationnaires, dont la différence Δ
x
t
=
x
t
–
x
t-
1
est stationnaire), il peut exister une combinaison linéaire des variables de
x
t
donnée par le vecteur
β
, tel que
β’x
t
soit stationnaire,
i.e.
oscillant autour d’un équilibre E[
β’x
t
] =
μ
. Ceci nous permet de reformuler le processus sous la forme d’un
mécanisme de correction d’équilibre
où l’écart par rapport au long terme intervient dans les fluctuations de court terme, ce qui s’écrit dans le cas le plus simple :
Dans cet exemple, il est dit que
x
t-
1
cause Δ
x
t
(au sens de Granger). Cependant, comme nous l’avons vu précédemment, si, à la suite d’interventions de politique économique, une modification de
μ
intervient (il peut en exister en pratique maintes raisons) qui implique un nouvel équilibre à
μ
*
(par exemple en
T
), l’utilisation de
x
t-
1
dans la prévision entraîne le modèle vers un équilibre erroné. Il est sans doute préférable dans un tel cas de ne pas recourir à la relation de causalité entre
β’x
t-
1
et Δ
x
t
, mais d’utiliser un modèle « non-causal » :
où E[
u
t
] = 0, de sorte que le modèle (8) génère une erreur de

pour (9) donnant

car :
Cette technique (9), notée DV, diffère des précédentes, car il ne s’agit pas ici de modéliser le taux de croissance mais en réalité d’imposer une tendance déterministe à partir de l’origine de la prévision :
ou une simple marche aléatoire dans le cas
γ
= 0. Enfin dans certains cas, il est aussi possible d’utiliser par exemple le modèle DDV
qui impose une tendance quadratique. Bien entendu, dans un cadre plus général que celui de l’équation (8), d’autres variables entreraient en jeu et ne seraient par exemple pas supprimées dans l’équation de prévision : seules celles qui entraînent le modèle vers un équilibre que le prévisionniste anticipe instable.
4.4.
Prévision à horizon variable
Si on souhaite obtenir des prévisions à plusieurs horizons, en supposant toujours que le modèle est imparfait, et en reprenant la formulation en VAR (en ignorant la constante par souci de clarté) :
de sorte que :
alors, la prévision correspondant à
h
périodes est donnée par
On constate que si

est un bon estimateur de
Î , il n’en va pas nécessairement de même de

pour
Î
h
, car la différence entre les deux est fonction croissante de l’horizon
. Il peut donc être plus judicieux de s’intéresser directement à la relation entre
y
t+h
et
y
t
en estimant sur l’échantillon :

ainsi obtenu permet d’établir une prévision :
Ici, le modèle de prévision est formulé de manière à minimiser l’erreur intra-échantillon correspondante. En théorie cette dernière méthode est asymptotiquement optimale (
i.e.
pour de grands échantillons). En pra-tique, elle permet souvent de capturer des effets de
mémoire longue
absents des modèles à court horizon : utilisée
via
un glissement (annuel par exemple sur données trimestrielles), Δ
4
y
t
=
y
t
–
y
t-
4
, elle permet de s’extraire de la difficulté des périodicités infra-annuelles de type saisonnier.
4.5.
Données inexactes
Lorsque les données sont inexactes, ce qui est toujours le cas pour les variables macroéconomiques vers la partie la plus récente de l’échantillon, l’erreur initiale est transmise à toutes les prévisions alors même que le modèle peut-être adéquat. Il convient donc d’élaborer des méthodes qui permettent de discerner si une anomalie correspond à un choc entraînant une mauvaise spécification du modèle ou si elle résulte simplement d’un problème de mesure des données. Dans le cadre des méthodes précédentes, l’observation d’un fort résidu dans la modélisation de
Å·
T
est-elle due à une donnée inexacte ou cache-t-elle un choc
φ
→
φ
*
?
Les révisions de données étant souvent très importantes, l’usage d’enquêtes et de sondages s’avère souvent profitable à l’analyse des données les plus récentes. De nombreuses méthodes
ad hoc
existent pour prendre en compte cet aspect. Parmi celles-ci, le prévisionniste choisit parfois de procéder à une correction du modèle semblable à celle présentée précédemment, mais qui prend la forme d’un lissage des erreurs récentes de prévision, ou une moyenne de ces dernières. Les méthodes utilisées pour un choc peuvent aussi être utilisées dans ce cadre. Mais le jugement du prévisionniste demeure ici essentiel.
4.6.
Combiner les prévisions
Nombreux sont les organismes qui établissent des prévisions, et celles-ci sont souvent divergentes. L’expérience a montré qu’en général, la moyenne
[
8]
des prévisions s’avère rétrospectivement plus précise que la plupart de celles-ci, prises individuellement. Il existe d’ailleurs une publication dédiée à cette tâche :
Consensus Forecast
. La cause en est intuitivement simple : les prévisions sont très probablement proches de la réalité, mais quand certaines pèchent par optimisme d’autres sont coupables de pessimisme. Ainsi les particularités s’effaceraient-elles quand on les additionne. Il a été plus difficile d’expliquer ceci de manière économétrique. En effet, il apparaît difficile de prouver que la moyenne puisse être plus précise que le meilleur des éléments, et ce d’autant plus que, lors d’un choc, la plus forte probabilité est que toutes les prévisions soient biaisées dans la même direction. Pourtant, lorsque chaque modèle n’utilise qu’une fraction de l’information utile, un même choc peut avoir des conséquences opposées sur les prévisions, justifiant de ce fait l’utilisation de leur moyenne.
5.
Évaluer les prévisions
Comment, entre plusieurs prévisions, choisir la bonne ? Cela dépend du critère retenu. On peut supposer par exemple que l’erreur de prévision ê
T
+1
|
T
, soit nulle en moyenne ; ceci implique en pratique qu’au fil du temps les anticipations seront également sur- et sous-estimées, ce qui s’écrit, en utilisant l’espérance mathématique
[
9]
:
Un critère d’évaluation qui privilégierait la minimisation de

mettrait ainsi l’accent sur la
précision de la prévision
. Si on estime, en revanche, qu’il n’est pas important d’obtenir un chiffrage parfait, mais qu’il est essentiel de ne jamais
trop
se tromper et qu’on souhaite par conséquent pouvoir déterminer un faible intervalle de confiance autour de la prévision, on peut dans ce cas s’astreindre à minimiser la variance :
En général, en faisant l’hypothèse que l’erreur ê
T
+
1|
T
suit une distribution Normale,
y
T+
1
est compris dans 95 % des cas dans l’intervalle :
Minimiser

revient donc à privilégier la
certitude
(théorique) de
Å·
T+
1|
T
. En pratique, cependant,

, et donc le prévisionniste doit atteindre un équilibre entre précision et certitude. Les travaux théoriques ont tendance à se référer à la moyenne quadratique d’erreur de prévision :
qui attribue de l’importance aux deux critères. Pour clarifier la différence entre les critères, reprenons l’exemple d’un choc
φ
→|
φ
*
à l’instant
T
dans l’équation (2). Avec les mêmes notations que précédemment (on néglige les erreurs dues à l’estimation des paramètres dans la formule (5)),
les prévisions
Å·
T+
1|
T
et
Å·
T+
2|
T+
1
(si on ignore qu’un choc est survenu) génèrent des erreurs
de sorte que MQEP

.
En revanche, s’intéresser à la différence
Δ
y
t
=
πΔ
y
t
–
1
+
Δε
t
fournirait une erreur de prévision

mais

et

ce qui donne une MQPE supérieure à celle du modèle en niveau pour
T+1
mais au prix d’une réduction pour les horizons suivants :
La prévision de
y
T+
1
est ici moins précise, mais plus certaine que celle de Δ
y
T+
1
(espérance plus élevée, moindre variance). Selon les valeurs des paramètres et les priorités du prévisionniste l’une ou l’autre méthode serait à privilégier : la prévision en différence se révèle préférable selon ce critère et dans ce cadre pourvu que |
φ
*
-
φ
| >
σ
ε
. De manière générale, lorsqu’on modifie un modèle pour affiner la précision de la prévision, ceci se fait au détriment de la certitude l’entourant. Il est, par conséquent, essentiel de toujours préciser dans quel but, pour quelle utilité, une prévision est réalisée car selon le type de jugement qui lui est appliqué — il en va des critères comme des Pyrénées — elle peut très facilement se trouver vérité en deçà, erreur au-delà.
6.
Illustration par la prévision des importations
Afin d’observer comment s’appliquent les méthodes présentées, nous nous intéressons ici à un modèle de croissance des importations françaises de biens et services, issu du le modèle de l’économie française de l’OFCE (emod.fr, voir Chauvin
et al
, 2002). Il s’agit d’un mécanisme à correction d’équilibre selon lequel s’établit un équilibre de long terme entre les importations de biens et services en volume (
M
t
), la demande intérieure (
D
t
), le prix relatif des importations (hors pétrole) vis-à-vis du prix de la valeur ajoutée française (
P
M
t
/
P
VA
t
) et la durée d’utilisation des équipements dans l’industrie (
DUE
t
, représentant les tensions sur la capacité productive de l’économie)
[
10]
. En notant en lettres minuscules les logarithmes des variables, cet équilibre, (estimé de 1983(2) à 1999(4), selon une méthode à une étape, voir Banerjee
et alii
, 1993) est représenté par la relation de cointégration :
L’élasticité des importations à leur prix relatif est nettement plus faible que celle retenue dans le modèle emod (0.6), et nous ne prenons pas en compte ici l’écart entre la
DUE
domestique et celle de nos fournisseurs — supposant que les importateurs peuver librement changer l’origine de leur approvisionnement — mais nous conservons cette expression simple car nous nous intéressons surtout à la comparaison entre les diverses techniques d’ajustement. L’équation d’importations régit leur taux de croissance (Δ
m
t
=
m
t
–
m
t-
1
) en fonction de ceux des variables mentionnées précédemment et du
déséquilibre c
t-
1
selon (erreurs standards entre parenthèses,
p
-valeurs entre crochets) :
Le modèle (10) n’est pas rejeté par les tests de spécification (normalité et absence d’autocorrélation des résidus), est stable sur la période d’estimation, et représente bien les variations des importations dans l’échantillon (voir figure 6). En revanche, si les fluctuations du taux de croissance sont effectivement prévues à partir de 2000 (

), leurs niveau et amplitude présentent des erreurs. Afin d’observer comment améliorer les prévisions en pratique, nous allons tour à tour utiliser des ajustements différents de (10), notée MCE. La méthode la plus simple vise à s’abstraire des problèmes de dynamique et à poser

; ainsi le taux de croissance d’hier perdure aujourd’hui (méthode DV) ; cette méthode purement statistique est simpliste mais se révèle robuste si un choc récent est passé inaperçu. Sinon, la méthode IC (
intercept correction
, ou correction du biais), corrige la prévision

obtenue par (10) de l’erreur de prévision observée à la période précédente :
Cette technique pourrait aussi être utilisée sous de multiples formes : soit une correction sur la base d’un modèle de prévision en niveau (

et non

) — mais alors il s’agirait de le comparer à d’autres ciblant la même variable — ou alors en corrigeant d’une moyenne mobile des erreurs de prévision récentes.
Sinon, comme nous avons vu que les modèles à correction d’erreur peuvent présenter des faiblesses si le niveau de l’équilibre de long terme se modifie, nous recourrons à un modèle n’utilisant que la dynamique de court terme (modèle CT
e
) :
6
Estimation et prévision (2000-2004) du taux de croissance des importations françaises
Enfin deux modèles purement statistiques peuvent se révéler utiles, soit un processus autorégressif d’ordre 1, AR(1) estimé avant 2000 et qui ne représente pas très bien les variations :
ou un modèle ARMA plus général : par estimation on aboutit au modèle ARMA (2,3)
Ces deux modèles fournissent respectivement

et

. Les prévisions du taux de croissance des importations obtenues par ces différents modèles sont présentées figure 7 où à partir de 2000 sont reportés le taux de croissance effective, la prévision ainsi que les bornes d’un intervalle de confiance à 95 % (en pointillés). Les modèles DV et AR présentant des erreurs standards très élevées, nous avons également placé deux graphiques sans intervalles de confiance. Le modèle CT existe sous deux formes : l’une où les coefficients sont repris de l’équation (10), notée CT, et l’autre en utilisant (11), notée CT
e
. Deux éléments semblent importants : (i) les modèles « économétriques » perçoivent mieux les retournements et pics de la série et les corrections IC et CT, CT
e
ont l’avantage sur MCE de ne pas s’éloigner durablement des valeurs à prévoir — ils sont d’ailleurs plus souvent de même signe que
Δ
m
t
; (ii) les méthodes « statistiques », AR, ARMA et DV, s’auto-corrigent rapidement mais peuvent générer de fortes erreurs (
cf.
2001(1) et 2002(1) pour DV) et peuvent présenter une très forte incertitude.
Il est difficile de hiérarchiser les techniques de prévision à la seule vue de la figure 7. Nous nous intéressons donc à des critères d’évaluation et reportons ci-dessous les MQEP et MAEP (Moyenne absolue d’erreur de prévision,

). Comme la fonction de distribution des erreurs n’est pas connue (car elle impliquerait de connaître le véritable mécanisme ayant généré
Δ
m
t
), nous utilisons comme approximation de l’espérance, la moyenne des erreurs entre 2000(1) et 2004(4), soit 20 observations :
7
Prévision (2000-2004) du taux de croissance des importations françaises
En % CT IC CTe AR ARMA DV MCE MQEP 1.43 1.58 1.59 1.61 1.69 1.77 2.31 MAEP 1.05 1.21 1.15 1.40 1.32 1.28 1.94
La méthode la plus précise, au sens de la MQEP, est ici de loin CT
e
, la technique utilisant les variations de court terme, suivie par IC qui utilise le modèle complet mais corrigé de son erreur récente. Les modèles autorégressifs se situent assez bien eux aussi pour des méthodes qui n’utilisent que le passé récent de la série sans aucun apport de théorie économique. La méthode DV est meilleure en prenant en compte la moyenne absolue car il lui arrive de générer de très fortes erreurs, ce que la moyenne quadratique pénalise fortement. Enfin, le mécanisme à correction d’erreur — le modèle
économique
— s’avère le moins précis dans cet exercice car il sous-estime de manière permanente le taux de croissance des importations ; les techniques alternatives présentées améliorent effectivement la qualité de la prévision, jusqu’à diviser l’erreur par deux en moyenne : environ 1 point de pourcentage d’amélioration pour CT
e
!
Quelle méthode choisir parmi celles présentées ci-dessus ? Si le modèle MCE est le meilleur sur l’échantillon, pourquoi ne pas le choisir pour la prévision ? Il n’existe malheureusement pas de réponse générale et le prévisionniste doit se faire son propre jugement ; celui-ci dépend du critère d’évaluation retenu : est-ce principalement le signe ou la valeur de la prévision qui compte, sont-ce les changement d’orientation qui importent, est-il préférable de toujours sur-(ou sous-)évaluer ; le modélisateur se doit de bien choisir sa méthode d’évaluation. Ensuite, il faut s’interroger sur le modèle économique retenu : est-il réellement valable ? Des modèles dont les variables sont sélectionnées uniquement sur la base de leur
R
2
dans l’échantillon d’estimation peuvent présenter de forts défauts théoriques qui ne les rendent pas capables de bonnes prévisions. Par ailleurs, l’équation choisie est-elle vraiment stable sur l’échantillon d’estimation ? Une analyse récursive des coefficients est essentielle car comment envisager qu’un modèle dont la pertinence fluctue puisse se maintenir à l’avenir ? Ainsi le modèle MCE est-il le meilleur sur l’échantillon, mais si on l’estimait jusqu’en 1995, se révélerait-il capable de bien prévoir entre 1996 et 2000 ? En l’absence d’une solution réellement économiquement et économétriquement satisfaisante, il peut se révéler plus utile d’utiliser des méthodes statistiques dont les propriétés prévisionnelles sont relativement bien établies. Enfin, puisque de nombreuses corrections permettent d’améliorer la précision, si le prévisionniste n’a pas d’avis
a priori
sur les types de chocs auquel son modèle risque d’être confronté, il peut se révéler judicieux d’utiliser une moyenne de différentes techniques, ou des scénarios selon les hypothèses envisagées, ou enfin grâce à une analyse comme celle présentée dans la taxinomie du tableau 1, de modifier le modèle de façon à le parer contre les erreurs de spécifications ayant les effets les plus pernicieux pour la prévision.
Il est surprenant de remarquer le retard que l’analyse de la prévision a sur les autres domaines économiques et économétriques. Ceci tient évidemment à son objet même : l’avenir. Il est pourtant réconfortant de constater comment les développements se nourrissent les uns les autres. En effet, s’il n’est pas pensable que les échecs récurrents en matière de prévision disparaissent complètement, il est clair – on l’espère du moins après lecture de cet article – que la compréhension de ceux-ci progresse et qu’il est possible, de ce fait, d’envisager de les réduire à l’avenir. Ainsi, si une bonne modélisation des comportements économiques est essentielle, ce n’est pourtant pas un gage de bonne prévision car l’échec provient de la modification de ceux-ci. Il n’y a plus de prévisions optimales quand le monde change. En revanche, une bonne compréhension des phénomènes entraînant des altérations dans un modèle permet d’essayer de les pallier, même sans avoir connaissance de leur apparition. On aboutit ainsi à des prévisions
robustes
. Dans les exemples présentés ici, il est apparu que les chocs sont difficiles à prendre en compte
ex ante
, mais qu’il est du moins possible de développer des méthodes (modélisation du taux de croissance, correction…) qui permettent de limiter l’incidence du choc sur les prévisions ultérieures ou qui fournissent des prévisions ni très précises ni très erronées (les méthodes DV et DDV), apportant de ce fait une réponse différente au problème des chocs. De tels modèles qui peuvent paraître absurdes peuvent se révéler utiles dans des contextes particulier, par exemple lors d’une crise importante entraînant des comportements transitoirement aberrants, ou pour des variables erratiques pour lesquelles il n’est pas possible de trouver de modèles satisfaisant : pourquoi un modèle économique que l’on sait théoriquement ou empiriquement imparfait se révélerait-il préférable ? Enfin, si l’analyse des erreurs de prévision n’apporte pas encore de solution idéale, il demeure intéressant de comprendre l’origine de leur émergence dans les chroniques historiques afin d’améliorer les techniques à l’avenir, ne serait-ce qu’en formalisant la compréhension de méthodes
ad hoc
couramment employées. Ainsi serons-nous capables d’anticiper, peut-être non pas les chocs à venir, mais de savoir quels sont ceux qui pourraient arriver et comment ils affecteront les prévisions ; la taxinomie présentée tableau 1 fournit un exemple d’analyse permettant de déterminer quels sont, pour un modèle donné, les chocs les plus importants à parer, ceux dont l’impact se révélera le plus fort.
La conclusion de notre analyse ne peut se formuler qu’en une incitation à formaliser le processus de prévision afin de pouvoir anticiper son échec, quantifier son inexactitude, faciliter sa reproduction, et progresser dans sa compréhension.
·
Banerjee
A., J.
Dolado
, J.
Galbraith
et D.
Hendry
, 1993 :
Co-Integration, Error-Correction, and the Econometric Analysis of Non-stationary Data
, Oxford et NewYork : Oxford University Press.
·
Box
G. E. P. et G. M.
Jenkins
, 1976 :
Time Series Analysis, Forecasting and Control
, (2
e
ed.), San Francisco, CA : Holden-Day. Première parution, 1970.
·
Chauvin
V., G.
Dupont
, E.
Heyer
et X.
Timbeau
, 2002 : « Le modèle France de l’OFCE »,
Revue de l’OFCE
n° 81, pp. 245-300.
·
Chevillon
G. et D. F.
Hendry
, 2005 : « Non-parametric direct multi-step estimation for forecasting economic processes »,
International Journal of Forecasting 21
, pp. 201-18.
·
Clements
M. P. et D. F.
Hendry
, 1998 :
Forecasting Economic Time Series
, Cambridge : Cambridge University Press.
·
Clements
M. P. et D. F.
Hendry
, 1999 :
Forecasting Non-Stationary Economic Time Series
, Cambridge, MA : The MIT Press.
·
Clements
M. P. et D. F.
Hendry
(eds.), 2002 :
A Companion to Economic Forecasting
, Oxford : Blackwell Publishers.
·
Clements
M. P et D. F.
Hendry
, 2004 : « Pooling of forecasts »,
Econometrics Journal 7
, pp. 1-31.
·
Diebold
F. X., 1998 : « The past, present and future of macroeconomic forecasting »,
Journal of Economic Perspectives 12
, pp. 172-195.
·
Hendry
D. F., 2000 : « On detectable and non-detectable structural change »,
Structural Change and Economic Dynamics 11
, pp. 45-65.
·
Hendry
D. F., 2004 : « Robustifying forecasts from equilibrium-correction models »,
Economic Working Paper 2004-w14
, Nuffield College.
·
Hendry
D. F. et J. A.
Doornik
, 1997 : « The implications for econometric modelling of forecast failure »,
Scottish Journal of Political Economy 44
, pp. 437-461, Special Issue.
·
Johnston
H. N., L.
Klein
et K.
Shinjo
, 1974 : « Estimation and prediction in dynamic econometric models »,
in
W.
Sellekaerts
(ed.),
Essays in honor of Jan Tinbergen
, London : Macmillan.
·
Lemoine
M. et F.
Pelgrin
, 2003 : « Introduction aux modèles espace-état et au filtre de Kalman »,
Revue de l’OFCE
n° 86, pp. 223-229.
·
Lucas
R. E., 1976 : « Econometric policy evaluation: A critic »,
in
K.
Brunner
et A.
Meltzer
(eds.),
The Phillips Curve and Labor Market
, pp. 19-46, Amsterdam : North-Holland.
·
Makridakis
S. et M.
Hibon
, 2000 : « The M3 competition: Results, conclusions and implications »,
Working paper
, INSEAD.
·
Schumpeter
, J., 1933 : « The common sense of econometrics »,
Econometrica 1(1)
, pp. 5-12.
·
Sims
C. A., 1980 : « Macroeconomics and reality »,
Econometrica 48(1)
, pp. 1-48.
·
Stock
J. H. et M. W.
Watson
, 1999 : « A comparison of linear and non linear univariate models for forecasting macroeconomic time-series »,
in
R. F.
Engle
et H.
White
(eds.),
Cointegration, Causality and Forecasting : A Festschrift in honour of Clive W. J. Granger
, pp. 1-44, Oxford : Oxford University Press.
·
Wallis
K. F., 1993 : « Comparing macroeconometric models : A review article »,
Economica 60
, pp. 225-237.
·
Wold
H. O. A., 1938 :
A study in the analysis of stationary time series
, Stockolm : Almqvist and Wicksell.
[
*]
Je remercie David Hendry et Xavier Timbeau pour leurs remarques et suggestions.
guillaume. chevillon@ ofce. sciences-po. fr
[
1]
L’exposition historique doit en grande part à l’article de F. X. Diebold (1998) auquel on renvoie vivement le lecteur.
[
2]
À l’origine, les deux branches de l’économie théorique et de l’économétrie ne s’étaient pas encore divisées.
[
3]
La stationnarité au sens faible de
y
t
nécessite que l’espérance mathématique et la variance de
y
t
soient indépendantes de la date
t
.
[
4]
Pour une présentation des modèles espaces-états et du filtre de Kalman, voir Lemoine et Pelgrin (2003).
[
5]
Voir Clements & Hendry (1998) et Makridakis & Hibon (2000).
[
6]
Pour les définitions, voir Clements et Hendry (1998).
[
7]
En pratique, et ainsi que constaté sur la figure 3, en présence d’un tel choc, les
Δ
y
t
sont légèrement modifiés autour de
T
car
Δ
y
T+
1
intervient dans l’expression régissant
Δ
y
T+
2
.
[
8]
Moyenne simple, pondérée, voire analyse en composante principale (voir Stock et Watson, 1999).
[
9]
On suppose pour faciliter la présentation que le modèle est univarié.
[
10]
Données INSEE sauf Banque de France pour la durée d’utilisation des équipements.