Economie & prévision
La Doc. française

I.S.B.N.sans
166 pages

p. 117 à 137
doi: en cours

Veille sur la revue
Veille sur l'auteur
Vous consultez

no 155 2002/4

2002 Économie et Prévision

La cointégration non linéaire : une note méthodologique

Gilles Dufrénot  [(*)] Valérie Mignon  [(**)]
L'objet de ce papier est de présenter les contributions récentes relatives à l'extension de la notion usuelle de cointégration au cas non linéaire. Nous nous intéressons ainsi à l'étude conjointe des phénomènes de non stationnarité et de non linéarité en proposant une présentation complète des développements théoriques concernant les notions d'intégration, de mémoire et de cointégration non linéaire. Dans ce cadre sont abordées les différentes possibilités de rendre compte du concept de cointégration non linéaire : modèles à correction d'erreur non linéaires, outils issus de la théorie de l'information et concepts de série fortement mélangée et de dépendance proche. Un bref panorama de la littérature empirique est également dressé.Mots-clés : clés cointégration non linéaire, modèles à correction d'erreur. The aim of this paper is to present recent contributions extending the classical concept of cointegration to non-linear cases. Thus, we look at a joint study of non-stationary and non-linear phenomena and offer a complete presentation of theoretical developments involving the concepts of integration, memory and non-linear cointegration. Within this framework we look at the methods available to express the non-linear cointegration concept: non-linear error correction models, tools developed from information theory and the concepts of mixed time series and time series with strong dependence. The article also gives a brief overview of empirical literature.Keywords : non-linear cointegration, error correction models.
L’objet de ce papier est de présenter les contributions récentes relatives à l’extension de la notion usuelle de cointégration au cas non linéaire. Nous nous intéressons ainsi à l’étude conjointe des phénomènes de non stationnarité et de non linéarité en proposant une présentation complète des développements théoriques concernant les notions d’intégration, de mémoire et de cointégration non linéaire. Dans ce cadre sont abordées les différentes possibilités de rendre compte du concept de cointégration non linéaire : modèles à correction d’erreur non linéaires, outils issus de la théorie de l’information et concepts de série fortement mélangée et de dépendance proche. Un bref panorama de la littérature empirique est également dressé.
La non stationnarité est certainement l’une des principales caractéristiques des séries macroéconomiques et financières mise en évidence depuis les travaux de Granger (1966) et Nelson et Plosser (1982). Ces auteurs ont en effet montré que la plupart des séries macroéconomiques étaient caractérisées par la présence d’une racine unitaire. De telles séries sont alors intégrées d’ordre un, c’est-à-dire non stationnaires : elles n’ont pas tendance, suite à un choc, à revenir vers la moyenne (ou vers leur valeur pré-choc) au sens où il n’existe pas de force de rappel vers une quelconque valeur de référence. Face à cette constatation, l’économétrie des séries non stationnaires a connu de nombreux développements à travers notamment la théorie de la cointégration, initiée par Granger (1981) et développée par la suite par Engle et Granger (1987) et Johansen (1988,1991).
Les principaux développements relatifs à la théorie de la cointégration et aux modèles à correction d’erreur se situent dans un contexte linéaire. Dans un tel cadre, les modèles à correction d’erreur sont caractérisés par un ajustement linéaire vers la cible de long terme. Cette propriété fondamentale est cependant fortement restrictive dans la mesure où elle a trois implications :
  • l’équilibre de long terme est unique ;
  • l’ajustement vers la cible de long terme est symétrique ;
  • l’ajustement représente une proportion constante de l’erreur d’équilibre antérieure.
Cette propriété de linéarité paraît ainsi insuffisante à bien des égards. En effet, parallèlement aux développements relatifs à la non stationnarité des séries économiques, on a assisté depuis le début des années quatre-vingt-dix à l’émergence d’une littérature abondante mettant en évidence le caractère non linéaire des ajustements dynamiques que connaissent la plupart des séries macroéconomiques et financières. Cette propriété est due à plusieurs facteurs, par exemple :
  • l’asymétrie du cycle économique (voir sur ce point les travaux de Van Dijk et Franses, 1997a) ;
  • les rigidités propres au fonctionnement des marchés (par exemple concernant le marché du travail, voir Skalin et Teräsvirta, 1998; Akram, 1998; Acemoglu et Scott, 1994; Franses, 1998; Burgess, 1992a; Montgomery et alii, 1998 ; Rothman, 1998) ;
  • l’existence de coûts de transaction sur les marchés financiers (voir Dumas, 1992 et Peel et alii, 1997) ;
  • l’inertie des comportements individuels (Dufrénot et Mignon, 1999).
Dès que l’on tient compte du caractère non linéaire des séries économiques, les conclusions que l’on pourrait tirer d’une étude concernant leur stationnarité sont erronées si l’on raisonne dans un cadre linéaire. Par exemple, une série linéaire non stationnaire peut devenir stationnaire à la suite d’unetransformation non linéaire. En outre, l’ajustement de court terme dans un modèle où les variables endogènes et exogènes sont non linéaires est tel que l’on observe des phénomènes de “time dependency” : l’ajustement observé à une période donnée n’est pas indépendant des erreurs d’équilibre antérieures. Enfin, les concepts habituellement utilisés dans la théorie de la cointégration linéaire ne sont plus valables dans le cadre non linéaire. Cela justifie qu’au lieu de la notion de “racine unitaire”, certains auteurs aient proposé des concepts plus généraux, comme par exemple les concepts de “mémoire étendue”, de “mélange” issus de la théorie de la cointégration (voir Dufrénot et Mignon, 2002).
L’objet du présent article est de dresser un panorama des développements récents relatifs à la théorie de la cointégration non linéaire ainsi qu’un aperçu concernant les domaines d’application et les résultats obtenus. Dans toute la suite, nous supposerons connu de la part du lecteur l’ensemble de l’analyse de la cointégration dans le cadre linéaire.
Le plan d’exposition retenu est le suivant. La première partie étudie les problèmes posés lorsque l’étude de la non stationnarité est conduite à partir de spécifications linéaires alors que le vrai processus générateur des données est non linéaire. Nous présenterons également les nouveaux concepts introduits dans la littérature économétrique pour l’analyse de la non stationnarité dans le cas des processus non linéaires. La deuxième partie discute de l’extension au cas multivarié en présentant la notion de cointégration non linéaire. Enfin, la troisième partie dresse un bref aperçu des résultats empiriques obtenus dans la littérature.
 
Non linéarité et mémoire d’une série temporelle
 
 
Quelques exemples
Quelles sont les conséquences de la non prise en compte du caractère non linéaire du processus générateur des données (en supposant qu’il s’agisse du "vrai" processus générateur des données) lorsqu’on étudie la stationnarité d’une variable ? Il n’existe pas de réponse générale à cette question dans la mesure où l’erreur d’interprétation dans l’analyse dépend du type de non linéarité omise. Nous allons considérer plusieurs exemples afin d’illustrer ce point fondamental.
Exemple 1 : supposons que l’on étudie la stationnarité d’une variable à partir de l’équation suivante [1] :
alors que le vrai processus générateur des données est [2] :
En développant l’équation (1), nous avons :
On vérifie aisément que le terme résiduel de cette équation satisfait la propriété suivante :
σv2 est une constante. vt est donc un bruit blanc, ce qui permet d’affirmer queYt est une marche aléatoire avec dérive (la dérive étant due au terme constant σε2 ).
Dans ce premier exemple, le fait de ne pas tenir compte de la non linéarité inhérente à la série étudiée n’a pas de conséquence : en termes de stationnarité, le modèle non linéaire exhibe le même type de comportement que le modèle linéaire. Mais il n’en est pas toujours ainsi, comme nous allons le voir ci-après.
Exemple 2 : considérons à présent une autre transformation non linéaire. Supposons que le vrai processus générateur des données soit l’un des modèles suivants :
Modèle 1 :
où 0 1 0< < ≥ρ ϕet
Modèle 2 :
où 0 1 0< < ≥ρ ϕet
Modèle 3 :
Ces trois modèles appartiennent à la famille des modèles autorégressifs à seuil introduits par Ozaki (1978). Ils exhibent des dynamiques observées empiriquement pour certaines variables macroéconomiques ou financières. Dans ces modèles, l’absence de stationnarité due à la présence d’une racine unitaire dans l’un des sous-régimes n’est qu’une propriété “locale”. Il existe des forces de rappel vers l’équilibre de long terme. Dans l’équation (5), le processus étudié n’est pas stationnaire tant que X ∈ -[ ,ϕ ϕ], mais le devient dès que l’on sort de cet intervalle. On voit apparaître ici le phénomène de “dépendance temporelle” dû au fait que la valeur de X à une date donnée dépend de l’écart atteint à la période précédente entre X et sa valeur de long terme. L’une des façons de prendre en compte cette propriété consiste ici à introduire des seuils qui déterminent le régime dans lequel X évolue. L’équation (6) décrit un cas plus général. Le modèle est a priori non stationnaire dans l’intervalle[ ,- ϕ ϕ], mais redevient stationnaire dès que X prend des valeurs en dehors de cet intervalle. À la différence de l’équation (5), il n’y a pas une valeur d’équilibre pour X, mais un corridor à l’intérieur duquel ses valeurs sont circonscrites. Ce corridor correspond à l’intervalle[ ,- ϕ ϕ]. Dans l’équation (7), chaque régime possède une racine unitaire, mais le processus reste stationnaire en raison des constantes - θ et θqui ramènent la variable X vers son corridor d’équilibre.
Dans les trois types de modèles envisagés, la stationnarité peut être établie de manière analytique en se référant aux conditions d’ergodicité des processus SETAR [3] introduits par Chan et alii (1985). Considérons ainsi le modèle général suivant :
θu et θl sont des valeurs de seuil. μ μ,, ε ε t t t sont des μ ρ ρ ρ u m l u m l, , et sont des paramètres. ε u m l, et processus iid. Le processus { } zttT=1 est ergodique (donc stationnaire) si l’une des cinq conditions suivantes est vérifiée :
On peut noter que dans les conditions (i) à (v), le signe des constantes est important pour garantir la stationnarité du processus. Dans le cas de l’équation (7) par exemple, c’est la condition (iv) qui est vérifiée. Notons en effet que, compte tenu du fait que dans l’un des régimes extrêmes z X t d t- - ( )ici1 prend des valeurs négatives, la condition sur le signe des constantes s’écrit μ μ u l < <0.
À partir de ces équations, on remarque donc que l’existence d’une racine unitaire dans un modèle linéaire n’est pas une propriété suffisante de la non stationnarité d’une variable. Ceci vaut en particulier si la linéarité n’est ici qu’une propriété “locale” de la dynamique sous-jacente à la variable étudiée. Pour des applications de ce type de spécification à la macroéconomie, voir Dufrénot et Mignon (1999,2002).
Exemple 3 : supposons que le vrai processus générateur des données soit le suivant :
Xt étant le processus de marche aléatoire sans dérive décrit par l’équation (1). On suppose que εt (défini dans l’équation (1)) et ηt sont indépendants. En posant Y0 0=, nous avons :
De plus, pour k =0 nous avons :
La variance de Yt varie donc avec le temps puisque Xt est un processus de marche aléatoire. Cependant, en raison de la propriété (10),Yt est un processus iid de moyenne nulle et de variance hétéroscédastique. Notons que si Yt était une marche aléatoire, la covariance entre deux observations Y Y t t k et- aurait été égale à ( ) ( )t k V Yt -, c’est-à-dire qu’elle aurait été non stationnaire elle aussi. En outre, il est aisé de voir que ΔY Y Y t t t = --1 est faiblement stationnaire (c’est-à-dire que ses deux premiers moments sont finis).
Considérons tout d’abord E Yt ( )Δ :
Sous les hypothèses précédentes ( ( ) , ( )E E t t ε η= =0 0, indépendance de ε η t t et ) et sachant que le produit d’un processus iid et d’une marche aléatoire sans dérive suit une loi iid, on en déduit que :
Calculons à présent la variance de ΔYt :
Il est facile de constater que les termes en covariance s’annulent sous les hypothèses suivantes :
  1. εt est iid et si ηt est iid, alors le produit ε η t t est aussi iid (la loi du produit est différente de celle des termes individuels) ;
  2. cov( , )η ε t t =0, ce que nous avons posé comme hypothèse de départ ;
  3. Yt est iid, ce que nous avons en raison de la condition (10) ;
  4. le produit ηt t X est iid quel que soit t.
Par conséquent, il reste :
Puisque X X idd t t t t = + -1 2 0ε ε σε où ( , ), nous avons :
Par conséquent :
Considérons à présent le carré de Yt :
On vérifie aisément que (18) est un processus intégré d’ordre 1 en raison du terme ση2 2 Xt (voir l’exemple 1). Par conséquent, l’erreur commise dans l’interprétation lorsque l’on étudie le caractère non stationnaire d’une série en retenant un cadre linéaire dépend du type de non linéarité que l’on omet.
Notons que d’autres formes de modèles non linéaires pourraient être évoquées. Par exemple, Van Dijk et Franses (1997b) montrent que l’omission des non linéarités présentes dans les modèles à transition douce (STAR) conduit à des interprétations erronées en termes de stationnarité. Peel et alii (1997) aboutissent à la même conclusion. Puisque les modèles STAR sont une généralisation des modèles TAR (Threshold Autoregressive) considérés dans les exemples précédents, on doit donc s’attendre à retrouver le même type de difficultés.
Certains travaux de la littérature se sont posés le problème d’étendre au cas non linéaire l’étude de la non stationnarité des variables. Différents auteurs ont montré que l’utilisation du concept de racine unitaire était mal adaptée au cas des séries non linéaires (voir Granger et Hallman, 1991; Ermini et Granger, 1993). Les différentes approches alternatives qui ont été suggérées sont exposées dans le paragraphe qui suit.
Caractérisation générale de la mémoire des séries temporelles
Granger et Teräsvirta (1993) ont été les premiers à proposer une définition de la mémoire d’une série temporelle dans un contexte non gaussien au travers du concept de mémoire étendue. La notion de mémoire étendue correspond à la notion de mémoire longue dans le cas linéaire.
Définition de la mémoire étendue au sens de Granger
Soit une variable aléatoire Xt générée par un processus stochastique xt et soit F x P X x I k t k t ( ) ( )= ≤ + la fonction de distribution conditionnelle de la variable aléatoire. Un processus xt n’a pas de mémoire étendue si k → ∞ lim ( ) k F x ne dépend pas du passé conditionnel, It.
Bien que théoriquement attractive, cette définition reste cependant difficilement vérifiable en pratique. On retrouve ainsi le même type de difficultés que celles rencontrées lorsque l’on tente d’appliquer la notion de causalité au sens de Granger. Pour faire face à ce problème, Aparicio et Escribano (1997,1999) ont proposé une définition différente de la notion de mémoire. Ils introduisent une nouvelle mesure de dépendance sérielle constituant une généralisation de la fonction d’autocorrélation. La définition de ces auteurs est fondée sur un concept permettant de mesurer la persistance d’une série et est présentée ci-après.
Définition de la mémoire au sens de Aparicio et Escribano
Soit i k t x ( , ) une mesure non négative de dépendance sérielle tenant compte de la structure de dépendance de long terme des séries temporelles. Alors :
  • le processus Xt exhibe un comportement de retour à la moyenne si
  • le processus Xt est un processus à mémoire courte si
  • le processus Xt est un processus à mémoire longue si
  • le processus Xt est intégré d’ordre d si
  • ,∀ t, et si d est le plus petit réel positif tel que
  • k >0 t, ∀avecZ L X t t = -( )1. d
La quantité
estdéfiniecommeuneformedepersistancenonlinéaire. Entermesheuristiques, on peutconsidérer qu’une série à mémoire longue est une série pour laquelle la dépendance sérielle est forte parce que le passé lointain exerce encore une influence sur les valeurs présentes des variables : une série à mémoire longue est ainsi caractérisée par une décroissance hyperbolique des autocorrélations [4]. Tout le problème réside dans le fait de pouvoir mesurer la dépendance sérielle sans recourir aux fonctions d’autocorrélation et d’autocorrélation partielle qui ne prennent pas en compte les moments d’ordre supérieur à deux pour caractériser la dynamique des séries. Différents estimateurs de la fonction i k t x ( , ) peuvent être retenus. En premier lieu, on peut utiliser tout estimateur des moments ou des cumulants d’une série dont l’ordre est supérieur à deux. Ainsi, Brooks et Hinich (1997) retiennent comme mesure de corrélation non linéaire un estimateur du cumulant d’ordre trois des séries :
Cette approche est généralisable au cas de cumulants d’ordres supérieurs à trois. En pratique cependant, les tests développés ne considèrent que les cumulants d’ordres 3 et 4 en raison des difficultés soulevées lorsque l’on tente de dériver analytiquement l’expression et les propriétés des lois suivies par les statistiques servant à tester l’hypothèse de linéarité : l’approche utilisée est très souvent celle de l’analyse spectrale non linéaire (pour une illustration, voir Dufrénot et alii, 1998, et Dufrénot et Mathieu, 2000).
En second lieu, il existe une série d’estimateurs basés sur le calcul d’entropies à partir de la théorie de l’information (voir Aparicio et Escribano, 1997; Aparicio-Acosta, 1998; Escribano et Mira, 1998). Rappelons que l’entropie a pour objet de fournir une certaine mesure attachée à l’incertitude liée à l’apparition ou non d’un événement particulier.
Supposons que l’on dispose d’une partition P d’un ensemble S avec M événements A i M i, ,...,=1, et que l’événement Ai apparaisse avec une probabilité pi. L’entropie de cette partition, notée H P( ), est alors donnée par :
Il est également possible de définir l’entropie conditionnelle de P sachant M de la manière suivante :
En général, les événements M peuvent fournir de l’information utile concernant les événements de P. Cette information mutuelle peut alors être quantifiée par :
Cette expression stipule ainsi que l’observation de M réduit l’incertitude attachée à P de H P( ) à H P M( | ) : l’information que fournit M à propos de P est donc simplement I P M( , ).
Ces définitions introduites pour des partitions données d’ensembles peuvent être aisément transformées pour s’appliquer à des variables aléatoires (voir Aparicio et Escribano, 1997). L’intérêt de ces concepts réside dans le fait que l’information mutuelle d’une paire de variables aléatoires peut être interprétée comme une mesure générale de dépendance entre ces deux variables. Cette notion est donc plus générale que celle de corrélation qui mesure simplement la capacité d’une variable à prévoir linéairement l’autre variable. De manière similaire, il est possible de généraliser le concept de fonction d’autocorrélation standard par le biais de la fonction d’information mutuelle. Ainsi, en écrivant la fonction d’information mutuelle de xt comme :
X est une variable aléatoire, on en déduit immédiatement les nouvelles définitions de retour à la moyenne, de mémoire courte, de mémoire longue et d’intégration :
  • le processus Xt exhibe un comportement de retour à la moyenne si
  • le processus Xt est un processus à mémoire courte si
  • le processus Xt est un processus à mémoire longue si
  • le processus Xt est intégré d’ordre d si
  • t, ∀, etsidestlepluspetitréelpositiftelque
  • k >0 avec Z L X t d t = -( )1.
Définition de la mémoire d’une série à partir des concepts de mélange et de dépendance proche
Cette approche alternative a été notamment étudiée par Escribano (1997) et Escribano et Mira (1998) et repose sur l’intuition suivante. Le concept usuel de série intégrée d’ordre 0 est un cas particulier d’une notion plus générale qui est celle de série fortement mélangée dont la définition est rappelée ci-après.
Soit Xt une séquence de variables aléatoires.
Soit ℑ ≡ st s t σ υ υ( ,..., ) et :
Alors Xt est fortement mélangée si et seulement si αm → 0 quand m → ∞.
Une séquence fortement mélangée (α- mixing) est ainsi telle que des sous-séquences non imbriquées deviennent indépendantes lorsqu’elles deviennent suffisamment éloignées. En d’autres termes, le concept de α-mixing introduit par Rosenblatt (1974), mesure la dépendance entre des événements séparés par au moins m périodes. Un concept fortement lié à celui-ci est la notion de dépendance proche (Near Epoch Dependence, noté NED par la suite) dont la définition est donnée ci-après.
Soit une séquence Xt de variables aléatoires de variance finie pour tout t. Définissons :
où |.|2 est la norme d’une variable aléatoire définie par E1 2 2/ |.|.
Alors Xt est ϕ-NED sur une séquence fortement mélangée υt si et seulement si ϕm → 0quand m → ∞ (voir Escribano, 1997, et Escribano et Mira, 1998, pour une étude détaillée).
On suppose ici que les valeurs futures de υt n’améliorent pas l’espérance conditionnelle de Xt. Cette définition montre queϕ( )m est la plus mauvaise erreur quadratique moyenne de prévision lorsque Xt est prévu à l’aide de E Xt t m t m ( | ,..., )υ υ - +. À partir de cette notion de NED, il est possible dereformuler la notion d’intégration.
Ainsi, une série {Xt } est intégrée d’ordre 0 si elle est NED sur une série sous-jacente fortement mélangée{υt } et si la série {wt } des sommes partielles n’est pas NED, avec :
Dans ce cas, on dira que wt est intégrée d’ordre 1.
Cetteconception de l’intégration d’ordre 0 basée surleconcept de série fortement mélangée ou de ϕ-NED est liée aux notions de mémoire courte en distribution et de mémoire courte en moyenne de Granger et Hallman (1991), Granger et Teräsvirta (1993) et Granger (1995). Tout comme ces autres notions, elle présente l’inconvénient d’être difficilement applicable en pratique. De ce point de vue, la notion de mémoire au sens de Aparicio et Escribano (1997,1999) présente l’avantage d’être beaucoup plus opérationnelle.
Nous avons ici présenté les diverses possibilités d’étendre la notion de mémoire au cadre non linéaire. Nous nous proposons à présent de traiter du cas multivarié par le biais d’une étude de la cointégration non linéaire.
 
La cointégration non linéaire
 
 
La littérature relative à la cointégration dans le cas des processus non linéaires a donné lieu à deux types de travaux. Certains auteurs se sont principalement intéressés à tenter de généraliser au cas bivarié les concepts exposés ci-dessus. C’est notamment le cas de Granger et Hallman (1991) qui suggèrent une généralisation de la cointégration au cas non linéaire basée sur la notion de mémoire étendue ou de Escribano et Mira (1998) qui appliquent au cas bivarié les mesures basées sur la théorie de l’information et les notions de dépendance proche. Indépendamment de ces généralisations, une autre série de travaux a plutôt cherché à comprendre (à partir du concept usuel d’intégration) les implications relatives à la façon de combiner les dynamiques de court terme et de long terme. C’est par la présentation de cette deuxième approche que nous allons débuter dans la mesure où elle nous semble plus intuitive.
Les deux types de modèles à correction d’erreur non linéaires
La différence entre les modèles linéaires et les modèles non linéaires repose en premier lieu sur la manière dont on modélisela “cible” dans un modèle à correction d’erreur. Dans lecadre linéaire standard, on introduit l’erreur, ou si l’on préfère l’écart à la cible de long terme, en considérant la combinaison linéaire de deux variables. Nous avons par exemple, en considérant deux séries X et Y :
Dans ce cas, la cible est donnée par l’égalitéY a X t t = lorsque l’écart zt s’annule.
Dans le cas non linéaire, la relation de long terme entre Y et X est donnée à partir d’une formulation plus générale du type :
f et g sont deux fonctions non linéaires. Dans ce cas, le terme à correction d’erreur s’écrit :
Comment s’écrit dans ce cas l’équation comportant le mécanisme de correction d’erreur ?
Supposons que nos deux variables suivent chacune un processus non linéaire, par exemple :
où {εtX } et {εtY } sont deux processus stationnaires. Si X et Y sont non stationnaires, elles sont rendues stationnaires en appliquant la différence suivante :
Le modèle à correction d’erreur s’écrit alors :
z f Y g X= -( ) ( ) et νXt et νYt sont deux processus stationnaires.
On constate que dans (34) et (35), l’écriture du modèle à correction d’erreur n’est pas modifiée par rapport à celle d’un modèle linéaire. Seule change la définition du terme d’erreur z. Cette façon d’interpréter l’hypothèse de cointégration non linéaire dans le cadre des modèles à correction d’erreur est celle qui a été privilégiée dès le départ (voir notamment Granger et Teräsvirta, 1993).
Il existe cependant une seconde interprétation de la cointégration non linéaire dans le contexte des modèles à correction d’erreur qui renvoie à un problème tout à fait distinct. On ne s’intéresse pas à la définition de la cible, mais au mécanisme d’ajustement temporel qui y mène. La critique énoncée à l’égard des modèles à correction d’erreur linéaires est la suivante. Dans ces modèles, le caractère linéaire du processus d’ajustement ne permet pas de rendre compte de certains phénomènes observés en réalité : l’existence de rigidités, l’existence de dynamiques asymétriques, la propriété de dépendance temporelle qui implique que le “chemin” suivi pour atteindre la cible de long terme dépend de la valeur courante des variables. Pour tenir compte de ces phénomènes, on introduit alors un mécanisme d’ajustement non linéaire. Considérons le cas simple où les deux variables X et Y sont non stationnaires et suivent chacune un processus linéaire. Dans ce cas, le modèle à correction d’erreur s’écrit :
z Y X t t t = - α et F est une fonction non linéaire. Comme on le constate, la définition de la cible n’est pas modifiée parrapport au cadre linéaire. En revanche, l’écriture du processus d’ajustement tient compte du fait que le mécanisme qui mène à la cible peut être non linéaire.
Naturellement, il est possible de combiner les deux interprétations en introduisant de la non linéarité pour modéliser à la fois la cible et le mécanisme d’ajustement.
Comment estimer les modèles à correction d’erreur non linéaires ?
Escribano (1997) et Escribano et Mira (1998) ont établi un certain nombre de conditions permettant de généraliser la procédure d’estimation de Engle et Granger (1987) au contexte non linéaire. Le modèle à correction d’erreur non linéaire peut ainsi être estimé au moyen d’une procédure en deux étapes. À l’aide de simulations de Monte Carlo, les auteurs montrent que lorsque la relation de cointégration est linéaire, mais que le terme à correction d’erreur est non linéaire, le biais de l’estimateur des moindres carrés ordinaires du vecteur de cointégration est faible pour de petits échantillons (100 et 200 observations). Ces résultats restent valables lorsque les moindres carrés ordinaires sont également utilisés dans l’estimation de ladeuxième étape. Cependant le biais a tendance à être plus élevé lorsqu’est utilisée l’estimation par les moindres carrés non linéaires dans la seconde étape. Dans ces conditions, il est préférable de travailler sur des échantillons de taille supérieure à 500 observations. Néanmoins ces différentes conclusions relatives à l’estimation et à l’inférence dans les modèles à correction d’erreur non linéaires sont basées sur des procédures paramétriques (moindres carrés ordinaires ou non linéaires) valables lorsque la forme fonctionnelle non linéaire est connue. Bien évidemment, en pratique, une telle forme n’est pas connue et Escribano (1997) suggère alors l’utilisation d’une procédure d’estimation semi-paramétrique basée sur les fonctions spline lisses (voir infra).
Intéressons nous à présent à la deuxième approche de la cointégration non linéaire visant à généraliser les concepts introduits dans le cas univarié.
Les travaux généralisant les concepts introduits dans le cas univarié
Les prolongements de la théorie de l’information au cas bivarié
Nous avons précédemment (voir la deuxième section de la première partie) introduit une généralisation du concept de fonction d’autocorrélation par le biais d’une mesure de dépendance sérielle que nous avions notée i k t X ( , ). Rappelons que cette mesure permet de tenir compte de la structure de dépendance de long terme présente dans la série étudiée. Il est alors possible, à la suite de Aparicio et Escribano (1997), de donner une nouvelle définition de la cointégration à partir d’une telle mesure.
Soient deux séries Xt et Yt présentant une mémoire longue et soit i k t X Y, ( , ) une mesure générale de dépendance sérielle croisée entre Xt etYt. Alors, Xt etYt sont cointégrées si :
Quatre types de remarques peuvent être effectués à la suite de cette définition :
  • cette définition montre que, sous l’hypothèse de cointégration, le passé lointain de Yt est aussi utile que le passé lointain de Xt dans la prévision de long terme de Xt;
  • cette caractérisation générale de la cointégration est en outre basée sur des comportements limites différents de i k t X Y, ( , ) eti k t X ( , )en cas de non cointégration. On comprend bien en effet que si Xt et Yt sont cointégrées, on ne peut pas avoir de taux de convergence différents pour i k t X ( , )et i k t X Y, ( , ). En conséquence, si les taux de convergence diffèrent, ceci peut fournir une mesure du degré de non cointégration (voir Aparicio et Escribano, 1997) ;
  • il est bien évident que si l’on remplace i k t( , ) par la fonction d’autocorrélation de X et i k t( , ) par le Xt X Y, corrélogramme croisé de Xt et Yt, cette définition de la cointégration se réduit à la définition usuelle de la cointégration linéaire fournie par Granger (1981) ;
  • enfin, on peut noter que si les séries Xt et Yt sont cointégrées en vertu de la définition précédente, alors la séquence des sommes partielles :
  • diverge quand n → ∞ (la démonstration figure dans Aparicio et Escribano, 1997).
Il est alors possible d’établir un test de cointégration à partir des calculs d’entropie. Pour cela, considérons la quantitésuivante(qui est un estimateur dela fonction d’information mutuellede la série xt, voir équation (23)) :
et N est la taille de l’échantillon, γγ ≥ =0, N N pour N pair et N N γ γ= + pour N impair. $ (.,.), fy x et $ (.)fx sont respectivement les fonctions de densité bivariée et univariée. L’ensemble S est introduit simplement afin de tenir compte de certaines exclusions évidentes (telles qu’un logarithme d’un nombre négatif). Concernant l’estimation des densités, on pourra se reporter à Breiman, Meisel et Purcell (1977) ainsi qu’aux développements figurant dans Aparicio et Escribano (1997).
À partir de cet estimateur et de la définition de la cointégration non linéaire, il est possible de construire un test de cointégration basé sur la statistique suivante :
m est suffisamment grand pour tenir compte de la dépendance de long terme, q est tel que m q N+ < et N est la taille de l’échantillon.
Comme on l’a vu précédemment, si les séries xt et yt sont cointégrées, alorsi k t x y, ( , ) doit être du même ordre de grandeur que i k t x ( , ) pour k suffisamment grand. À l’inverse, si les séries ne sont pas cointégrées, alors i k t i k t x y x, ( , ) ( , )<<. En cas de non cointégration, les valeurs de τm q x y, ( , ) doivent donc tendre vers l’unité.
Aparicio et Escribano (1997) ont proposé une application empirique de ces différents concepts issus de la théorie de l’information. Ils ont en particulier cherché à calculer la statistique τm q x y, ( , ) sur diverses séries de taux de change (Peseta/$, Peseta/Yen et Peseta/DM) ainsi que sur deux séries de rentabilités boursières relatives à une société d’alimentation japonaise. Ces séries comportent 1000 observations quotidiennes et les auteurs ont retenu une valeur de m égale à 10 (cette valeur permet de prendre en compte la majeure partie de la dépendance existant dans les différentes séries). Pour chacune de ces séries, l’application des tests de Dickey-Fuller conduit à retenir la présence d’une racine unitaire. L’application de ces mêmes tests usuels en tant que tests de cointégration sur les séries résiduelles issues des régressions statiques entre, d’une part, les taux de change et, d’autre part, les rentabilités boursières conduit les auteurs à accepter l’hypothèse de cointégration uniquement pour les séries de rentabilités boursières. Cependant, Aparicio et Escribano (1997) montrent qu’une telle conclusion est erronée dans la mesure où l’application de leur nouveau test de cointégration les conduit à accepter l’hypothèse de cointégration non seulement pour les séries de rentabilités boursières, mais également pour les séries de taux de change.
Les extensions de la notion de série fortement mélangée au cas bivarié
À partir de la définition du concept d’intégration basée sur la notion de série fortement mélangée (voir la deuxième section de la première partie), il est possible d’établir la définition suivante de la cointégration non linéaire.
Deux séries {y } et {x } sont non linéairement cointégrées de fonction de cointégration non linéaire g (.,., )γtt γest le paramètre de cointégration si g y x t ( , , )γ* est NED sur une certaine série fortement mélangée et si t g y x t t ( , , )γ n’est pas NED pour γ γ*.
À partir de cette définition, Escribano et Mira (1998) vont énoncer la généralisation suivante du théorème de représentation de Granger.
Théorème 1 : soit un vecteur( ) ( , )N X y x X t t t t × = ''1 où yt est un scalaire et xt un vecteur( )N - ×1 1. Soit le modèle à correction d’erreur non linéaire donné par :
où :
  • ε est une martingale de moyenne nulle et de variance constante, εxt est un vecteur fortement mélangé de yt matrice de variance-covariance constante ;
  • le déterminant 1 0 1 - - - =a L a L p p... a toutes ses racines en dehors du cercle unité ;
  • la fonction f z( , )γ est continûment différentiable sur z ;
  • Δ xt yt et ε ainsi que les produits croisés ont des moments d’ordre deux finis.
Alors :
  • Xt est un vecteur de composantes intégrées d’ordre 1 ;
  • zt est ϕ-NED et y x t t et sont cointégrées avec comme vecteur de cointégration ( , )1 - 'α.
Dans les modèles à correction d’erreur non linéaires, l’hypothèse nulle d’absence de cointégration peut s’écrire : f zt ( , ) - = 1 0γ et l’hypothèse alternative de cointégration : f zt ( , ) - ≠ 1 0γ et
Le choix de la fonction f peut être de deux types : une spécification paramétrique et une spécification semi-paramétrique. Dans le cas paramétrique, Escribano (1997) suggère dans un premier temps de choisir pour la fonction f une forme fonctionnelle polynômiale d’ordre faible, comme par exemple une forme cubique. Selon lui, une telle forme présente plusieurs avantages :
  • la première justification est basée sur les tests du multiplicateur de Lagrange : pour tester l’hypothèse nulle de linéarité contre l’hypothèse alternative de non linéarité, la mise en œuvre du test est basée sur des fonctions polynômiales d’ordre peu élevé (voir notamment Tsay, 1986) ;
  • en second lieu, de telles formes fonctionnelles polynômiales peuvent être utilisées en tant que règles de décision pour sélectionner des modèles de séries temporelles paramétriques non linéaires. Un exemple est notamment fourni par le choix entre un modèle autorégressif à transition douce (STAR) et un modèle à transition douce (STR) ;
  • en troisième lieu, ces formes fonctionnelles polynômiales peuvent être utilisées afin de détecter des phénomènes d’asymétrie et des effets de seuils ;
  • enfin, elles peuvent servir à vérifier la condition de stabilité de l’ajustement non linéaire.
Néanmoins, comme le rappelle Escribano (1997), les formes fonctionnelles polynômiales ne peuvent que constituer des approximations du vrai processus générant les données dans la mesure où elles ne sont pas bornées : elles ne vérifient pas asymptotiquement la condition de stabilité, même si elles la vérifient en échantillon. Pour résoudre cette difficulté, l’auteur suggère une nouvelle classede modèles de séries temporelles basés sur des fonctions polynômiales rationnelles d’ordre faible satisfaisant la condition de stabilité et vérifiant les propriétés précédemment énoncées des formes fonctionnelles polynômiales. Un exemple simple de forme polynômiale rationnelle est donné par :
Dans ce cas, si γ γ 2 13 = - et si( )γ γ 32 4 0+ ≠ alorsf z( , )= =0 0γ est l’équilibre. L’ajustement peut alors être asymétrique et/ou non linéaire.
Il est également possible d’avoir des polynômes rationnels présentant des équilibres multiples, comme par exemple :
Dans ce cas, si γ γ 2 13 = - alorsf z( , )= =0 0γ,f z( , )=- =γ γ 3 0 etf z( , )γ ≅ 0 pour tout z ∈ ( , )03 γ. On peut ainsi avoir un continuum d’équilibres entre 0 et γ3.
Notons enfin qu’il est également possible, concernant le choix de la fonction f, de retenir une spécification semi-paramétrique. Dans ce cadre, Escribano (1997) suggère d’utiliser les fonctions smoothing splines (sur ce point et pour une application empirique à la demande de monnaie, voir Escribano, 1997).
 
Une brève revue des travaux empiriques relatifs à la cointégration non linéaire
 
 
Les travaux empiriques relatifs à l’application de la cointégration non linéaire sont relativement rares dans la littérature et portent principalement sur l’estimation de modèles à correction d’erreur non linéaires. Un des premiers auteurs à avoir appliqué de tels modèles est Escribano (1986) sur la fonction de demande de monnaie en Grande-Bretagne.
Les travaux pionniers : l’étude de la demande de monnaie en Grande-Bretagne
Escribano (1986) a estimé un modèle à correction d’erreur non linéaire sur la fonction de demande de monnaie en Grande Bretagne sur la période 1878-1970. Ce modèle a été repris et appliqué sur les mêmes données par Hendry et Ericsson (1991). Ces derniers ont ainsi retenu la forme à correction d’erreur suggérée par Escribano (1986) dans la spécification de la demande de monnaie comme alternative à la spécification linéaire proposée notamment par Friedman et Schwartz (1982). Avant de présenter leurs résultats, nous allons exposer brièvement la méthodologie utilisée en pratique pour estimer un modèle à correction d’erreur non linéaire :
  • dans une première étape, on estime un modèle à correction d’erreur linéaire. On applique ensuite des tests de bonne spécification visant à appréhender l’hypothèse nulle de modèle à correction d’erreur linéaire contre l’hypothèse alternative de modèle à correction d’erreur non linéaire. On peut ici appliquer des tests du multiplicateur de Lagrange, du rapport de vraisemblance ou encore de Wald. Si l’hypothèse nulle est rejetée, on passe à la deuxième étape ;
  • la deuxième étape a pour objet l’estimation du modèle à correction d’erreur non linéaire. À cette fin, on peut soit estimer différentes spécifications paramétriques, soit utiliser une procédure semi-paramétrique afin d’identifier le type de fonction non linéaire ;
  • la troisième et dernière étape consiste alors en l’application de divers tests de bonne spécification de la représentation à correction d’erreur non linéaire : tests d’autocorrélation des résidus, d’homoscédasticité, de non constance des paramètres, etc.
Avant de s’attacher à la modélisation non linéaire de la demande de monnaie en Grande-Bretagne, Hendry et Ericsson (1983) avaient procédé à l’estimation d’un modèle à correction d’erreur linéaire. Leurs résultats obtenus figurent dans la deuxième colonne du tableau 1.
On constate que la spécification linéaire de Hendry et Ericsson (1983) nécessite l’introduction d’une variable dichotomique “artificielle” difficilement justifiable ( )D. Celle-ci a pour objet de prendre en compte le 2 phénomène de “changement de préférence pour la liquidité" (liquidity preference shift) - selon la terminologie de Friedman et Schwartz (1982) - résultant de la dépression économique et de la guerre (1921-1955). Cette insuffisance a conduit Escribano (1986) à estimer un modèle à correction d’erreur non linéaire sur les mêmes données : les résultats figurent dans la dernière colonne du tableau 1. On constate que le modèle intègre de façon non linéaire les résidus issus de la relation de cointégration dans la mesure où Escribano (1986) retient une forme polynômiale cubique pour le terme à correction d’erreur. Les résultats obtenus montrent alors que la prise en compte de cet ajustement cubique vers la cible de long terme permet de supprimer la variable D. Cela réduit en 2 outre la somme des carrés des résidus et augmente la valeur du coefficient de détermination. Ultérieurement, Hendry et Ericsson (1991) ont explicitement reconnu la supériorité du modèle estimé par Escribano (1986) par rapport au leur en termes de pouvoir explicatif de la dynamique de la demande de monnaie en Grande-Bretagne. Ils ont alors procédé (en 1991) à l’estimation d’un modèle à correction d’erreur non linéaire en retenant, tout comme l’avait fait Escribano (1986), une forme polynômiale cubique pour le terme à correction d’erreur ; celui-ci s’écrit : - - - - 2 55 0 2 1 12, ( , )U U t t. Les auteurs montrent que le modèleestimé passe tous les tests de bonne spécification et qu’il possède un pouvoir explicatif nettement supérieur au modèle à correction d’erreur linéaire. Notons de plus que les tests réalisés par la suite par Escribano (1997) sur le modèle à correction d’erreur linéaire l’ont conduit à rejeter l’hypothèse nulle de linéarité en faveur d’une modélisation à correction d’erreur non linéaire.

Tableau 1
modélisation de la demande de monnaie en Grande-Bretagne
IMGIMGTableau 1 : modélisation de la deman...IMGIMF
Tableau 1 : modélisation de la demande de monnaie en Grande-Bretagne Hendry et Ericsson (1983) Escribano (1986) ECM linéaire ECM non linéaire Endogène : Δ( )m pt - Endogène : Δ ( )m pt - Régresseurs Δ21 ( )m pt -- 0,37 (7,4) Δ22 ( )m pt -- -0,06 (-0,8) Δ( )m pt --1 0,45 (6,1) Δ( )m pt --2-0,16 (-3,0) Δ( )m pt --3 0,08 (1,7) 1 44 Δ it 0,64 (4,3) Δ it 0,08 (1,7) Δ2 pt-0,47 (-11,7) Δ22 pt- -0,14 (-2,0) Δ pt-0,61 (-13,8) Δ pt-1 0,37 (7,0) Δ R Lt-0,01 (-1,8) 1 22 Δ R Lt-3,3 (-3,0) Δ RSt-0,008 (-3,7) ( )m i pt - --4-0,20 (-10,0) RSt-0,78 (-4,3) D1 1,9 (2,4) 0,04 (4,4) D2 3,6 (6,0) D3 0,6 (0,7) 0,04 (6,1) Ut-1-0,018 (-0,6) Ut-12 0,5 (3,3) Ut-13-2,18 (-2,3) Const. -0,086 (0,7) 0,004 (1,6) R2 0,82 0,87 SCR 1,7 % 1,4 % Les variables en minuscules sont les logarithmes des variables en majuscules. M est le stock de monnaie, I est le produit national net, P est le déflateur du revenu national net, RS est le taux d’intérêt à court terme, RL est le taux d’intérêt à long terme. D est une variable dummy pour la première guerre 1 mondiale, D est une dummy pour la seconde guerre mondiale et D est une dummy pour le phénomène de changement de préférence pour la liquidité. 32 U représente les résidus estimés de la régression de ( )m p i- - sur RS et une constante. Const. est la constante. Entre parenthèses figurent les t de tt Student des coefficients estimés, SCR est la somme des carrés des résidus.

Toujours sur les mêmes données, Escribano (1997) a prolongé l’analyse en s’intéressant plus en avant aux formes fonctionnelles paramétriques et non paramétriques des modèles à correction d’erreur non linéaires : fonctions polynômiales rationnelles et fonctions smoothing splines (voir deuxième section de la deuxième partie). La méthode reposant sur les smoothing splines permet ainsi d’estimer la fonction non linéaire régissant l’ajustement vers la cible de long terme. En appliquant cette procédure, Escribano (1997) obtient la valeur optimale du paramètre de lissage et effectue la représentation graphique de l’ajustement non linéaire. Cette étape lui permet de mettre en évidence l’existence de deux équilibres autour de U U= =0 0 2et ,, où Ut sont les résidus de la relation de cointégration estimée. L’intervalle allant de 0 à 0,2 est alors interprété comme l’ensemble des équilibres multiples de long terme de la demande de monnaie. En augmentant la valeur du paramètre de lissage, c’est-à-dire en imposant une contrainte de lissage forte, Escribano (1997) montre que l’ajustement vers la cible de long terme devient linéaire et est biaisé vers la valeur U =0 2,. Ce résultat est particulièrement intéressant dans la mesure où il permet de comprendre pourquoi les modèles linéaires initialement estimés nécessitaient l’introduction fortement critiquable de la variable dichotomique D2 (pour plus de développements sur ce point, voir Escribano, 1997).
Cointégration à seuil
D’autres travaux tels que ceux de Balke et Fomby (1995), Van Dijk et Franses (1997b) ainsi que Dufrénot et Mignon (1999,2002) se sont attachés à étendre le concept de cointégration au cas des modèles à seuil. On peut par ailleurs mentionner que la fonction de demande de monnaie préalablement étudiée peut aussi avoir une interprétation dans ce cadre de modèles de cointégration à seuil : il suffit pour cela de retenir la variable de changement de préférence pour la liquidité comme variable de seuil.
Dufrénot et Mignon (1999)ont cherché à expliquerla dynamique du taux d’épargne des ménages en Francesur la période 1970 à 1996 et ont montré que l’hypothèse d’un modèle à seuil semblait adéquate pour traduire les dynamiques asymétriques dans les relations existant entre l’épargne et certains de ses déterminants : le taux de chômage et le taux d’inflation notamment. Plus spécifiquement, les auteurs considèrent que la cible de long terme du taux de consommation ( )ct répond à un modèle SETAR(2,1,1) du type :
xt peut désigner soit le taux d’inflation, soit la variation du taux de chômage, Rt est le revenu et σ est un paramètre de seuil.
On peut aisément expliquer l’existence d’une relation asymétrique entre la consommation et le taux de chômage à long terme. En adaptant ici un argument à la Carroll et Summers (1991), on peut faire l’hypothèse suivante. La consommation étant une variable procyclique, il n’est pas difficile d’imaginer que son niveau puisse varier avec le cycle de l’activité. Le cas de figure le plus simple à considérer est celui où l’on sépare les périodes d’activité en deux régimes correspondant respectivement aux phases d’expansion et de dépression du cycle. Si l’on admet que le taux de chômage est un bon indicateur du cycle de l’activité, alors l’hypothèse d’un effet asymétrique dans la dynamique de long terme entrela consommation et le taux de chômageest décrit àpartir de l’équation précédente (où xt désigne la variation du taux de chômage) : l’aversion au risque de chômage n’est évidemment pas la même selon que la conjoncture est bonne ou mauvaise. S’agissant à présent des liens entre la consommation et le taux d’inflation, les comportements de fuite devant la monnaie, ou au contraire de reconstitution des encaisses réelles, sont conditionnés par l’état de la conjoncture. En période de stagflation, les ménages peuvent rencontrer certaines difficultés à vouloir dépenser leurs revenus, faute de réponse des entreprises dont les carnets de commande sont vides. On observe dans ce cas un comportement correspondant à un effet de richesse que les ménages “s’imposent” compte tenu de la conjoncture. De façon symétrique, les phases d’expansion étant plus propices aux dépenses de consommation, on peut penser qu’une hausse des prix durant cette période accélère les comportements de fuite devant la monnaie. L’hypothèse d’une relation asymétrique à long terme entre la consommation et le taux d’inflation peut donc être étudiée à partir du modèle SETAR(2,1,1) précédemment mentionné en supposant que xt désigne le taux d’inflation.
La procédure suivie consiste à estimer les relations (47) par la méthode des moindres carrés ordinaires puis à utiliser les résidus des modèles estimés pour spécifier un modèle SETAR(2,1,1) :
où $zt sont les résidus de la régression (47) dans laquelle xt désigne le taux d’inflation ,
où $zt sont les résidus de la régression (47) dans laquelle xt désigne la variation du taux de chômage. Ces termes résiduels sont ensuite utilisés pour spécifier les termes de correction d’erreur des modèles.
Après avoir estimé les relations statiques, Dufrénot et Mignon (1999) ont effectué des tests de linéarité et montré que l’hypothèse de linéarité de la relation est toujours rejetée contre l’alternative d’un modèle SETAR. L’équation des modèles à correction d’erreur comprend alors deux termes de rappel : un terme linéaire décrivant la relation statique entre la consommation et le revenu et un terme résiduel suivant un processus SETAR(2,1,1) issu de la régression de la consommation sur xt. Les auteurs supposent que l’élasticité de long terme de la consommation par rapport au revenu est unitaire et que l’influence des variations du revenu sur les variations de la consommation transite par ladynamique de long terme (voir équation (47)). Lemodèle estimé est le suivant [5] :
A titre de comparaison, le modèle à correction d’erreur linéaire est estimé par :
Les résultats comparatifs des simulations statiques et dynamiques figurent dans le tableau 2.

Tableau 2
erreurs de prévisions associées aux simulations statiques et dynamiques
IMGIMGTableau 2 : erreurs de prévisions as...IMGIMF
Tableau 2 : erreurs de prévisions associées aux simulations statiques et dynamiques EQM ETC EV Prévisions statiques Modèle avec $zt-1 0,702.10-2 0,227.10-3 0,355 Modèle sans $zt-1 0,714.10-2 0,536.10-3 0,3159 Prévisions dynamiques Modèle avec $zt-1 0,722.10-2 0,26.10-3 0,351 Modèle sans $zt-1 0,753.10-1 0,768.10-3 0,404 EQM est l’erreur quadratique moyenne, ETC est l’erreur de tendance centrale et EV est l’erreur de variation.

On remarque que le terme à correction d’erreur $z a un coefficient négatif significatif, ce qui semble indiquer t-1 qu’il joue bien le rôle de rappel vers la cible de long terme. La présence de ce terme permet d’améliorer la qualité des simulations, statiques et dynamiques, par rapport à une spécification qui ne contiendrait que le terme à correction d’erreur linéaire : on constate en effet que les valeurs prises par les différents critères sont plus faibles pour le modèle non linéaire que pour le modèle linéaire.
On aboutit à la même conclusion, si au lieu du taux d’inflation on considère le terme résiduel associé à la relation de long terme entre la consommation et le taux de chômage :
Les résultats des simulations statiques et dynamiques sont donnés dans le tableau 3.

Tableau 3
erreurs de prévisions associées aux simulations statiques et dynamiques
IMGIMGTableau 3 : erreurs de prévisions as...IMGIMF
Tableau 3 : erreurs de prévisions associées aux simulations statiques et dynamiques EQM ETC EV Prévisions statiques Modèle avec zt-1 0,70.10-2 0,287.10-3 0,355 Modèle sans zt-1 0,714.10-2 0,536.10-3 0,3159 Prévisions dynamiques Modèle avec zt-1 0,726.10-2 0,331.10-3 0,353 Modèle sans zt-1 0,753.10-1 0,768.10-3 0,404 EQM est l’erreur quadratique moyenne, ETC est l’erreur de tendance centrale et EV est l’erreur de variation.

Tous les coefficients ont les signes attendus. On retrouve par exemple l’existence d’un comportement d’épargne de précaution, capturée parle signe négatif du coefficient relatif aux variations du taux de chômage. L’idée que la perception des revenus futurs joue un rôle dans les comportements de consommation est un fait admis, non seulement pour la France, mais plus généralement pour l’ensemble des pays développés (voir par exemple Romer, 1997; Dynan, 1993; Carroll, 1994). De même, nous retrouvons également l’hypothèse d’une épargne de précaution due à une prédominance des effets de richesse ou illustrant un phénomène de reconstitution des encaisses réelles. Globalement, les résultats obtenus font ressortir que l’hypothèse de cointégration à seuil conduit à une nette amélioration des prévisions du taux d’épargne par rapport à une modélisation linéaire n’intégrant que la relation statique entre la consommation et le revenu.
Dans un contexte différent mais toujours dans le but de mettre en évidence des phénomènes d’asymétrie, il nous semble opportun de mentionner les travaux de Escribano et Pfann (1998) faisant le lien entre les modèles de choix intertemporels et les modèles à correction d’erreur non linéaires. Plus précisément, les auteurs montrent que les mécanismes à correction d’erreur non linéaires existant dans nombre de séries macroéconomiques peuvent être générés de façon endogène à partir d’un comportement optimisateur des individus faisant face à l’existence de coûts d’ajustement asymétriques. La notion de coûts d’ajustement asymétriques est ainsi équivalente à la notion de mécanisme à correction d’erreur non linéaire : la trajectoire d’ajustement à une cible de niveau élevé ne se fait pas nécessairement de façon symétrique avec l’ajustement à une cible de niveau plus faible. Escribano et Pfann (1998) estiment alors les vitesses d’ajustement dans les différentes phases du cycle économique anglais concernant les cols blancs dans l’industrie manufacturière sur la période 1955 à 1986. Plus précisément, soit Lt le nombrede cols blancs dans l’industrie manufacturière en Grande-Bretagne. NotonsWt le salaire de ces cols blancs et Kt le stock de capital du secteur manufacturier. La relation de cointégration estimée est donnée par [6] :
D est une variable dummy ayant pour objet de tenir compte du choc pétrolier de 1973.
Escribano et Pfann (1998) commencent par estimer un modèle à correction d’erreur linéaire :
SCR est la somme des carrés des résidus, LB est la statistique de Ljung-Box (avec deux retards) permettant de tester l’autocorrélation des résidus, JB est la statistique de Jarque et Béra visant à testerla normalité des résidus et ARCH est la valeur estimée de la statistique ARCH (pour un nombre de retards égal à deux). D’après ces différentes statistiques, on constate que le modèle estimé est économétriquement correct, même si le coefficient de la force de rappel n’est significativement différent de zéro qu’au seuil de 10 %.
Escribano et Pfann (1998) estiment ensuite un modèle à correction d’erreur asymétrique du type :
On constate que l’estimation du modèle à correction d’erreur non linéaire nous apporte une information supplémentaire en ce qui concerne l’asymétrie de l’ajustement vers la cible de long terme. D’un point de vue purement économétrique, il est vrai que les deux modèles ne sont pas fondamentalement différents. Cependant, la vitesse d’ajustement vers le niveau haut de la cible d’emploi des cols blancs (0,42) est plus forte que la vitesse d’ajustement vers le niveau bas (0,07). En comparant les valeurs obtenues aux paramètres de leur modèle théorique, Escribano et Pfann (1998) montrent que les résultats confirment les conclusions généralement trouvées sur l’asymétrie des cols blancs, à savoir que ceux-ci sont plus facilement embauchés durant les périodes d’expansion que licenciés durant les périodes de récession. Le modèle à correction d’erreur linéaire ne permet pas de rendre compte d’un tel phénomène.
Cointégration et modèles bilinéaires
Pour terminer cette brève revue de la littérature, faisons référence aux travaux de Peel et Davidson (1998) proposant une forme alternative de modèles à correction d’erreur non linéaires basés sur les modèles bilinéaires [7]. L’intérêt de ces modèles est qu’ils permettent de rendre compte de l’existence de changements soudains dans les vitesses d’ajustement à la cible de long terme. Les auteurs proposent une application empirique sur la consommation ( )Ct et le revenu disponible brut des ménages ( )Yt en Grande Bretagne sur la période 1830-1990. Ils comparent alors le modèle à correction d’erreur bilinéaire à un modèle à correction d’erreur linéaire et à un modèle à correction d’erreur non linéaire comportant les carrés des termes retardés. Les trois modèles estimés sont les suivants [8] :
  • modèle linéaire :
  • modèle bilinéaire :
  • modèle non linéaire incluant les carrés des termes retardés :
Au regard des statistiques de Box-Pierce sur les résidus en niveau, il ne ressort aucune autocorrélation. En ce qui concerne le carré des résidus, la statistique s’interprète comme un test ARCH et les résultats diffèrent fortement selon les modèles puisque seuls les résidus du processus bilinéaire ne sont pas conditionnellement hétéroscédastiques. D’une manière générale, les résultats obtenus indiquent une nette supériorité du modèle à correction d’erreur bilinéaire par rapport aux deux autres modèles du point de vue du R2, de la log-vraisemblance et du test de Box-Pierce sur le carré des résidus. En outre le paramètre de cointégration estimé par le modèle bilinéaire prend une valeur réaliste, ce qui n’est pas le cas avec les deux autres modèles. Cette étude met ainsi en avant la difficulté liée à l’estimation du paramètre de cointégration en l’absence d’une spécification correcte de la dynamique de court terme.
Outre les références précédemment citées, d’autres applications concernant les modèles à correction d’erreur peuvent également être trouvées dans Granger et Lee (1989), Burgess (1992b), Kunst (1992), Peel (1992), Granger et Swanson (1995), Yuhn (1996), Granger et Haldrup (1997) et Escribano et Granger (1998). Parmi les références les plus récentes, on peut également citer les travaux de Lin et alii (1998). Ces auteurs appliquent la modélisation à correction d’erreur non linéaire aux séries quotidiennes de taux de change de cinq pays et montrent que des formes complexes de cointégration existent alors que l’application des méthodes économétriques usuelles ne révèle aucune preuve de cointégration (linéaire).
 
Conclusion
 
 
L’objet de ce travail était de dresser une revue de la littérature concernant les développements relatifs à la notion de cointégration non linéaire. Nous nous sommes ainsi intéressés au traitement conjoint des phénomènes de non stationnarité et de non linéarité. Une telle démarche a nécessité de reformuler les notions usuelles de mémoire des séries temporelles et de cointégration. Dans un tel contexte, trois grandes approches ont été présentées : les modèles à correction d’erreur non linéaires, les travaux basés sur la théorie de l’information et les concepts de série fortement mélangée et de dépendance proche.
 
BIBLIOGRAPHIE
 
·  Acemoglu D. et Scott A. (1994). “Asymmetries in the Cyclical Behaviour of UK Labour Markets”, Economic Journal, 104, pp. 1303-1323.
·  Akram Q.F. (1998). “Has the Unemployment Switched Between Multiple Equilibria ?’’, Norgas Bank, Working Paper, 1998/2.
·  Aparicio-Acosta F.M. (1998). “Testing Linearity with Information Theoretic Statistics and Bootstrap”, in C. Dunis and B. Zhou (eds), Nonlinear Modelling of High Frequency Financial Time Series, John Wiley&Sons, London.
·  Aparicio F.M. et Escribano A. (1997). “Information-Theoretic Analysis of Serial Dependence and Cointegration”, Working Paper, Université Carlos III, Madrid.
·  Aparicio F.M. et Escribano A. (1999). “Cointegration : Linearity, Nonlinearity, Outliers and Structural Breaks”, The Current State of Economic Science.
·  Aparicio F.M. et Escribano A. (1999). “A Model Free Characterization of Cointegration and a Linearity Test”, Working Paper, Université Carlos III, Madrid.
·  Balke N.S. et Fomby T.B. (1995). “Threshold Cointegration”, The Review of Economics and Statistics, 5, pp. 629-645.
·  Breiman L., Meisel W.S. et Purcell E. (1977). “Variable Kernel Estimates of Multivariate Densities and their Calibration”, Technometrics, 19, pp. 135-144.
·  Brooks C. et Hinich M. (1997). “Cross-Correlations and Cross-Bicorrelations in Sterling Exchange Rates’’, Working Paper, University of Texas.
·  Burgess S.M. (1992a). “Asymmetric Employment Cycles in Britain : Evidence and an Explanation”, Economic Journal, 102, pp. 279-290.
·  Burgess S.M. (1992b). “Nonlinear Dynamics in a Structural Model of Employment”, Journal of Applied Econometrics, 7, S101-S118.
·  Carroll C.D. (1994). “How Does Future Income Affect Consumption ?”, Quarterly Journal of Economics, 109, pp. 111-147.
·  Carroll C.D. et Summers L.H. (1991). “Consumption Growth Parallels Income Growth : Some New Evidence”, in Bernheim B. and Shoven J.B. (eds), National Saving and Economic Performance, Chicago University Press, pp. 305-343.
·  Chan K.S., Petrucelli J.D., Tong H. et Woolford S.W. (1985). “A Multiple Threshold AR(1) Model”, Journal of Applied Probability, 22, pp. 267-279.
·  Dufrénot G., Drunat J. et Mathieu L. (1998). “Testing for Linearity : A Frequency Domain Approach”, in C. Dunis and B. Zhou (eds), Nonlinear Modelling of High Frequency Exchange Rates, John Wiley and Sons, London.
·  Dufrénot G. et Mathieu L. (2000). “Nonlinearities Are Simultaneously Present in the Conditional Mean and Conditional Variance of Financial Time Series : An Application to High Frequency Exchange Rates”, International Conference on Forecasting Financial Market / Computational Finance, London, June.
·  Dufrénot G. et Mignon V. (1999). “Pourquoi le taux d’épargne évolue-t-il de façon si irrégulière en France ? Une interprétation à partir des modèles à seuil non stationnaires”, Document de travail Erudite, Université Paris XII.
·  Dufrénot G. et Mignon V. (2002). Recent Developments in Nonlinear Cointegration with Applicatioons to Macroeconomics and Finance, Kluner Academic Publishers.
·  Dumas B. (1992). “Dynamic Equilibrium and the Real Exchange Rates in a Spatially Separated World”, Review of Financial Studies, 2, pp. 153-180.
·  Dynan K.E. (1993). “How Prudent Are Consummers ?”, Journal of Political Economy, 101, pp. 1104-1113.
·  Engle R.F. et Granger C.W.J. (1987). “Cointegration and Error Correction : Representation, Estimation and Testing”, Econometrica, 55, pp. 251-276.
·  Ermini L. et Granger C.W.J. (1993). “Some Generalizations on the Algebra of I(1) Processes”, Journal of Econometrics, 58, pp. 369-384.
·  Escribano A. (1986). Identification and Modeling of Economic Relationships in a Growing Economy, Ph. D. Dissertation (chapter 4), University of California San Diego.
·  Escribano A. (1997). “Nonlinear Error Correction : The Case of Money Demand in the U.K. (1878-1970)”, Working Paper, Université Carlos III, Madrid.
·  Escribano A. et Granger C.W.J. (1998). “Investigating the Relationship betwen Gold and Silver Prices”, Journal of Forecasting, 17, pp. 81-107.
·  Escribano A. et Mira S. (1998). “Nonlinear Error Correction Models”, Working Paper, Université Carlos III, Madrid.
·  Escribano A. et Pfann G.A. (1998). “Nonlinear Error Correction, Asymetric Adjustment and Cointegration”, Economic Modelling, 15, pp. 197-216.
·  Franses P.H. (1998). “Does Seasonality in Unemployment Changes With its (Nonlinear) Business Cycle ?”, Erasmus University Rotterdam, Econometric Institute Report 9809.
·  Friedman M. et Schwartz A. (1982). Monetary Trends in the United States and the United Kingdom : Their Relation to Income, Prices, and Interest Rates, 1967-1975, University of Chicago Press.
·  Granger C.W.J. (1966). “The Typical Spectral Shape of an Economic Variable”, Econometrica, 34, pp. 150-181.
·  Granger C.W.J. (1981). “Some Properties of Time Series Data and their Use in Econometric Model Specification”, Journal of Econometrics, 16, pp. 121-130.
·  Granger C.W.J. (1995). “Modelling Nonlinear Relationships Between Extended-Memory Variables”, Econometrica, 63(2), pp. 265-279.
·  Granger C.W.J. et Andersen A.P. (1978). An Introduction to Bilinear Time Series Analysis, Vandenhoeck and Ruprecht, Gottingen.
·  Granger C.W.J. et Haldrup N. (1997). “Separation in Cointegrated Systems and Persistent Transitory Decompositions”, Oxford Bulletin of Economics and Statistics, 59, pp. 449-463.
·  Granger C.W.J. et Hallman J.J. (1991). “Long Memory Series with Attractors”, Oxford Bulletin of Economics and Statistics, 53(1), pp. 11-26.
·  Granger C.W.J. et Lee T.H. (1989). “Investigation of Production, Sales and Inventory Relationships Using Multicointegration and Non-symmetric Error Correction Models”, Journal of Applied Econometrics, 4, S145-S159.
·  Granger C.W.J. et Swanson N. (1995). “Further Developments in the Study of Cointegrated Variables”, mimeo.
·  Granger C.W.J. et Teräsvirta T. (1993). Modeling Nonlinear Economic Relationships, Oxford University Press.
·  Hendry D.F. et Ericsson N. (1983). “Assertion Without Empirical Basis : An Econometric Appraisal of `Monetary Trends in the United States and the United Kingdom’by Milton Friedman and Anna Schwartz”, in Monetary Trends in the United Kingdom, Bank of England Panel of Academic Consultants, Paper 22, pp. 45-101.
·  Hendry D.F. et Ericsson N. (1991). “An Econometric Analysis of the U.K. Money Demand in `Monetary Trends in the United States and the United Kingdom’by Milton Friedman and Anna Schwartz”, American Economic Review, 81, pp. 8-38.
·  Johansen S. (1988). “Statistical Analysis of Cointegration Vectors”, Journal of Economic Dynamics and Control, 12, pp. 231-254.
·  Johansen S. (1991). “Estimation and Hypothesis Testing of Cointegration Vectors in Gaussian Vector Autoregressive Models”, Econometrica, 59, pp. 1551-1580.
·  Kunst R.M. (1992). “Threshold Cointegration in Interest Rates”, Working Paper, Institute for Advanced Studies, Vienne.
·  Lardic S. et Mignon V. (1996). “Les tests de mémoire longue appartiennent-ils au camp du démon ?”, Revue Economique, 47(3), pp. 531-540.
·  Lardic S. et Mignon V. (1997). “Essai de mesure du degré de mémoire longue des séries. L’exemple de la modélisation ARFIMA”, Economie Appliquée, 2, pp. 161-195.
·  Lardic S. et Mignon V. (1999). “Prévision ARFIMA des taux de change : les modélisateurs doivent-ils encore exhorter à la naïveté des prévisions ?”, Annales d’Economie et de Statistique, 54, pp.47-68.
·  Lardic S. et Mignon V. (1999). “La mémoire longue en économie : une revue de la littérature”, Journal de la Société Française de Statistique, 140, pp. 5-48.
·  Lin Y-X., McCRAE M. et Gulati C.M. (1998). “Cointegration Between Exchange Rates : A Generalized Linear Cointegration Model”, Journal of Multinational Financial Management, 8, pp. 333-352.
·  Montgomery A.L., Zarnowitz V., Tsay R.S. et Tiao C. (1998). “Forecasting the US Unemployment Rate”, Journal of the American Statistical Association, 93, pp. 478-493.
·  Nelson C.R. et Plosser C.I. (1982). “Trends and Random Walks in Macroeconomic Time Series : Some Evidence and Implications”, Journal of Monetary Economics, 10, pp. 129-162.
·  Ozaki T. (1978). “Nonlinear Models for Nonlinear Random Vibrations”, Working Paper, Department of Mathematics, University of Manchester.
·  Peel D. (1992). “Some Analysis of the Long-Run Time Series Properties of Consumption and Income in the U.K.”, Economics Letters, 39, pp. 173-178.
·  Peel D. et Davidson J. (1998). “A Non-linear Error Correction Mechanism Based on the Bilinear Model”, Economics Letters, 58, pp. 165-170.
·  Peel D., Nobay A.R. et Michael P. (1997). “Transaction Costs and Nonlinear Adjustment in Real Exchange Rates : An Empirical Investigation”, Journal of Political Economy, 105, pp. 862-878.
·  Romer D. (1997). Macroéconomie approfondie, McGraw-Hill, Ediscience.
·  Rosenblatt M. (1974). Random Processes, Springer Verlag.
·  Rothman P. (1998). “Further Evidence on the Asymmetric Behaviour of Unemployment Rates Over the Business Cycle”, Journal of Macroeconomics, 13, pp. 291-298.
·  Skalin J. et Teräsvirta T. (1998). “Modelling Asymmetries and Moving Equilibria in Unemployment Rates”, Working Paper Series in Economics and Finance, n°262, Stockholm School of Economics.
·  Tsay R.S. (1986). “Nonlinearity Tests for Time Series”, Biometrika, 73(2), pp. 461-466.
·  Van Dijk D. et Franses P.H. (1997a). “Modelling Multiple Regimes in the Business Cycle”, Erasmus University Rotterdam, Econometric Institute Report 9734.
·  Van Dijk D. et Franses P.H. (1997b). “Nonlinear Error-Correction Models for Interest Rates in the Netherlands”, mimeo, Tinbergen Institute, Erasmus University Rotterdam.
 
NOTES
 
[(*)]Erudite, Université Paris XII et GREQAM.
[(**)] THEMA, Université Paris X-Nanterre. E-mail : Valerie. MMignon@ u-paris10. fr.