Economie & prévision
La Doc. française

I.S.B.N.sans
250 pages

p. 167 à 191
doi: en cours

Veille sur la revue
Veille sur l'auteur
Vous consultez

n° 160-161 2003/4

2003 Économie et Prévision

Les modèles de microsimulation dynamique dans l’analyse des réformes des systèmes de retraites : une tentative de bilan

Gaël Dupont  [(*)] Cyrille Hagneré  [(**)] Vincent Touzé  [(***)]
Les modèles de microsimulation dynamique permettent d’étudier l’évolution des systèmes de retraites en se basant sur une hétérogénéité observée des agents et sur l’ensemble des non-linéarités intrinsèques aux calculs des pensions. Ils ont en outre la capacité d’intégrer des résultats issus de la microéconométrie comportementale. Cet article dresse un bilan des enseignements de ces modèles dans l’analyse des réformes des retraites. Nous proposons une typologie des différentes méthodes possibles pour l’analyse des retraites. On étudie ensuite la nature de l’exercice de microsimulation dynamique et ses différentes sources d’erreurs d’estimation. Enfin, nous recensons les principaux modèles existants dans les pays développés et nous résumons les enseignements issus de l’expérience française à travers le modèle Destinie de l’Insee. Mots-clés : microsimulation dynamique, études prospectives de long terme, modélisation des systèmes de retraites par répartition . Dynamic microsimulation models provide a means for studying future pension system trends, based on the observed heterogeneity of agents and all the intrinsic non-linearities of pension calculations. They are also capable of integrating results from behavioural microeconometrics. The paper discusses the lessons for pension system analysis that can be drawn from these models. It goes on to consider the nature of dynamic microsimulations and the various sources of estimation errors. It concludes with a review of the main models used in developed countries and a summary of what can be learnt from Insee’s Destinie model. Keywords : dynamic microsimulation, long-term forecasts, modelling of contributory pension systems .
Cet article est la version révisée d’un texte issu d’un rapport réalisé pour la Commission des finances de l’Assemblée nationale. Nous tenons à la remercier pour son soutien financier. Nous exprimons également toute notre gratitude à E. Walraet, pour des discussions très stimulantes qui nous ont permis de profiter de sa connaissance pratique de la microsimulation dynamique, à A. Jacquot et R. Mahieu, nos deux discutants lors de la journée sur les modèles de microsimulation organisée par la CNAF, et aux deux re-lecteurs anonymes de la Revue pour leurs très nombreuses propositions d’amélioration et de correction du texte initial. Bien entendu, les opinions exprimées ou les erreurs et omissions n’engagent que leurs auteurs.
Les modèles de microsimulation dynamique permettent d’étudier l’évolution des systèmes de retraites en se basant sur une hétérogénéité observée des agents et sur l’ensemble des non-linéarités intrinsèques aux calculs des pensions. Ils ont en outre la capacité d’intégrer des résultats issus de la microéconométrie comportementale. Cet article dresse un bilan des enseignements de ces modèles dans l’analyse des réformes des retraites. Nous proposons une typologie des différentes méthodes possibles pour l’analyse des retraites. On étudie ensuite la nature de l’exercice de microsimulation dynamique et ses différentes sources d’erreurs d’estimation. Enfin, nous recensons les principaux modèles existants dans les pays développés et nous résumons les enseignements issus de l’expérience française à travers le modèle Destinie de l’Insee.
Les évaluations de l’avenir des retraites sont souvent résumées à des projections du taux de dépendance, dont le principal mérite est de révéler, à législation sociale inchangée, les déséquilibres financiers majeurs potentiellement induits par l’allongement de la durée de la vie et l’accélération du mouvement liée à l’entrée massive en retraite des générations du baby-boom. Le débat sur les retraites est ainsi ramené à une simple règle d’équilibre budgétaire où la réflexion consiste principalement à examiner deux positions extrêmes – le maintien du taux de cotisation de retraite ou le maintien du taux de remplacement sur le salaire brut – pour finalement recommander une position intermédiaire qui est celle de la parité entre les revenus des retraités et ceux des salariés [1], ce qui signifie que le taux de remplacement sur les salaires nets doit être maintenu constant (cf. rapport Cottave, 1991 ; Dupont et Sterdyniak, 2000).
Malgré des possibilités d’amélioration, cette approche atteint vite ses limites si l’on souhaite mesurer avec une certaine précision le montant des droits à la retraite et si l’on s’intéresse aux conséquences redistributives des réformes. En effet, pour des raisons évidentes d’hétérogénéité sociale et du caractère complexe [2] des formules de calcul du montant des retraites, il apparaît que les incidences redistributives des réformes, au sein de chaque cohorte, peuvent être importantes et que leurs impacts sur le montant total des droits à la retraite peuvent être difficiles à mesurer. Une approche basée sur des évaluations à un niveau individuel s’avère ainsi indispensable pour répondre à toute une série de questions pour lesquelles le législateur aimerait disposer de sérieux éclaircissements :
  1. Quelle solidarité entre les générations le système de retraite exprime-t-il ? Quelle règle d’équité retenir pour la mesurer (cf. Fleurbaey et Michel, 1992) ? Par exemple, en matière d’inégalités entre les générations, l’histoire française récente révèle des évolutions disparates (cf. Legris et Lollivier, 1995; Chauvel, 1998).
  2. Quelle équité au sein d’une même génération ? Existe-t-il des inégalités de traitement selon les secteurs professionnels d’appartenance (durée d’activité, accès à la capitalisation, différences objectives d’espérances de vie, etc) ? Le caractère peu universel des retraites en France se traduit, a priori, par de profondes différences selon les secteurs d’activité ou selon le sexe (cf. Lagarde et alii, 1982).
  3. Dans quelle mesure les réformes sont-elles efficaces puisqu’elles influencent également les comportements, notamment les choix de cessation d’activité ?
  4. Quel est le soutien politique ? Dans la mesure où les réformes sont susceptibles de traiter inégalement les ménages, il peut être important de disposer d’une évaluation du crédit électoral des réformes proposées.
Plus généralement, au regard du caractère complexe des règles de calcul des pensions de retraite, la réalisation d’une mesure pertinente de l’incidence redistributive et de l’évolution des agrégats de finances publiques, suite à un changement de la législation, nécessite de disposer d’un échantillon représentatif de la population. Si l’information relative aux individus de l’échantillon est assez complète, il est alors possible de simuler pour chacun d’eux des variables économiques pertinentes telles que le montant des retraites. Profitant de l’accroissement des capacités de calcul et du développement des outils statistiques, cette technique, dite de microsimulation, fournit aux décideurs publics des réponses de plus en plus précises, notamment en introduisant certains comportements économiques. Toutefois, dans le domaine des retraites, la tâche est compliquée par le caractère dynamique de la simulation qui découle de l’aspect temporel de la problématique.
Cet article tente d’établir un bilan de l’approche par microsimulation dans l’analyse des réformes des systèmes de retraite. Les motivations de ce travail sont multiples. Il y a d’abord des interrogations sur les enseignements que l’on peut tirer des modèles de microsimulation dans le domaine du financement des retraites. En quoi sont-ils utiles pour comprendre les réformes sociales ? De quelle manière se distinguent-ils des autres travaux de modélisation (équilibre général, macro-projection, …) ? Il y a ensuite des interrogations d’ordre méthodologique. Comment fonctionnent-t-ils ? Quelles sont leurs propriétés ? Quel est leur degré de fiabilité ? Nous souhaitons ainsi comprendre en quoi les expériences réalisées à l’aide de modèles de microsimulation dynamique sont susceptibles d’apporter des enseignements nouveaux dans le cadre de la réforme des systèmes de retraite.
L’article s’organise autour de trois parties. La première partie tente de situer la microsimulation par rapport aux autres types de modélisation. Il s’agit de dessiner une typologie au regard des deux axes d’analyse complémentaire que constituent la dimension microéconomique et le bouclage macroéconomique. Dans la seconde partie, la microsimulation dynamique est présentée. Cette étape permet d’identifier les informations utilisées et de préciser la nature technique de l’exercice. Il s’agit également d’étudier la fiabilité des résultats. Dans la dernière partie, nous recensons les principaux modèles et nous nous attardons plus spécifiquement sur l’expérience française. En conclusion, nous fournissons quelques éléments de mise en perspective. En annexe de l’article, deux exemples illustratifs sont proposés pour saisir plus particulièrement les difficultés que peut poser la simulation stochastique pour construire des agrégats.
 
La modélisation dans l’analyse des réformes des systèmes de retraite : une typologie
 
 
Il existe six catégories d’outils d’analyse permettant d’appréhender les problématiques de retraite. Ces approches peuvent être classées selon deux axes fondamentaux que sont la dimension microéconomique et la dimension macroéconomique :
  • l’existence d’une approche microéconomique signifie que l’unité de référence de modélisation est l’individu et que l’hétérogénéité [3] des ménages peut être appréhendée à différents degrés (âge, revenus sur le cycle de vie, structure familiale, durée de vie, régimes sociaux d’appartenance, etc). Ces individus peuvent réellement exister (par exemple, ils sont observés dans le cadre d’une enquête ou d’une banque de donnés administratives) ou être introduits de manière fictive ; leur “invention” doit alors répondre à un impératif particulier, comme celui d’identifierdes structures de ménages (des cas types) qui soient représentatives de groupes sociaux réellement existants, ou à un besoin de créer de façon intelligente” un ensemble de ménages dont les propriétés en termes de distributions des caractéristiq ues socio-écono miq ues son t compatibles avec des distributions réellement observées par ailleurs (par exemple, création de cohortes ou de po pulations fictiv es). La modélisation de l’histoire des cycles de vie de chacun de ces individus peut reposer sur un fondement microéconomique explicite des comportements qui traduit des arbitrages économiques de type coût-bénéfice dans une dimension globalement cohérente–en principe, les comportements de travail, de consommation et d’épargne devraient résulter du même cadre global d’arbitrage sur l’ensemble du cycle de vie comme dans une formulation théorique d’économie pure– ou résulter d’une approche plus ad hoc (modélisation qui insiste d’abord sur la pertinence statistique sans véritable identification des arbitrages) ou sur une prédétermination complète des destins (par exemple, cf. infra, dans les modèles de cas types dynamiques : un individu qui resterait au SMIC toute sa vie);
  • l’existence d’une approche macroéconomique traduit le fait que l’analyse incorpore un bouclage macroéconomique complet, c’est-à-dire qu’au niveau de l’économie générale, on observe des forces de rappel vers un équilibre entre les différents agrégats que sont les offres et les demandes de travail, de capital ou de biens et services par l’intermédiaire d’ajustement du système de prix. Le bouclage signifie aussi le fait que l’État garantit un certain équilibre intertemporel en matière de finances publiques, notamment de financement des retraites. Des règles d’ajustement entre les paramètres qui fixent le niveau des pensions et le taux de cotisation de retraite de façon à préserver l’équilibre budgétaire, sont alors explicitement prises en considération. Dans notre typologie, on considère un modèle comme véritablement macroéconomique lorsque l’ensemble des bouclages économiques est pris en considération.
Une modélisation idéale se devrait d’incorporer les ap pro ches microéconomiques et macroéconomiques dans leurs versions les plus détaillées et les plus pertinentes du point de vue des besoins de l’analyse économique (cf. questions énoncées dans l’introduction). Mais, pour des raisons évidentes de limites de l’observation et du caractère complexe de la psychologie des ménages et du système productif, il n’existe pas à ce jour d’outil de modélisation sans défaut [4]. En fait, les différents instruments recensés méritent tous d’être utilisés [5] car chacun est en mesure d’apporter des réponses à des questions différentes ou d’offrir des visions complémentaires à des questions communes. Outre les méthodes de microsimulation, il existe les cinq méthodes suivantes :
  • les projections de tendances permettent de prendre en compte simplement les implications des évolutions démographiques sur le niveau de vie relatif des actifs et des retraités et sur les cotisations de retraite dans un cadre macroéconomique exogène;
  • l’approche par cas types consiste à évaluer les droits à retraites des individus selon leur profil de carrière. Ellepermet de comprendrel’effet des règles de calcul des pensions sur un plan purement individuel;
  • la modélisation microéconométrique des comportements cherche à valider sur le plan empirique des modèles de comportement en supposant les individus rationnels. Elle ne permet pas d’effectuer une analyse globale des systèmes de retraite, car l’analyse est en général trop partielle, mais elle appréhende les comportements (par exemple le choix du départ en retraite) et leurs évolutions induites par des modifications de la législation;
  • les modèles d’équilibre général calculable à générations imbriquées (MEGCGI) sont des maquettes bouclées d’équilibre général des marchés avec ajustement des prix et fondements microéconomiques explicites tant en matière d’offre que de demande. Ils ont une cohérence théorique interne forte;
  • les modèles macroéconométriques sont des modèles néo-keynésiens où les prix ne s’ajustent qu’avec retard. Ils sont en général sollicités pour les analyses de court et moyen terme. Leur potentiel d’application aux retraites est a priori plutôt réduit.
Les modèles macroéconométriques et les MEGCGI prennent en compte un bouclage macroéconomique. Les grandeurs économiques agrégées ont une influence sur d’autres grandeurs avec des effets de second ordre. Dans le cas des MEGCGI, ils reproduisent en général des équilibres de plein emploi et ont une portée de long terme, tandis que les modèles macroéconométriques ont essentiellement une portée à court ou moyen terme et permettent, par exemple, d’analyser les phases de transition démographique en termes de déséquilibres sur les marchés et notamment celui du travail. Ces modèles permettent d’étudier l’impact des évolutions démographiques et des réformes des systèmes de retraites sur l’ensemble de l’économie (taux de chômage, taux d’épargne… ), ce qui n’est pas possible avec les approches sans bouclage macroéconomique.
Parmi les approches sans bouclage, on distingue les modèles où seule la dimension individuelle est étudiée (cas types, analyse de comportements microéconomiques) des modèles dans lesquels les grandeurs macroéconomiques sont exogènes. En ce qui concerne les projections de tendance, les variables démographiques et économiques telles que la natalité, la mortalité, l’immigration, le taux de chômage, le taux de productivité sont exogènes. Cette toile de fond étant posée, on étudie les conséquences du vieillissement sur la répartition d’un revenu national exogène. Un type de comportement macroéconomique est parfois pris en compte dans ces projections : l’offre de travail via l’effet de flexion (cf. Chauvin et Plane, 2001).
Sur le plan microéconomique, on distingue les approches qui modélisent les comportements comme le résultat d’une maximisation sous contrainte de celles dans lesquelles les choix ne sont pas explicitement fondés (formulation ad hoc). L’approche par cas types et les projections de tendance se bornent à postuler des profils de revenus, sans étudier, théoriquement ou empiriquement, si ces revenus influencent les choix des agents économiques. Quant aux modèles avec bouclage macroéconomique, ils prennent nécessairement en compte des comportements puisque le bouclage repose sur ces derniers. Dans les MEGCGI, la cohérence théorique prédomine puisque les comportements sont fondés dans un même cadre d’analyse microéconomique et que la principale unité de modélisation est un individu représentatif (et donc fictif) d’une cohorte. En revanche, le contenu empirique est faible (méthode de calibrage sur une période de référence). En comparaison, dans les modèles macroéconométriques, la conformité des équations de comportement aux données observées est privilégiée mais les comportements s’observent seulement à un niveau agrégé, ces derniers n’étant sont pas nécessairement fondés d’un point de vue microéconomique. Quant aux modèles microéconométriques, ils s’intéressent aux comportements.
Parmi ces cinq types de modélisation, la microsimulation dynamique est parente aux cas types et aux modèles microéconométriques, la maîtrise de ces deux outils étant souvent une phase préliminaire pour construire le modèle de microsimulation dynamique [6]. Ce dernier est un outil de simulation de trajectoires individuelles. En ce sens, il permet de constituer des histoires économiques complètes d’individus représentatifs de la population. Par essence, le niveau de modélisation est microéconomique mais les équations qui expliquent les destins individuels sont en général ad hoc et donc souvent sans véritable fondement théorique : il s’agit en effet, la plupart du temps, de capter des relations d’inférence économiquement justifiables et avec de bonnes propriétés statistiques. En outre, il n’y a pas de bouclage macroéconomique [7], notamment pour la simple raison que la sphère productive n’est pas modélisée.
Le tableau ci-dessous récapitule les différentes configurations possibles selon qu’il existe ou non un bouclage macroéconomique et une base d’analyse microéconomique, avec ou sans une “véritable” modélisatio n d es co mportements microéconomiques, et selon la nature des unités individuelles modélisées (individus réels ou fictifs). Les six modèles considérés ont été numérotés de (1) à (6).
Avec cette typologie, il existe dix configurations et quatre d’entre elles ne se voient associées à aucun modèle. Elles ont été numérotées de (a) à (d). Ce résultat provient du fait que dans notre choix de typologie, nous nous restreignons à des formes de modélisatio n dans leurs con figu rations élémentaires. Des formes plus élaborées de modèles peuvent conduire à des mutations de statut des modèles (versions hybrides), ce qui pourrait légitimer la présence de certains modèles dans plusieurs cases. En particulier, une telle discussion pourrait devenir pertinente avec les différents développements possibles de la microsimulation (introduction de bouclages macroéconomiques, modèles véritablement comportementaux, etc). Ce tableau conduit, probablement, à des imprécisions, mais il a le mérite de résumer les principales possibilités offertes comme choix de modélisation et de proposer une localisation de chacun des six outils existants de façon relativement simple. Chacun des six modèles est présenté plus en détail ci-après.


Typologie des méthodes d’analyse des réformes des systèmes de retraite
IMGIMGTypologie des méthodes d’analyse des...IMGIMF
Typologie des méthodes d’analyse des réformes des systèmes de retraite Bouclage macro : Non Bouclage macro : Oui Analyse micro : Non (1) projections de tendances (5) modèles macro-économétriques Pas de modélisation Individus fictifs (2) cas types dynamiques (b) « véritable » des Individus réels (3) microsimulation dynamique simple (c) Analyse micro : comportements Oui Modélisation Individus fictifs (a) (6) MEGCGI micro-fondée des comportements Individus réels (4) modélisation microéconométriquedes comportements (d)

Les projections de tendances
Les projections de tendances [8] sont les façons les plus simples de prendre en compte les implications des évolutions démographiques sans se préoccuper de l’hétérogénéité des situations individuelles ni du bouclage macroéconomique, notamment l’effet de l’évolution des taux de cotisation, des ratios de dépendance, du niveau des prestations sur la dynamique économique. Il s’agit d’une approche approximative qui a une visée principalement illustrative. On calcule un taux de croissance qui dépend des hypothèses de croissance de la productivité, d’évolution du chômage et de la population active [9]. Un cadre économique général est ainsi dressé à partir d’hypothèses sur l’évolution de l’âge moyen effectif de départ à la retraite. On déduit alors l’évolution du ratio de dépendance (rapport entre le nombre de retraités et le nombre de travailleurs). Compte tenu d’une hypothèse d’évolution du niveau de vie relatif entre retraités et actifs occupés (et entre chômeurs et actifs occupés), on en déduit la part des pensions de retraite (et des prestations versées aux chômeurs) dans le PIB. Cela fournit une évaluation simple de l’évolution du poids des retraites pesant sur les actifs occupés due aux seuls changements démographiques.
Les projections de tendance permettent néanmoins d’aborder une formulation simplifiée de l’équilibre des finances des régimes de retraites. Ce dernier s’écrit :
(pension moyenne) ⋅ (ratio de dépendance)
= (taux de cotisation) ⋅ (salaire moyen).
Le salaire moyen considéré est le coût du travail (salaire brut et cotisations patronales). Le taux de cotisation défini ici est un taux apparent. Il mesure le ratio entre les cotisations sociales versées et le coût du travail.
Appelons tr, le taux de cotisation retraite, r, le ratio de dépendance, et ar, le taux de pension net [10], rapport entre la pension moyenne nette et le salaire moyen net. À chaque période, on a :
(pension moyenne nette) = ar ⋅ (salaire moyen).
L’équilibre du système de retraites s’écrit alors :
autrement dit :
Si (1− α ) est la part des salaires dans la valeur ajoutée, la part des retraites dans le PIB est :
Avec cette relation simple (que l’on peut bien sûr généraliser un peu, notamment en prenant en compte d’autres prestations sociales), on obtient la relation qui décrit la contrainte comptable à chaque période. Elle montre les conséquences de l’augmentation du ratio de dépendance (r) du fait du vieillissement : soit le taux de cotisations augmente, soit l’âge de départ augmente (r diminue), soit la pension moyenne relative (ar) diminue.
Cette app roche ne décrit pas la réalité institutionnelle. Elle ne permet pas de prendre en compte la diversité des situations présentes et futures. Cependant, elle a deux grands avantages. Le premier est sa simplicité. Le second est qu’elle permet d’aborder la question des retraites de façon globale et de poser la problématique essentielle de la répercussion du vieillissement démographique sur le niveau de vie des actifs et des retraités. Plus précisément, elle permet de s’extraire d’un débat purement technique et institutionnel sur les réformes des régimes et d’évaluer le “triangle des contraintes ” du système de retraite par répartition : le vieillissement se traduira nécessairement par une augmentation des cotisations sociales et/ou une diminution du niveau de vie relatif des retraités et/ou un recul de l’âge de départ à la retraite. La question du choix social devient effective lorsque l’ampleur des évolutions est chiffrée. C’est ce que permet cette approche. En France, le Conseil d’Orientation des Retraites (COR) estime par exemple que le maintien du rapport entre la pension moyenne nette et le salaire moyen net à son niveau actuel (78 %) suppose une augmentation du taux de cotisation de 15 points (par rapport au salaire brut) [11]. Pour maintenir ce ratio sans augmenter les cotisations, l’âge de départ à la retraite doit augmenter de 9 ans. Le débat est posé. Le COR décrit alors les solutions mixtes possibles.
Cette approche permet principalement de soumettre les débats techniques à un choix de société beaucoup plus large, mais elle est insuffisante notamment pour s’interroger sur les inégalités entre régimes ou à l’intérieur des régimes (par exemple, les pénalités fortes en cas de départ anticipé ou retardé…). Elle ne permet pas une approche descriptive de l’évolution des régimes existants (équilibres financiers, niveau des pensions versées). On peut cependant, de façon ad hoc, faire une estimation hors modèle de l’évolution du niveau relatif moyen des pensions nettes dans les régimes existants à partir de cas types et l’injecter dans la maquette macroéconomique. C’est ainsi que le COR prévoit, en l’état actuel des règles des régimes de retraite, une réduction de 78 à 64 % du taux de pension net. Cela supposerait d’augmenter le taux de cotisation de 9 points ou de reculer l’âge de départ de 6 ans.
Le principal inconvénient de cette méthode est lié à la difficulté d’évaluer les réformes d’un point de vue pratique, c’est-à-dire proposer leur mise en place et étudier leurs conséquences à un niveau individuel (identifier les gagnants et les perdants). À cet égard, l’approche par les cas types [12] et la microsimulation peuvent être d’une grande utilité.
Les cas types dynamiques
L’approche par cas types consiste à évaluer le niveau des pensions dont bénéficient et bénéficieront les retraités selon une carrière professionnelle donnée et des caractéristiques sociodémographiques données (nombre d’enfants, statut du foyer, …). On mesure en général le taux de remplacement plutôt que le niveau de pension : le taux de remplacement (rapport entre la pension liquidée et le dernier salaire) permet d’évaluer dans quelle mesure le jeune retraité conserve son niveau de vie quand il prend sa retraite, mais aussi d’évacuer de la mesure la dérive liée à l’augmentation générale du niveau de vie dans l’économie. On peut aussi calculer le taux de rendement interne.
Autant d’un point de vue statique les cas types sont faciles à définir (les salariés au SMIC, les cadres moyens, etc.), autant d’un point de vue dynamique la notion de cas types est difficile à cerner [13], notamment du simple fait qu’il existe de la mobilité sociale (un salarié ne reste pas forcément au SMIC pendant toute sa vie). En général, les cas types adoptés sont représentatifs d’une certaine réalité [14], mais il paraît difficile de se donner une distribution des cas types représentative des différences observées dans la société. La pertinence d’un cas type peut aussi différer selon les cohortes concernées : ainsi, pour la cohorte née en 1945, une entrée dans l’activité à l’âge de 16 ans est une hypothèse réaliste et pertinente; elle ne l’est plus si l’on s’intéresse à une cohorte née en 1970. Par ailleurs, le choix d’un cas type peut reposer uniquement sur sa capacité à illustrer une propriété particulière (avantage, anomalie, …) du système de retraite.
L’étude de cas types nécessite une connaissance fine de la législation en matière de calcul des retraites (cf. le modèle Oscari de la Drees – Ministère des Affaires sociales, voir Raynaud, 2003). Les approches par cas type permettent d’avoir une vision simple du niveau de vie assuré par le système malgré sa complexité (systèmes de plafonds, cumul de plusieurs pensions,…) et donnent une idée claire du niveau de vie des retraites futures et des propriétés du système dans toutes ses particularités, notamment la présence de non-linéarités ou discontinuités dans le calcul des pensions (voir par exemple Dupuis et El Moudden, 2002).
Les cas types peuvent être utilisés pour mesurer l’effet des réformes sur l’évolution des niveaux de vie ou les implications du système en termes de redistribution intra-génération (par exemple, savoir si les carrières ascendantes sont défavorisées …). Ils permettent de comparer la générosité des différents régimes en évaluant les taux de remplacement assurés par chaque système à des profils de salaires identiques. Ils sont aussi utilisés pour comparer la générosité des systèmes de retraites dans différents pays, notamment lorsque la logique des systèmes est proche (pays d’Europe continentale ; pour une comparaison entre l’Allemagne, la France et l’Italie, voir Chagny et alii, 2001).
L’approche par cas types est un point de départ nécessaire pour débuter l’analyse d’une réforme mais inopérante pour appréhender les propriétés globales. Cette approche pourrait connaître un développement intéressant s’il était possible d’attribuer à chaque cas type une pondération suscep tible de reproduire des propriétés distributionnelles globalement observées. En effet, de telles pondérations permettraient d’amorcer une analyse plus globale et donc de constituer des agrégats de dépenses (pensions versées) et de recettes (cotisations sur les salaires). La limite du cas type repose, pour l’instant, sur la difficulté de trouver ces pondérations. Une façon naturelle de dépasser cette limite est le recours à un modèle de microsimulation dynamique.
La microsimulation dynamique
La microsimulation dynamique est un outil de simulation de trajectoires individuelles qui reflètent les parcours socioéconomiques d’un échantillon d’individus représentatifs de la population. La nature représentative de l’échantillon permet de reproduire des ordres de grandeurs agrégées (moyenne des revenus, différents moments de la distributions des revenus, taux de chômage, etc.) tout en conservant la richesse d’évaluation basée sur un niveau individuel. Ces modèles reproduisent alors une réalité agrégée de la démographie et des droits à la retraite. Ils permettent donc de déduire un équilibre des finances publiques à partir d’unités d’observation microéconomiques [15].
La technique de microsimulation dynamique, dans sa version la plus simple, n’introduit pas véritablement des comportements. Cependant, les modèles de microsimulation peuvent être améliorés dès lors qu’on est en mesure d’introduire des règles de choix individuels qui reposent sur un comportement de maximisation d’un objectif sous contrainte, d’où une classification également possible avec les travaux de microéconométrie comportementale (cf. Klevmarken et Olovsson, 1996). Par ailleurs, si un certain bouclage macroéconomique est également pris en compte grâce à une utilisation associée avec un modèle macroéconométrique, un classement, dans le tableau, en position (c) ou (d) est envisageable. Enfin, certains modèles (cf. le recensement fourni dans la troisième partie) reposent sur des populations ou coh ortes fictives, ce q ui signifie que potentiellement, ils peuvent également se classer en (a), ou même avec les cas types ou avec les modèles d’équilibre général calculable, en (b), si on a en plus un bouclage macroéconomique. Dans l’état actuel de la modélisation, la réalité est plutôt proche de la configuration de la case (3), car aucune tentative ne peut présenter un véritable fondement microéconomique global des comportements ni un bouclage réellement pertinent.
Modélisation micro-économétrique des comportements
De nombreuses études économétriques essayent de tester et d’estimer des modèles comportementaux fondés sur des hypothèses de rationalité. Ces études permettent de mesurer des modèles comportementaux. Ces applications portent notamment sur la démographie (choix du nombre d’enfants), sur les choix de participation au marché du travail et aussi sur la modélisation des choix de départs en retraite (cf. le survey de Bommier et alii). Il n’y a pas de véritables mises en perspective car il faudrait pour cela disposer de prévisions.
Les modèles microéconométriques ont un “ intérêt réduit ” pour analyser les réformes dans la mesure où l’étroitesse de la portée de leur résultat dépend du particularisme du comportement étudié (choix de durée d’activité, sensibilité de l’offre de travail pendant l’activité, etc.). Cependant, ces modèles peuvent être réemployés dans le cadre d’une microsimulation dynamique (sur ce point, voir Klevmarken, 1997). Dans ce cadre-là, il peut se poser des problèmes de cohérence globale entre les différents modèles comportementaux car les microfondements ne sont pas nécessairement compatibles.
Les modèles macro-économétriques
Ces modèles reposent sur un schéma d’analyse néokeynésien où la structure causale développée est du type : à court terme, la demande agrégée (la consommation, l’investissement, les dépenses des administrations publiques et les exportations) détermine l’offre agrégée (la production et les importations) qui, en retour, détermine les revenus et le taux de chômage ; les conditions de l’offre ont, à court terme, un effet sur le commerce extérieur, via la compétitivité et les tensions sur les capacités de production, d’une part, et sur la consommation via l’inflation, d’autre part. Les équations qui expriment les comportements macroéconomiques sont estimées par des procédures économétriques classiques employées pour les séries temporelles.
Ces modèles ne sont pas conçus pour s’appliquer à la réforme des systèmes de retraite. Pourtant, leur potentiel d’utilisation se situe à plusieurs niveaux :
  • à l’issue de la proposition d’équivalence ricardienne (Barro, 1974), de la théorie du cycle de vie (Ando et alii, 1957) ou du revenu permanent Friedman, 1957), des auteurs comme Feldstein (1974) ont proposé d’introduire les droits à la retraite dans la fonction de consommation macroéconomique et ont trouvé une corrélation positive [16];
  • ils peuvent fournir une analyse de l’impact du vieillissement en termes de demande de biens et services (conséquences des transferts entre générations sur les consommations des jeunes et des vieux ; mutation de la structure de la demande et conséquences sectorielles);
  • les modifications de la structure démographique ont selon toute vraisemblance des effets importants sur le marché du travail. Par exemple, l’entrée massive en retraite des générations du baby-boom devrait libérer de nombreux postes [17]. Dans le domaine de l’évaluation des retraites à long terme, une réflexion sur le taux de chômage est donc essentielle (cf. Rapport du Conseil économique et social). L’attrait potentiel de ces modèles réside donc dans l’incorporation d’un taux de chômage endogène résultant de déséquilibres sur l’ensemble des marchés.
On peut noter en France le travail réalisé par Beffy et alii (2003) à l’aide du modèle MESANGE développé par l’Insee. Ce modèle présente des propriétés keynésiennes (régime de demande) à court terme et néoclassiques (régime d’offre) à long terme. Ils examinent différentes voies d’ajustement des paramètres institutionnels face à la déformation de la pyramide des âges. L’horizon de simulation est relativement long : l’année 2020 a été retenue.
Les modèles d’équilibre général calculable avec générations imbriquées (MEGCGI)
Les MEGCGI fournissent des éléments d’évaluation sur les comportements d’accumulation de richesse, de consommation et d’offre de travail. L’ensemble des secteurs de l’économie est pris en compte : cohortes de ménages, entreprises et secteur public. L’économie est bouclée, les richesses produites sont consommées ou stockées. Les finances publiques sont intertemporellement équilibrées. Des marchés en situation de concurrence pure et parfaite fournissent des prix qui égalisent les offres et les demandes optimales de l’ensemble des agents [18]. La notion d’individu dans un modèle d’équilibre général calculable à générations imbriquées est abstraite. Il s’agit d’un individu représentatif de l’ensemble d’une cohorte et parfois d’une classe sociale ; celui-ci maximise son bien-être sur l’ensemble de son cycle de vie compte tenu des revenus qu’il anticipe rationnellement (salaires nets de cotisation, pensions de retraite). Les trajectoires individuelles sont connectées à la dynamique macroéconomique globale de l’économie par l’intermédiaire de l’évolution des prix (le salaire et les taux d’intérêt) et l’évolution des finances sociales. Ce type d’exercice de simulation a une cohérence interne forte d’autant plus que les comportements sont parfaitement micro-fondés (voir le survey de Le Cacheux et Touzé, 2002). Les points faibles de ces approches proviennent en grande partie d’un contenu empirique, quant à lui plus réduit au regard des autres approches. Notamment, la valeur des paramètres n’est pas obtenue par des techniques économétriques mais par des méthodes de calibrage, pour lesquelles il n’existe pas véritablement de tests (au sens de la théorie statistique) de la validation empirique.
Dans ces modèles, l’hétérogénéité, en dehors de la prise en compte de l’âge, a été jusqu’à présent rare. Cela signifie que les propriétés redistributives des systèmes de retraite sont difficiles à saisir. Néanmoins, la nouvelle génération de modèle introduit l’hétérogénéité de deux façons : soit une hétérogénéité innée de productivité (chaque cohorte est subdivisée en sous-groupes de productivité, sortes de cas types dynamiques où il n’y pas de mobilité sociale pendant le cycle de vie entre chacun des sous-groupes) ; soit une introduction de chocs idios yncratiques sur le revenu (sorte de microsimulation stochastique [19] avec des chocs de productivité, un risque de chômage ou un risque de mortalité) qui conduisent à des histoires différentes sur le cycle de vie. Kotlikoff (1995) a été l’un des premiers à s’intéresser à l’hétérogénéité. Sur ce sujet, on peut trouver en France deux applications récentes : par exemple, Hénin et Weitzenblum (2002) s’intéressent à la première configuration (chaque cohorte est subdivisée en plusieurs groupes de revenu), tandis que Hairault et Langot (2002, 2003) traitent un modèle qui se rapproche de la seconde configuration.
 
La microsimulation dynamique : principes et propriétés
 
 
La microsimulation est, à la base, une démarche de physicien et elle a été développée pour étudier les propriétés de systèmes stochastiques complexes. Le préfixe “micro” signifie que la simulation porte directement sur des entités élémentaires (cellules, particules ou individus), considérées alors comme les plus petites, et non sur des agrégats – ces derniers se trouvent seulement simulés indirectement –. Il s’agit donc d’effectuer des projections sur ces entités élémentaires et non seulement sur leur masse [20]. Les capacités actuelles de calcul font que cette technique s’emploie dans de nombreuses disciplines : la physique, la biologie, l’épidémiologie, l’oncologie, la chimie, …, dans des optiques opérationnelles ou à des fins purement scientifiques, mais aussi dans le domaine de la démographie (projection de population), de la logistique et la gestion de réseaux de transport. Il faut noter aussi des utilisations potentielles en matière d’organisation pour les entreprises, notamment en ce qui concerne la gestion du personnel (prévoir les départs et les promotions, mais aussi estimer le passif social) et la gestion des stocks (par exemple, quelle est la règle qui minimise le risque d’une rupture de stock ?).
La microsimulation peut être statique ou dynamique. Les modèles statiques reposent sur des observations en coupe et chaque entité élémentaire est étudiée sans perspective dynamique. En revanche, les modèles dynamiques ont pour objet de fournir des projections de trajectoires pour chaque composante élémentaire et ils sont construits à partir d’observations longitudinales. Appliqué à un ensemble composé d’individus (la population d’une nation), le modèle dynamique va être utilisé pour faire vieillir [21] (ou rajeunir s’il s’agit de reconstituer des trajectoires individuelles incomplètement observées) un échantillon initialement observé de la population, mais aussi pour faire “naître” de nouveaux individus puis pour “raconter” leur histoire, de façon à reproduire une évolution ressemblante, dans le sens où les propriétés observées en termes de corrélations croisées et de distribution des possibles sont bien reproduites, à celle que pourrait avoir la société.
On doit à Orcutt (1957) le premier projet d’application dans le domaine des sciences sociales, c’est-à-dire une utilisation de la microsimulation à des fins d’études des propriétés démographiques et économiques d’une nation. Orcutt se soucie à l’époqu e de la pauvreté de l’analy se distributionn elle o fferte p ar les modèles macroéconomiques appliqués. Il propose alors une nouvelle voie fondée sur une modélisation des comportements individuels. L’aspect dynamique n’est véritablement traité qu’à partir des années 1970 dans le cadre de la construction aux États-Unis du modèle Dynasim [22]. Depuis les années 1990, les physiciens (cf. Castiglione, 2001) emploient ég alemen t d es tech niques similaires d e microsimulation dynamique pour étudier les microstructu res d es march és fin anciers (econophysics).
Dans cette partie, les informations nécessaires à la construction d’un modèle de microsimulation dynamique appliquée à l’analyse des retraites sont détaillées, avant d’aborder la nature technique de l’exercice ainsi que les interrogations sur la fiabilité des résultats. En guise d’illustration des problèmes liés à l’emploi d’une méthode de simulation stochastique, deux exemples élémentaires de microsimulation dynamique font l’objet d’une étude précise dans une annexe.
Les informations nécessaires à la construction d’un modèle
Dans le domaine économique et social, l’objectif de la microsimulation dynamique est de reproduire des trajectoires de cycles de vie qui soient pertinentes au regard des processus d’évolution sociale observés et des besoins de l’analyse. Ces processus décrivent les lois qui gouvernent les destins individuels. Ils traduisent les conséquences individuelles du fonctionnement global de la société. Ces conséquences traduisent des choix d’action (mariage, départ à la retraite, etc.) ou des obligations (licenciement, naissance, décès, etc.). Les destins individuels sont dépendants des caractéristiques socioéconomiques : l’environnement économique et l’histoire passée concourent au devenir de chacun mais ce devenir est en partie aléatoire, c’est-à-dire qu’il est en partie inexplicable et donc soumis, à défaut, au hasard [23].
Ces processus font l’objet d’une modélisation microéconométrique préalable (spécification d’une relation puis estimation des paramètres de la relation identifiée). Le choix d’une relation consiste à déterminer les éléments connus qui expliquent le mieux, d’un point de vue logique et statistique, les évolutions des différentes valeurs prises par chaque caractéristique ainsi que la nature purement aléatoire. À ce stade, l’un des attraits de la microsimulation est de tenir compte des corrélations croisées entre les différentes caractéristiques et leurs valeurs passées. Les observations des variables se réalisent sous une forme quantitative continue (mesurabledans une unité définie préalablement, par exemple le salaire en euro), quantitative discrète (par exemple l’âge) ou qualitative (non mesurable et par nature discrète). En particulier, les méthodes économétriques employées pour estimer les processus qui décrivent l’évolution de variables discrètes consistent à estimer directement la probabilité de survenance d’un événement (modèle Logit ou Probit). Lorsque le temps est considéré comme continu, les méthodes économétriques utilisées font appel à des modèles de durée; il s’agit alors de fournir une estimation de la distribution de probabilité du temps écoulé entre deux événements.
En règle générale, ne sont reprises que les conséquences des caractéristiques individuelles et globales (par exemple le taux de chômage) sur les histoires individuelles et non les conséquences des histoires individuelles sur les variables globales (notion de bouclage macroéconomique). Cependant, les paramètres institutionnels du régime de retraite peuvent se relier facilement aux histoires individuelles dès lors que les modélisateurs ont la possibilité d’inclure des règles d’ajustements des taux de cotisation et des règles de calcul des retraites (taux de remplacement, âge de départ) qui préservent l’équilibre des finances sociales (bouclage partiel). En retour, ces ajustements peuvent jouer un rôle important lorsque les paramètres institutionnels modifient les comportements individuels (par exemple, le mode de calcul des retraites peut influencer les incitations à la cessation d’activité).
L’élément clé dans le calcul des retraites est l’histoire salariale. L’occupation d’un emploi et le montant du salaire constituent donc les deux caractéristiques socioéconomiques de base qui doivent être observées et modélisées. Un tel besoin va nécessiter l’identification ou la reconstitution de carrières salariales. En outre, compte tenu des clauses de réversion dans le calcul des retraites en faveur du conjoint survivant et de l’utilisation possible de la microsimulation pour analyser la transmission patrimoniale, il peut paraître utile de connaître les liens familiaux entre les différents individus. Dans ce but, de nombreux modélisateurs utilisent d’ailleurs une population fermée, c’est-à-dire une population où l’ensemble des liens familiaux (filiation, mariage ou union libre voire divorce s’il s’agit de reproduire les ruptures de liens) entre les différents individus est conservé ou créé à l’aide d’algorithmes d’appariement. Ces caractéristiques sont souvent les principaux éléments à reproduire pour être en mesure de calculer les pensions de retraites.
La description des individus comprend d’autres caractéristiques. Chacune d’elle nécessite aussi une modélisation particulière de type microéconométrie. La liste suivante récapitule l’ensemble des informations généralement intégrées dans les différents modules, dont l’interconnexion globale constitue le modèle de microsimulation (voir par exemple Insee, 1999) :
  • la démographie : pour évaluer les évolutions de la démographie, il est nécessaire de comprendre les mécanismes de migration interne géographique entre différents États ou régions d’une zone économique), d’immigration / émigration, ainsi que les évolutions des taux de survie et fécondité distribution des âges pour le premier enfant puis les autres);
  • la nuptialité : l’unité individuelle n’est pas suffisante pour appréhender correctement la législation. Il faut en général être en mesure de connaître les caractéristiques de la cellule familiale. Il s’agit alors d’identifier les différents éléments qui expliquent la formation de liens de type mariage ou union libre ainsi que les divorces;
  • l’éducation et l’acquisition de l’indépendance : il s’agit d’identifier et de reproduire différents cursus scolaires et de transmission de capital humain ainsi que les mécanismes de décisions de départ du domicile parental. L’acquisition de l’indépendance es t en général co nnectée à la carri ère professionnelle;
  • l’état de santé : il peut apparaître important de connaître les caractéristiques des individus en termes de morbidité dans la mesure où la mortalité est reliée à la maladie et dans la mesure où le financement des dépenses de santé des plus âgés peut s’apparenter à une forme de système par répartition où les prestations sont en nature (pour un survey sur les modèles de microsimulation appliqués à la santé, voir Breuil-Genier, 1998);
  • les carrières professionnelles : la modélisation des carrières est un point crucial. Il s’agit en particulier de retracer les transitions entre les différents états d’activité (emploi, chômage) et d’inactivité (scolarité, retraite, éducation des enfants), les mécanismes de promotion salariale ou de croissance des revenus d’activités pour les indépendants, mais aussi les changements sectoriels dans la mesure où ils peuvent occasionner des changements de régimes de rattachement (par exemple carrières mixtes dans le privé et le public);
  • les revenus : pour appliquer certains barèmes fiscaux, il est souvent nécessaire de connaître l’ensemble des revenus des ménages et de distinguer les revenus issus du travail (salaire, nombre d’heures travaillées, etc.) de ceux résultant de la détention d’un capital;
  • le patrimoine : il s’agit d’identifier les principaux éléments qui motivent les comportements patrimoniaux (acquisition de logement ou placements financiers) ainsi que les logiques dynastiques (les héritages et les transmissions in vivo de patrimoine). L’évaluation du montant des patrimoines est un aspect important si l’on souhaite connaître les revenus complémentaires à ceux des pensions par répartition;
  • les institutions publiques et la législation sociale [24] : il s’agit de décrire les différents instruments de taxation ou de versements de prestations ainsi que les formes d’assurances publiques (et d’affiliation) en matière de retraite, santé, survie et dépendance.
Ainsi, en appliquant des tables de mortalité conditionnelle, des comportements de choix de nuptialité et de maternité, des règles d’évolution des salaires (ou de revenus d’exploitation pour les entrepreneurs individuels), des règles de licenciement ou des choix de cessation d’activité professionnelles, etc., il va être possible de produire (ou reproduire s’il s’agit d’invention des passés) l’évolution professionnelle et familiale probable d’un échantillon d’individus pour une population donnée. On peut alors en déduire, par exemple, la progression des dépenses des branches vieillesse (ou du risque dépendance) tout en ayant des ordres de grandeur sur l’évolution des distributions des différentes caractéristiques socioéconomiques dans la population.
Il est ainsi possible d’étudier l’impact d’une réforme (modification du taux de cotisation, des conditions de départ en retraite ou du calcul de la pension) selon un certain agenda de mise en place progressive, tant au niveau global (les montants totaux de dépenses et de recettes) qu’en termes d’incidence sur les inégalités intra et intergénérationnelles (par exemple en mesurant les effets des réformes par décile de revenu de cycle de vie). Le critère généralement utilisé pour mesurer la générosité du régime de retraite pour un individu est son rendement ou plus précisément son taux de rendement interne (TRI).
La nature technique de l’exercice
D’un point de vue technique, un modèle de microsimulation dynamique est un générateur de trajectoires individuelles. Ces trajectoires ont une nature stochastique [25] puisque, à chaque période, le hasard affecte un avenir parmi un ensemble de possibles. Il permet ainsi de constituer un échantillon de trajectoires individuelles qui est susceptible de refléter, dans la mesure où le balayage aléatoire est supposé suffisamment large et non biaisé, la réalité économique, tant dans ses particularismes individuels (propriétés en termes de distributions longitudinales et verticales) que dans ses tendances globales (évolution générale qui caractérise la société et dont on peut établir des pronostics en dehors d’un modèle de microsimulation).
Chaque processus identifié se présente sous une formulation mathématique quantifiée qui traduit une relation logique avec des éléments endogènes que sont les caractéristiques présentes et passées de l’individu (qui résultent elles-mêmes des chocs passés), des éléments exogènes de nature non stochastique [26] (par exemple la législation) et d’un aléa dont la distribution est connue. Ce dernier pourra être reproduit à l’aide d’un générateur de nombres au hasard (il s’agit de la nature exogène et stochastique du processus).
De façon concrète, la description de la société se réalise à l’aide d’informations de nature discrète (qualitative ou mesure quantitative) ou continue. Le cœur d’un modèle de microsimulation dynamique peut donc être schématisé de la façon suivante. Considérons des individus décrits par des caractéristiques de nature discrète (vecteur de variables qualitatives ou quantitatives noté y) et de nature continue (vecteur de variables quantitatives noté x). On note z le vecteur de variables exogènes [27] qui décrivent les environnements institutionnel (taux de cotisation, taux de remplacement, etc.; ces paramètres se trouvent modifiés lorsqu’une réforme est simulée) et macroéconomique (hypothèses sur le taux de chômage, le taux de croissance de la productivité, etc.). La simulation de réformes des systèmes de retraite signifie l’utilisation de valeurs institutionnelles alternatives. t désigne l’indice temporel et i l’indice individuel.
À un instant donné t, on observe une distribution des valeurs prises par les différentes caractéristiques dans la population :
  • les valeurs prises par les caractères continus x ∈ Ω it sont distribuées suivant une loi caractérisée par une fonction F x( )qui mesure la proportion d’individus t i à l’instant t tels que x x it ≤;
  • les valeurs prises par les caractères discrets y y y y it j N ∈ { ,..., ,..., } 1 sont distribuées dans les proportions p prob y y t it = =( ) pour y y yN =1,..., y avec
Pour un environnement global (économique et institutionnel) donné zt, l’évolution des valeurs prises par les caractéristiques est gouvernée par des processus stochastiques. Pour simplifier la présentation, seules les caractéristiques passées – l’étendue du passé étant limitée à la période précédente – sont supposées influer sur ces processus : aucune codépendance directe (simultanéité) entre deux caractéristiques observées au même instant n’a été supposée. On peut représenter ces processus de la façon probabiliste suivante :
  • la fonction G x x y z( ', , , ) mesure la probabilité t t conditionnelle pour un individu i d’avoir une réalisation x x'≤ sachant que sa situation passée i t, +1 était x x i t, = et y y i t, =;
  • la fonction q y x y z t t ( ', , , ) mesure la probabilité conditionnelle pour un individu i d’avoir une réalisation y y'= sachant que sa situation passée i t, +1 était x x i t, = et y y i t, =.
Idéalement [28], on souhaiterait, à chaque période, calculer l’évolution exacte [29] de la distribution des valeurs prises en coupe (analyse transversale) par les différentes variables dans la population :
ainsi que mémoriser l’intégralité des trajectoires individuelles pour connaître la distribution longitudinale des trajectoires, que l’on pourrait mesurer par exemple comme la proportion d’individus i tels que les histoires individuelles vérifient :
En pratique, on ne peut pas calculer la valeur théorique de ces distributions car la procédure de simulation repose sur une sélection de trajectoires, par succession de tirages aléatoires, pour un grand nombre d’individus, et non sur une méthode de calcul basée sur un continuum d’individus. Le continuum [30] – atomicité de chaque agent – serait une garantie pour calculer avec exactitude la distribution. Pour cela, il faudrait recourir à des méthodes d’intégration numérique. De tels calculs nécessiteraien t également des ressources informatiques importantes [31]. Avec un modèle de microsimulation, les distributions sont seulement calculées à partir d’un nombre fini d’individus. Sous certaines hypothèses, la loi des grands nombres peut assurer l’annulation tendancielle de la variance de l’estimateur de la moyenne mais la taille de l’échantillon nécessaire peut être considérable. Tout dépend alors de la vitesse de convergence vers 0 de la variabilité de l’estimateur du moment considéré. Il en ressort que les résultats agrégés (les différents moments des lois de distribution des données longitudinales ou en coupe) issus des simulations peuvent suivre un processus aléatoire complexe avec une variance conditionnée par la taille de l’échantillon (voir les éléments de discussion sur deux exemples en annexe). L’horizon temporel de simulation joue également un rôle car les erreurs s’accumulent et la variance de fluctuation de l’agrégat peut croître avec la durée de la projection. Par ailleurs, pour les distributions longitudinales, de nombreuses trajectoires ne seront jamais simulées. Il y a certainement matière à réfléchir sur l’importance de ces “disparitions” dans l’utilisation des résultats agrégés [32], notamment pour calculer des indicateurs d’inégalités intra et intergénérationnelles ou de générosité du système.
Fiabilité des résultats
La microsimulation dynamique donne deux principaux résultats : une évaluation du montant des droits à la retraite à un niveau individuel ainsi qu’à un niveau agrégé. Il est important de s’interroger sur la pertinence de ces mesures. La fiabilité des résultats [33] s’apprécie en comparant les objectifs idéaux de la microsimulation et les contraintes techniques (qualité des données utilisées, taille des échantillons, choix de spécification et puissance de calcul des ordinateurs). Les objectifs idéaux de la microsimulation sont de fournir des estimations de la réalité probable dont la qualité de précision se mesure par les faiblesses du biais en espérance et de la variance [34]. Les sources d’imprécision dans ces estimations proviennent de la nature même de la microsimulation (emploi de banques de données et de techniques de modélisation économétrique) mais aussi de son aspect dynamique (prise en compte du temps et utilisation d’une méthode de simulation stochastique).
Les sources d’imprécision liées à la microsimulation en général
Les sources d’imprécision liées à la microsimulation en général sont de quatre types :
  1. La construction d’un modèle de microsimulation nécessite le recours à de nombreuses banques de tant pour caractériser les individus que identifier et quantifier les processus qui déterminent les changements d’état de chacun d’entre eux. Il peut donc apparaître deux types d’erreur d’échantillonnage [35] qui vont concerner les individus sur lesquels porte précisément la microsimulation, mais aussi les individus dont l’observation a permis l’estimation des paramètres du modèle.
  2. Les spécifications retenues : le recours à une spécification de comportement ou d’une relation causale repose toujours sur un certain arbitraire et expose donc à l’oubli de variables ou à l’emploi de formulations inadaptées (par exemple, modélisation linéaire plutôt que non-linéaire, traitement des anticipations individuelles, etc.).
  3. Les contraintes d’obs ervation : les spécifications des processus peuvent en raison d’observations manquantes ignorer l’importance de certaines variables.
  4. Certains modèles utilisent une population (ou cohorte) fictive, qui reproduit, seulement et en principe, certaines propriétés distributionnelles (en termes de moments et de corrélations croisées) de la population (ou cohorte) réelle. Pour ces types d’échantillons, il est très difficile de connaître les propriétés d’échantillonnage.
Les sources d’imprécision spécifiques à la microsimulation dynamique
Les sources d’imprécision spécifiques à la microsimulation dynamique proviennent de l’aspect dynamique et de l’utilisation d’une technique de simulation stochastique.
  1. La reconstitution des passés : lorsque les données le passé sont manquantes, il est nécessaire de rétropoler et, de la même façon que l’on peut se sur les estimations futures, on peut commettre des erreurs sur les passés.
  2. La discrétisation du temps [36] (fréquence en général) peut conduire à des approximations sur la durée effective des différents événements (par exemple on n’est pas forcément toute l’année mais seulement une partie).
  3. Les estimations de tendance dans l’évolution des comportements ou de certaines variables d’environnement macroéconomique (par exemple le de chômage, l’allongement de la durée de la vie, l’allongement de la durée des études, l’augmentation l’offre de travail féminine, l’évolution du progrès technique) peuvent être erronées.
  4. L’absence de bouclage macroéconomique [37] : modèles de microsimulation produisent des d’analyse prospective tout en restant en équilibre partiel (environnement global prédéfini). Autant dans une analyse statique on peut considérer dans un premier temps (en première approximation) que le problème étudié de façon isolée n’a pas d’influence sur le reste de l’économie, autant dans une perspective dynamique sur longue période (entre 40 ans et un siècle) le raisonnement avec scénario macroéconomique inchangé, lorsqu’on introduit des réformes, est plus délicat. Parmi les évolutions macroéconomiques susceptibles d’être également influencées par les réformes, on peut noter le taux de chômage (sensible à l’évolution de l’offre de travail), l’accumulation de capital productif et la demande globale (par exemple l’évolution de la consommation des vieux par rapport à la consommation des jeunes).
  5. L’imperfection des générateurs de nombres au hasard : a priori, cet élément est marginal, compte tenu des études préalables de validation qu’ils suscitent.
  6. La méthode de simulation stochastique s’apparente à une technique d’échantillonnage de trajectoires et l’in suffisance des tail les d’échantillons introduit une variabilité artificielle dans les résultats agrégés [38]. Cette variabilité se traduit par des évolutions erratiques. Cette insuffisance peut rendre délicate l’exploitation des distributions longitudinales pour évaluer le montant total des droits à pension à un niveau agrégé ou traiter des questions d’équité.
Pour beaucoup de ces sources d’imprécision, il est difficile d’établir une mesure de la variance supplémentaire et des biais qu’elles peuvent induire. Pour certains types d’imprécision, il est toujours possible de recourir à des méthodes d’inférence statistique, mais celles-ci nécessitent d’importantes ressources informatiques. Établir une marge de confiance globale semble donc plutôt difficile [39]. C’est pourquoi, les marges réelles de précision des estimations que les économètres ont l’habitude de présenter, lorsqu’ils réalisent des prévisions macroéconomiques à l’aide de modèles usuels de séries temporelles, ne peuvent pas vraiment être fournies. Par ailleurs, la fiabilité des estimateurs, obtenus par simulation stochastique, des différents moments des distributions peut également poser un souci important. Ce point d’interrogation fait l’objet d’une discussion particulière dans le cadre de l’étude, qui figure en annexe, de deux processus stochastiques élémentaires.
 
La microsimulation dynamique en pratique : un recensement des principaux modèles
 
 
L’introduction de la microsimulation dans le domaine des sciences sociales est due à Orcutt (1957). Partant du constat de l’incapacité des modèles macroéconomiques de renseigner sur l’impact des politiques publiques sur, par exemple, la répartition des revenus des agents dans l’économie, Orcutt proposa de développer des outils de simu lation basés sur des d onnées microéconomiques. Tout d’abord statiques [40], les modèles de microsimulation ont vu l’introduction d’éléments dynamiques au cours des années 1970. Toutefois, bien que la construction du premier modèle de microsimulation dynamique (Dynasim) ait été initiée dès 1969 aux États-Unis, ce n’est que depuis une quinzaine d’années que cet outil d’analyse économique connaît son essor. L’accroissement des capacités de calcul et la disponibilité de données microéconomiques sont les principaux facteurs de son développement dans les années quatre-vingt-dix. Dans cette partie, nous tentons de dresser un inventaire des principaux modèles existants. Les articles de O’Donoghue (2000) et de Zaidi et Rake (2001) sont deux articles de référence qui fournissent de nombreuses informations sur le contenu des modèles. O’Donoghue (2000) inventorie et donne des détails techniques précis sur les modèles. Zaidi et Rake (2001) fournissent un recensement moins complet mais tentent d’énoncer un certain nombrede règles et bilans sur les conditions de faisabilité et de fiabilité d’un modèle. Dans une perspective d’analyse statistique, on peut noter l’article de Wolf (2000) qui prés ente un bilan critiqu e de techniq ues économétriques d’estimation employées dans la construction des modèles de microsimulation. Un recensement des principaux modèles opérationnels dans le monde est ici tout d’abord effectué. Le cas français avec le modèle Destinie est ensuite abordé plus en profondeur.
Les principaux modèles opérationnels
Au jourd’hu i, on recense des modèles de microsimulation dynamique dans la quasi-totalité des pays développés. Dans les tableaux 1,2 et 3, un résumé des particularités des principaux modèles est donné. Ce descriptif comprend six rubriques : le pays d’étude, l’institution qui assure la construction du modèle, les références bibliographiques majeures, le type de base de données utilisé, la nature (population réelle ou fictive) et la taille de l’échantillon ainsi que la dimension du temps (discret ou continu). Les modèles ont été regroupés par zone géographique : l’Amérique du Nord, l’Europe et l’Asie-Océanie.
Par son rôle pionnier et sa richesse en matière de bases de d onnées, les États-Unis son t incontestablement le pays le mieux doté. Les modèles Dynasim 2 et Corsim sont certainement les plus aboutis. Ce dernier est à la base du modèle canadien Dynacan et du modèle suédois Sverige. Bien que la construction des modèles reste majoritairement dans le domaine de la recherche, les institutions administratives sont de plus en plus partie prenante (Dynacam, MINT, SFB3, Destinie, Pensim, Mosart, Sesim), ce qui révèle l’intérêt que présente la microsimulation dans l’évaluation des politiques publiques. La quasi-totalité des modèles présentés est utilisée afin d’analyser les systèmes de retraite. On notera néanmoins que certains d’entre eux permettent également d’étudier les politiques de santé (Dynamod, Harding, LifePaths, Nedymas). L’Europe est la région du monde qui regroupe le plus de modèles, mais cette particularité résulte de la multitude des régimes de retraite. L’Italie, le Royaume-Uni et la Suède sont les trois pays les mieux dotés, avec plusieurs modèles opérationnels. En Australie, le modèle Natsem a un rôle dominant et réalise de nombreux travaux méthodologiques sur le sujet, qui sont diffusés sous la forme de technical papers (par exemple, Galler, 1997 ; Baekgaard, 2002).
Depuis l’origine, les comparaisons entre les différents modèles sont fréquentes et elles ont conduit à plusieurs publications collectives. Parmi celles-ci, on peut remarquer celles sous la direction de Orcutt et alii (1986), Hancock et Sutherland (1992), Harding (1993,1996) et Milton et alii (2000). Les besoins de concertation se traduisent également par l’apparition de groupes de travail internationaux. Par exemple, le ESRC-Sage International Network [41] rassemble autour du Sage (Royaume-Uni) des constructeurs en provenance de quatre pays européens : le SFI (Institut indépendant et affilié au Ministère des Affaires sociales) pour le Danemark, l’Insee pour la France, le ESRI (Economic and Social Research Institute) pour l’Irlande ainsi que l’université de Lund et le National Insurance Board pour la Suède. Le SAGE est un centre de recherche affilié à la London School of Economics.
L’expérience française en particulier
Le travail fondateur de la microsimulation dynamique en France est attribuable à Blanchet et Chanut (1997) et est présentée de façon détaillée dans Insee (1999). Le modèle Destinie a été bâti autour de l’enquête Actifs Financiers 1991; il a été récemment mis à jour à l’aide des données de l’enquête Patrimoine 1998. Seules les retraites publiques de base (régime général) des salariés du privé sont étudiées. Dans la population reproduite par le modèle, il n’y a ni agents de l’État, ni artisans-commerçants, ni professions libérales, ni chefs d’entreprise. Ce modèle a depuis engendré une série de travaux particuliers de microéconométrie sur les ménages en matière de comportement de fécondité (Robert-Bobée, 2001), de transferts entre les générations (Bonnet et Mahieu, 1999), de choix de cessation d’activité (Mahieu et Sédillot, 2002) et de carrières salariales (Colin, 1999).

Tableau 1
modèles de microsimulation dynamique en Amérique du Nord
IMGIMGIMGIMF


Tableau 2
modèles de microsimulation dynamique en Europe
IMGIMGIMGIMF


Tableau 3
modèles de microsimulation dynamique en Asie et Océanie
IMGIMGIMGIMF

On notera cinq références majeures d’utilisation du modèle à des fins d’évaluation de réformes (Pelé et Ralle, 1997 ; Blanchet et Chanut, 1998 ; Bardaji, Sédillot et Walraet, 2002) ou des propriétés redistributiv es du sy stème de retraite français (Bonnet et Mahieu, 1999 ; Walraet et Vincent, 2002).
Pelé et Ralle (1997) [42] utilisent le modèle Destinie pour étudier les conséquences de la réforme de 1993, qui a augmenté la durée de cotisation nécessaire à une retraite à taux plein (160 trimestres au lieu de 150) et accru le nombre d’années pris en compte dans le calcul des pensions (25 au lieu de 10). L’analyse porte sur la génération 1960, qui est la première génération à laquelle s’appliquera intégralement la réforme. Les auteurs trouvent que la réforme de 1993 produit des effets importants en termes de report de l’âge de la retraite puisque 35% de l’échantillon repousserait son départ à la retraite. Par ailleurs, selon les situations particulières retenues, la baisse moyenne de la pension du régime général varie entre 3,5% et 16,8%.
Blanchet et Chanut (1998) s’intéressent également à la réforme de 1993. Leurs résultats permettent d’illustrer les conséquences de cette réforme en termes de variation des revenus sur le cycle de vie. Ils ne fournissent pas d’estimations chiffrées des conséquences de la réforme sur les inégalités de cycle de vie. Mais ils remarquent que la microsimulation met fortement en évidence un effet, souvent peu commenté, selon lequel l’allongement de la durée de référence pour le calcul du salaire moyen n’a pas d’effet pour les travailleurs accomplissant une carrière salariale toujours au-dessus du plafond de la Sécurité sociale. Par ailleurs, ils remarquent que les résultats en termes d’inégalités sont très sensibles aux hypothèses de mobilité salariale.
Bardaji, Sédillot et Walraet (2002) étudient trois réformes du régime général : l’allongement de 2,5 ans de la durée de cotisation; l’abaissement de l’âge minimal de liquidation à 58 ans ; l’indexation des pensions sur les prix + 0,8%. La microsimulation permet de prévoir sur 40 années les conséquences de ces réformes en termes d’âge moyen à la liquidation, de pension moyenne et de durée moyenne validée. Une ventilation des résultats par sexe permet par exemple de montrer que l’abaissement de l’âge minimal de liquidation profite davantage aux hommes qu’aux femmes pour les premières générations étudiées, mais, en raiso n de l’allongement de la durée des études et d’une participation féminine plus grande, la tendance s’inverse pour les générations suivantes.
Bonnet et Mahieu (1999) étudient l’influence des évolutions démographiques, économiques et institution nell es sur la redistribution intergénérationnelle inhérente au système par répartition. Les auteurs évaluent en particulier l’évolution des taux de cotisations et des taux de rendement du système de retraite selon les générations et selon un certain nombre d’hypothèses concernant l’évolution future du salaire moyen, du taux de chômage à long terme, du taux de mortalité ou bien encore de l’âge minimal de liquidation. Ils montrent par exemple que si les salaires augmentaient de 3 % par an, le taux de cotisations n’aurait à augmenter que de 3,3 points (sous le plafond) au lieu de 11,5 points dans le scénario central (croissance de 2 % des salaires). De même, une augmentation de l’âge légal de la retraite de 60 à 63 ans (pour les générations nées à partir de 1941) permettrait de réduire le taux de cotisations en 2040 de 5,2 points (en dessous du plafond). Une telle mesure ne modifierait pas le taux de rendement à long terme puisque la baisse des cotisations compenserait la diminution de la durée pendant laquelle les pensions seraient reçues. Mais le taux de rendement serait fortement détérioré pour les générations de transition puisqu’elles paieraient le même taux de cotisation tout en recevant des pensions moins longtemps.
Walraet et Vincent (2002) s’intéressent quant à eux à la question de la redistribution intragénérationelle. Ils utilisent le modèle Destinie pour tester dans quelle mesure le système de retraite français corrige les inégalités, notamment d’opportunité salariale liée à la maternité. Les résultats montrent clairement que la redistribution profite assez largement aux femmes disposant de bas revenus et aux couples ayant élevé des enfants. Les calculs des auteurs donnent également une évaluation des bénéfices supplémentaires pour les femmes qui proviennent du seul fait que le système de retraite ne tient pas compte des différences d’espérance de vie (à ceci près que dans un couple, le survivant peut prétendre à une pension de réversion).
Ces travaux témoignent de l’intérêt de la microsimulation dynamique pour prévoir le futur et évaluer l’impact de réformes possibles. Elle permet de prendre en considération, de façon la plus réaliste possible, la structure de la population et des revenus, qu’il est nécessaire de connaître compte tenu des non-linéarités des modes de calcul des retraites dans les systèmes existants. Ce type de recherche illustre le potentiel de la microsimulation pour réfléchir au caractère adapté ou non d’une formule de calcul des retraites.
 
Conclusion : une mise en perspective
 
 
Dans cet article, nous avons dressé un portrait et un recensement des modèles de microsimulation dynamique. Au regard de cet examen, nous notons, d’un point de vue méthodologique, que les résultats agrégés de simulations dynamiques peuvent revêtir un caractère fortement aléatoire et que les résultats sur données individuelles peuvent présenter de nombreuses imprécisions. Cette spécificité plaide en faveur du développement d’une meilleure connaissance théorique et empirique des propriétés statistiques de la microsimulation. Un tel développement permettrait de mesurer les propriétés globales des modèles ainsi que de construire des indicateurs de fiabilité sur les estimations. Il faut toutefois noter que ce terrain n’est pas vierge, mais les techniques existantes (le bootstrap par exemple) sont souvent très coûteuses en ressources informatiques. Néanmoins, l’accroissement des puissances de calcul rendent cet argument de moins en moins pertinent.
La jeunesse de la microsimulation en France fait que la construction des modèles, quels qu’ils soient, repose souvent sur une base de données (de taille modeste en général) qui n’a pas été spécifiquement conçue pour une telle utilisation (par exemple, limitation du champ d’étude aux salariés du privé). Il est alors nécessaire d’utiliser des banques de données annexes pour accroître l’information disponible, ce qui est évidemment source d’aléas. Dans la mesure où l’intérêt de la microsimulation n’est plus à démontrer, il semble souhaitable que les besoins liés à l’emploi de cette méthode soient intégrés dès la conception des bases de données.
Dans l’avenir, on peut penser qu’au sein de chaque pays, l’apparition de plusieurs modèles engendrera une concurrence favorable à leur amélioration par confrontation, mais au ssi les différences d’approches devraient permettre de fournir un certain encadrement des évolutions probables. La fiabilité [43] croissante des modèles de microsimulation devrait être un argument clé pourvoir leur utilisation plus importante dans l’orientation des décisions en matière de finances publiques.
Dans le domaine de l’analyse des déterminants du chômage, notamment ceux en rapport avec l’évolution de la structure démographique de la population active, des améliorations sont clairement souhaitables. Un taux de chômage endogène paraît plus crédible. À ce niveau, se pose la question de la connexion de la microsimulation avec les outils standards de la macroéconomie.
Enfin, nous avons noté une certaine pauvreté des indicateurs d’inégalités sur le cycle de vie. À part le recours à un calcul de taux de rentabilité interne de la retraite sur le cycle de vie, les utilisateurs de modèles semblent disposer de peu d’outils de mesure des inégalités entre générations mais aussi au sein même des cohortes. On peut espérer que les travaux de recherche menés dans ce domaine seront capables de fournir des indicateurs globaux éclairants pour les choix publics.
 
Annexe : étude des propriétés de l’estimateur de la moyenne de deux processus stochastiques élémentaires
 
 
Les informations recherchées dans l’emploi d’un modèle de microsimulation sont de deux types : d’un point de vue transversal, on cherche à connaître les distributions des valeurs prises par les différentes variables ; d’un point de vue longitudinal, on veut également observer les différentes trajectoires individuelles et évaluer leurs distributions. Pour cela, les simulations permettent de disposer d’estimateurs (par exemple, une moyenne) des différents moments des distributions (moyenne, écart type, etc). Par essence, ces estimateurs sont des variables aléatoires soumises à un processus stochastique. Une question d’importance est de savoir à partir de quelle taille d’échantillons dispose-t-on de suffisamment bons estimateurs des différents moments des distributions longitudinales et transversales. A priori, il semble que la précision (notamment faible variance) de ces estimateurs est d’autant plus faible que l’horizon est long. Dans cette annexe, nous tentons d’approfondir cet aspect dans le cadre de deux processus stochastiques élémentaires.
Dans les deux exemples qui suivent, on étudie des processus discrets et continus. La variable discrète comprend seulement deux états : il s’agit d’un processus binaire. On suppose aussi que les deux processus sont univariés–ils peuvent donc s’étudier séparément–, ils sont parfaitement identifiés–il n’y a pas de problème de spécification, ni d’estimation– et les échantillons initiaux sont également représentatifs de la population.
Étude du processus stochastique d’une variable discrète
Considérons le processus stochastique d’une variable discrète caractérisée par deux états 1 et 0 (par exemple, 1 = emploi; 0 = chômage). On note p0 (resp. 10p ) la proportion d’individus dans l’état 1 (resp. 0). Dans le cadre de ce processus discret, un individu initialement dans un état 1 (resp. 0) a une probabilité u (resp. 1− v ) d’y rester. Intéressons-nous ici seulement à l’évolution du premier moment de la distribution [1], c’est-à-dire la moyenne empirique µt d’un échantillon constitué de N individus. Si on note xit les évolutions individuelles, la moyenne simulée