2003
Économie et Prévision
Les modèles de microsimulation dynamique dans l’analyse des réformes des systèmes de retraites : une tentative de bilan
Gaël Dupont
[(*)]
Cyrille Hagneré
[(**)]
Vincent Touzé
[(***)]
Les modèles de microsimulation dynamique permettent d’étudier l’évolution des systèmes de retraites en se basant sur
une hétérogénéité observée des agents et sur l’ensemble des non-linéarités intrinsèques aux calculs des pensions. Ils ont en
outre la capacité d’intégrer des résultats issus de la microéconométrie comportementale. Cet article dresse un bilan des
enseignements de ces modèles dans l’analyse des réformes des retraites. Nous proposons une typologie des différentes
méthodes possibles pour l’analyse des retraites. On étudie ensuite la nature de l’exercice de microsimulation dynamique
et ses différentes sources d’erreurs d’estimation. Enfin, nous recensons les principaux modèles existants dans les pays
développés et nous résumons les enseignements issus de l’expérience française à travers le modèle Destinie de l’Insee. Mots-clés :
microsimulation dynamique, études prospectives de long terme, modélisation des systèmes de retraites par répartition .
Dynamic microsimulation models provide a means for studying future pension system trends, based on the observed heterogeneity
of agents and all the intrinsic non-linearities of pension calculations. They are also capable of integrating results from behavioural
microeconometrics. The paper discusses the lessons for pension system analysis that can be drawn from these models. It goes on to
consider the nature of dynamic microsimulations and the various sources of estimation errors. It concludes with a review of the
main models used in developed countries and a summary of what can be learnt from Insee’s Destinie model. Keywords :
dynamic microsimulation, long-term forecasts, modelling of contributory pension systems .
Cet article est la version révisée d’un texte issu d’un rapport réalisé pour la Commission des finances de l’Assemblée nationale. Nous
tenons à la remercier pour son soutien financier. Nous exprimons également toute notre gratitude à E. Walraet, pour des discussions
très stimulantes qui nous ont permis de profiter de sa connaissance pratique de la microsimulation dynamique, à A. Jacquot et R.
Mahieu, nos deux discutants lors de la journée sur les modèles de microsimulation organisée par la CNAF, et aux deux re-lecteurs
anonymes de la Revue pour leurs très nombreuses propositions d’amélioration et de correction du texte initial. Bien entendu, les
opinions exprimées ou les erreurs et omissions n’engagent que leurs auteurs.
Les modèles de microsimulation dynamique permettent d’étudier l’évolution des systèmes de retraites
en se basant sur une hétérogénéité observée des agents et sur l’ensemble des non-linéarités
intrinsèques aux calculs des pensions. Ils ont en outre la capacité d’intégrer des résultats issus de la
microéconométrie comportementale. Cet article dresse un bilan des enseignements de ces modèles
dans l’analyse des réformes des retraites. Nous proposons une typologie des différentes méthodes
possibles pour l’analyse des retraites. On étudie ensuite la nature de l’exercice de microsimulation
dynamique et ses différentes sources d’erreurs d’estimation. Enfin, nous recensons les principaux
modèles existants dans les pays développés et nous résumons les enseignements issus de l’expérience
française à travers le modèle Destinie de l’Insee.
Les évaluations de l’avenir des retraites sont souvent
résumées à des projections du taux de dépendance,
dont le principal mérite est de révéler, à législation
sociale inchangée, les déséquilibres financiers
majeurs potentiellement induits par l’allongement
de la durée de la vie et l’accélération du mouvement
liée à l’entrée massive en retraite des générations du
baby-boom. Le débat sur les retraites est ainsi
ramené à une simple règle d’équilibre budgétaire où
la réflexion consiste principalement à examiner deux
positions extrêmes – le maintien du taux de
cotisation de retraite ou le maintien du taux de
remplacement sur le salaire brut – pour finalement
recommander une position intermédiaire qui est
celle de la parité entre les revenus des retraités et
ceux des salariés
[1], ce qui signifie que le taux de
remplacement sur les salaires nets doit être maintenu
constant (cf. rapport Cottave, 1991 ; Dupont et
Sterdyniak, 2000).
Malgré des possibilités d’amélioration, cette
approche atteint vite ses limites si l’on souhaite
mesurer avec une certaine précision le montant des
droits à la retraite et si l’on s’intéresse aux
conséquences redistributives des réformes. En effet,
pour des raisons évidentes d’hétérogénéité sociale et
du caractère complexe
[2] des formules de calcul du
montant des retraites, il apparaît que les incidences
redistributives des réformes, au sein de chaque
cohorte, peuvent être importantes et que leurs
impacts sur le montant total des droits à la retraite
peuvent être difficiles à mesurer. Une approche
basée sur des évaluations à un niveau individuel
s’avère ainsi indispensable pour répondre à toute une
série de questions pour lesquelles le législateur
aimerait disposer de sérieux éclaircissements :
- Quelle solidarité entre les générations le système
de retraite exprime-t-il ? Quelle règle d’équité
retenir pour la mesurer (cf. Fleurbaey et Michel,
1992) ? Par exemple, en matière d’inégalités entre
les générations, l’histoire française récente révèle
des évolutions disparates (cf. Legris et Lollivier,
1995; Chauvel, 1998).
- Quelle équité au sein d’une même génération ?
Existe-t-il des inégalités de traitement selon les
secteurs professionnels d’appartenance (durée
d’activité, accès à la capitalisation, différences
objectives d’espérances de vie, etc) ? Le caractère
peu universel des retraites en France se traduit, a
priori, par de profondes différences selon les
secteurs d’activité ou selon le sexe (cf. Lagarde et
alii, 1982).
- Dans quelle mesure les réformes sont-elles
efficaces puisqu’elles influencent également les
comportements, notamment les choix de cessation
d’activité ?
- Quel est le soutien politique ? Dans la mesure où
les réformes sont susceptibles de traiter inégalement
les ménages, il peut être important de disposer d’une
évaluation du crédit électoral des réformes
proposées.
Plus généralement, au regard du caractère complexe
des règles de calcul des pensions de retraite, la
réalisation d’une mesure pertinente de l’incidence
redistributive et de l’évolution des agrégats de
finances publiques, suite à un changement de la
législation, nécessite de disposer d’un échantillon
représentatif de la population. Si l’information
relative aux individus de l’échantillon est assez
complète, il est alors possible de simuler pour chacun
d’eux des variables économiques pertinentes telles
que le montant des retraites. Profitant de
l’accroissement des capacités de calcul et du
développement des outils statistiques, cette
technique, dite de microsimulation, fournit aux
décideurs publics des réponses de plus en plus
précises, notamment en introduisant certains
comportements économiques. Toutefois, dans le
domaine des retraites, la tâche est compliquée par le
caractère dynamique de la simulation qui découle de
l’aspect temporel de la problématique.
Cet article tente d’établir un bilan de l’approche par
microsimulation dans l’analyse des réformes des
systèmes de retraite. Les motivations de ce travail
sont multiples. Il y a d’abord des interrogations sur
les enseignements que l’on peut tirer des modèles de
microsimulation dans le domaine du financement
des retraites. En quoi sont-ils utiles pour comprendre
les réformes sociales ? De quelle manière se
distinguent-ils des autres travaux de modélisation
(équilibre général, macro-projection, …) ? Il y a
ensuite des interrogations d’ordre méthodologique.
Comment fonctionnent-t-ils ? Quelles sont leurs
propriétés ? Quel est leur degré de fiabilité ? Nous
souhaitons ainsi comprendre en quoi les expériences
réalisées à l’aide de modèles de microsimulation
dynamique sont susceptibles d’apporter des
enseignements nouveaux dans le cadre de la réforme
des systèmes de retraite.
L’article s’organise autour de trois parties. La
première partie tente de situer la microsimulation par
rapport aux autres types de modélisation. Il s’agit de
dessiner une typologie au regard des deux axes
d’analyse complémentaire que constituent la
dimension microéconomique et le bouclage
macroéconomique. Dans la seconde partie, la
microsimulation dynamique est présentée. Cette
étape permet d’identifier les informations utilisées et
de préciser la nature technique de l’exercice. Il s’agit
également d’étudier la fiabilité des résultats. Dans la
dernière partie, nous recensons les principaux
modèles et nous nous attardons plus spécifiquement
sur l’expérience française. En conclusion, nous
fournissons quelques éléments de mise en
perspective. En annexe de l’article, deux exemples
illustratifs sont proposés pour saisir plus
particulièrement les difficultés que peut poser la
simulation stochastique pour construire des
agrégats.
La modélisation dans l’analyse des
réformes des systèmes de retraite : une
typologie
Il existe six catégories d’outils d’analyse permettant
d’appréhender les problématiques de retraite. Ces
approches peuvent être classées selon deux axes
fondamentaux que sont la dimension microéconomique et la dimension macroéconomique :
-
l’existence d’une approche microéconomique
signifie que l’unité de référence de modélisation est
l’individu et que l’hétérogénéité
[3] des ménages peut
être appréhendée à différents degrés (âge, revenus
sur le cycle de vie, structure familiale, durée de vie,
régimes sociaux d’appartenance, etc). Ces individus
peuvent réellement exister (par exemple, ils sont
observés dans le cadre d’une enquête ou d’une
banque de donnés administratives) ou être introduits
de manière fictive ; leur “invention” doit alors
répondre à un impératif particulier, comme celui
d’identifierdes structures de ménages (des cas types)
qui soient représentatives de groupes sociaux
réellement existants, ou à un besoin de créer de façon
intelligente” un ensemble de ménages dont les
propriétés en termes de distributions des
caractéristiq ues socio-écono miq ues son t
compatibles avec des distributions réellement
observées par ailleurs (par exemple, création de
cohortes ou de po pulations fictiv es). La
modélisation de l’histoire des cycles de vie de
chacun de ces individus peut reposer sur un
fondement microéconomique explicite des
comportements qui traduit des arbitrages
économiques de type coût-bénéfice dans une
dimension globalement cohérente–en principe, les
comportements de travail, de consommation et
d’épargne devraient résulter du même cadre global
d’arbitrage sur l’ensemble du cycle de vie comme
dans une formulation théorique d’économie pure–
ou résulter d’une approche plus ad hoc (modélisation
qui insiste d’abord sur la pertinence statistique sans
véritable identification des arbitrages) ou sur une
prédétermination complète des destins (par
exemple, cf. infra, dans les modèles de cas types
dynamiques : un individu qui resterait au SMIC toute
sa vie);
-
l’existence d’une approche macroéconomique
traduit le fait que l’analyse incorpore un bouclage
macroéconomique complet, c’est-à-dire qu’au
niveau de l’économie générale, on observe des
forces de rappel vers un équilibre entre les différents
agrégats que sont les offres et les demandes de
travail, de capital ou de biens et services par
l’intermédiaire d’ajustement du système de prix. Le
bouclage signifie aussi le fait que l’État garantit un
certain équilibre intertemporel en matière de
finances publiques, notamment de financement des
retraites. Des règles d’ajustement entre les
paramètres qui fixent le niveau des pensions et le
taux de cotisation de retraite de façon à préserver
l’équilibre budgétaire, sont alors explicitement
prises en considération. Dans notre typologie, on
considère un modèle comme véritablement macroéconomique lorsque l’ensemble des bouclages
économiques est pris en considération.
Une modélisation idéale se devrait d’incorporer les
ap pro ches microéconomiques et macroéconomiques dans leurs versions les plus détaillées
et les plus pertinentes du point de vue des besoins de
l’analyse économique (cf. questions énoncées dans
l’introduction). Mais, pour des raisons évidentes de
limites de l’observation et du caractère complexe de
la psychologie des ménages et du système productif,
il n’existe pas à ce jour d’outil de modélisation sans
défaut
[4]. En fait, les différents instruments recensés
méritent tous d’être utilisés
[5] car chacun est en
mesure d’apporter des réponses à des questions
différentes ou d’offrir des visions complémentaires à
des questions communes. Outre les méthodes de
microsimulation, il existe les cinq méthodes
suivantes :
- les projections de tendances permettent de prendre
en compte simplement les implications des
évolutions démographiques sur le niveau de vie
relatif des actifs et des retraités et sur les cotisations
de retraite dans un cadre macroéconomique
exogène;
- l’approche par cas types consiste à évaluer les
droits à retraites des individus selon leur profil de
carrière. Ellepermet de comprendrel’effet des règles
de calcul des pensions sur un plan purement
individuel;
- la modélisation microéconométrique des
comportements cherche à valider sur le plan
empirique des modèles de comportement en
supposant les individus rationnels. Elle ne permet
pas d’effectuer une analyse globale des systèmes de
retraite, car l’analyse est en général trop partielle,
mais elle appréhende les comportements (par
exemple le choix du départ en retraite) et leurs
évolutions induites par des modifications de la
législation;
- les modèles d’équilibre général calculable à
générations imbriquées (MEGCGI) sont des
maquettes bouclées d’équilibre général des marchés
avec ajustement des prix et fondements microéconomiques explicites tant en matière d’offre que
de demande. Ils ont une cohérence théorique interne
forte;
- les modèles macroéconométriques sont des
modèles néo-keynésiens où les prix ne s’ajustent
qu’avec retard. Ils sont en général sollicités pour les
analyses de court et moyen terme. Leur potentiel
d’application aux retraites est a priori plutôt réduit.
Les modèles macroéconométriques et les MEGCGI
prennent en compte un bouclage macroéconomique.
Les grandeurs économiques agrégées ont une
influence sur d’autres grandeurs avec des effets de
second ordre. Dans le cas des MEGCGI, ils
reproduisent en général des équilibres de plein
emploi et ont une portée de long terme, tandis que les
modèles macroéconométriques ont essentiellement
une portée à court ou moyen terme et permettent, par
exemple, d’analyser les phases de transition
démographique en termes de déséquilibres sur les
marchés et notamment celui du travail. Ces modèles
permettent d’étudier l’impact des évolutions
démographiques et des réformes des systèmes de
retraites sur l’ensemble de l’économie (taux de
chômage, taux d’épargne… ), ce qui n’est pas
possible avec les approches sans bouclage
macroéconomique.
Parmi les approches sans bouclage, on distingue les
modèles où seule la dimension individuelle est
étudiée (cas types, analyse de comportements
microéconomiques) des modèles dans lesquels les
grandeurs macroéconomiques sont exogènes. En ce
qui concerne les projections de tendance, les
variables démographiques et économiques telles que
la natalité, la mortalité, l’immigration, le taux de
chômage, le taux de productivité sont exogènes.
Cette toile de fond étant posée, on étudie les
conséquences du vieillissement sur la répartition
d’un revenu national exogène. Un type de
comportement macroéconomique est parfois pris en
compte dans ces projections : l’offre de travail via
l’effet de flexion (cf. Chauvin et Plane, 2001).
Sur le plan microéconomique, on distingue les
approches qui modélisent les comportements
comme le résultat d’une maximisation sous
contrainte de celles dans lesquelles les choix ne sont
pas explicitement fondés (formulation ad hoc).
L’approche par cas types et les projections de
tendance se bornent à postuler des profils de revenus,
sans étudier, théoriquement ou empiriquement, si
ces revenus influencent les choix des agents
économiques. Quant aux modèles avec bouclage
macroéconomique, ils prennent nécessairement en
compte des comportements puisque le bouclage
repose sur ces derniers. Dans les MEGCGI, la
cohérence théorique prédomine puisque les
comportements sont fondés dans un même cadre
d’analyse microéconomique et que la principale
unité de modélisation est un individu représentatif
(et donc fictif) d’une cohorte. En revanche, le
contenu empirique est faible (méthode de calibrage
sur une période de référence). En comparaison, dans
les modèles macroéconométriques, la conformité
des équations de comportement aux données
observées est privilégiée mais les comportements
s’observent seulement à un niveau agrégé, ces
derniers n’étant sont pas nécessairement fondés d’un
point de vue microéconomique. Quant aux modèles
microéconométriques, ils s’intéressent aux
comportements.
Parmi ces cinq types de modélisation, la
microsimulation dynamique est parente aux cas
types et aux modèles microéconométriques, la
maîtrise de ces deux outils étant souvent une phase
préliminaire pour construire le modèle de
microsimulation dynamique
[6]. Ce dernier est un
outil de simulation de trajectoires individuelles. En
ce sens, il permet de constituer des histoires
économiques complètes d’individus représentatifs
de la population. Par essence, le niveau de
modélisation est microéconomique mais les
équations qui expliquent les destins individuels sont
en général
ad hoc et donc souvent sans véritable
fondement théorique : il s’agit en effet, la plupart du
temps, de capter des relations d’inférence
économiquement justifiables et avec de bonnes
propriétés statistiques. En outre, il n’y a pas de
bouclage macroéconomique
[7], notamment pour la
simple raison que la sphère productive n’est pas
modélisée.
Le tableau ci-dessous récapitule les différentes
configurations possibles selon qu’il existe ou non un
bouclage macroéconomique et une base d’analyse
microéconomique, avec ou sans une “véritable”
modélisatio n d es co mportements microéconomiques, et selon la nature des unités
individuelles modélisées (individus réels ou fictifs).
Les six modèles considérés ont été numérotés de (1) à
(6).
Avec cette typologie, il existe dix configurations et
quatre d’entre elles ne se voient associées à aucun
modèle. Elles ont été numérotées de (a) à (d). Ce
résultat provient du fait que dans notre choix de
typologie, nous nous restreignons à des formes de
modélisatio n dans leurs con figu rations
élémentaires. Des formes plus élaborées de modèles
peuvent conduire à des mutations de statut des
modèles (versions hybrides), ce qui pourrait
légitimer la présence de certains modèles dans
plusieurs cases. En particulier, une telle discussion
pourrait devenir pertinente avec les différents
développements possibles de la microsimulation
(introduction de bouclages macroéconomiques,
modèles véritablement comportementaux, etc). Ce
tableau conduit, probablement, à des imprécisions,
mais il a le mérite de résumer les principales
possibilités offertes comme choix de modélisation et
de proposer une localisation de chacun des six outils
existants de façon relativement simple. Chacun des
six modèles est présenté plus en détail ci-après.
Typologie des méthodes d’analyse des réformes des systèmes de retraite
Typologie des méthodes d’analyse des réformes des systèmes de retraite
Bouclage macro : Non Bouclage macro : Oui
Analyse micro : Non (1) projections de tendances (5) modèles macro-économétriques
Pas de modélisation Individus fictifs (2) cas types dynamiques (b)
« véritable » des
Individus réels (3) microsimulation dynamique simple (c)
Analyse micro : comportements
Oui Modélisation Individus fictifs (a) (6) MEGCGI
micro-fondée des
comportements Individus réels (4) modélisation microéconométriquedes comportements (d)
Les projections de tendances
Les projections de tendances
[8] sont les façons les
plus simples de prendre en compte les implications
des évolutions démographiques sans se préoccuper
de l’hétérogénéité des situations individuelles ni du
bouclage macroéconomique, notamment l’effet de
l’évolution des taux de cotisation, des ratios de
dépendance, du niveau des prestations sur la
dynamique économique. Il s’agit d’une approche
approximative qui a une visée principalement
illustrative. On calcule un taux de croissance qui
dépend des hypothèses de croissance de la
productivité, d’évolution du chômage et de la
population active
[9]. Un cadre économique général
est ainsi dressé à partir d’hypothèses sur l’évolution
de l’âge moyen effectif de départ à la retraite. On
déduit alors l’évolution du ratio de dépendance
(rapport entre le nombre de retraités et le nombre de
travailleurs). Compte tenu d’une hypothèse
d’évolution du niveau de vie relatif entre retraités et
actifs occupés (et entre chômeurs et actifs occupés),
on en déduit la part des pensions de retraite (et des
prestations versées aux chômeurs) dans le PIB. Cela
fournit une évaluation simple de l’évolution du poids
des retraites pesant sur les actifs occupés due aux
seuls changements démographiques.
Les projections de tendance permettent néanmoins
d’aborder une formulation simplifiée de l’équilibre
des finances des régimes de retraites. Ce dernier
s’écrit :
(pension moyenne) ⋅ (ratio de dépendance)
= (taux de cotisation) ⋅ (salaire moyen).
Le salaire moyen considéré est le coût du travail
(salaire brut et cotisations patronales). Le taux de
cotisation défini ici est un taux apparent. Il mesure le
ratio entre les cotisations sociales versées et le coût
du travail.
Appelons
tr, le taux de cotisation retraite,
r, le ratio de
dépendance, et
ar, le taux de pension net
[10], rapport
entre la pension moyenne nette et le salaire moyen
net. À chaque période, on a :
(pension moyenne nette) = ar ⋅ (salaire moyen).
L’équilibre du système de retraites s’écrit alors :
autrement dit :
Si (1− α ) est la part des salaires dans la valeur ajoutée,
la part des retraites dans le PIB est :
Avec cette relation simple (que l’on peut bien sûr
généraliser un peu, notamment en prenant en compte
d’autres prestations sociales), on obtient la relation
qui décrit la contrainte comptable à chaque période.
Elle montre les conséquences de l’augmentation du
ratio de dépendance (r) du fait du vieillissement : soit
le taux de cotisations augmente, soit l’âge de départ
augmente (r diminue), soit la pension moyenne
relative (ar) diminue.
Cette app roche ne décrit pas la réalité
institutionnelle. Elle ne permet pas de prendre en
compte la diversité des situations présentes et
futures. Cependant, elle a deux grands avantages. Le
premier est sa simplicité. Le second est qu’elle
permet d’aborder la question des retraites de façon
globale et de poser la problématique essentielle de la
répercussion du vieillissement démographique sur le
niveau de vie des actifs et des retraités. Plus
précisément, elle permet de s’extraire d’un débat
purement technique et institutionnel sur les réformes
des régimes et d’évaluer le “triangle des contraintes ”
du système de retraite par répartition : le
vieillissement se traduira nécessairement par une
augmentation des cotisations sociales et/ou une
diminution du niveau de vie relatif des retraités et/ou
un recul de l’âge de départ à la retraite. La question
du choix social devient effective lorsque l’ampleur
des évolutions est chiffrée. C’est ce que permet cette
approche. En France, le Conseil d’Orientation des
Retraites (COR) estime par exemple que le maintien
du rapport entre la pension moyenne nette et le
salaire moyen net à son niveau actuel (78 %) suppose
une augmentation du taux de cotisation de 15 points
(par rapport au salaire brut)
[11]. Pour maintenir ce
ratio sans augmenter les cotisations, l’âge de départ à
la retraite doit augmenter de 9 ans. Le débat est posé.
Le COR décrit alors les solutions mixtes possibles.
Cette approche permet principalement de soumettre
les débats techniques à un choix de société beaucoup
plus large, mais elle est insuffisante notamment pour
s’interroger sur les inégalités entre régimes ou à
l’intérieur des régimes (par exemple, les pénalités
fortes en cas de départ anticipé ou retardé…). Elle ne
permet pas une approche descriptive de l’évolution
des régimes existants (équilibres financiers, niveau
des pensions versées). On peut cependant, de façon
ad hoc, faire une estimation hors modèle de
l’évolution du niveau relatif moyen des pensions
nettes dans les régimes existants à partir de cas types
et l’injecter dans la maquette macroéconomique.
C’est ainsi que le COR prévoit, en l’état actuel des
règles des régimes de retraite, une réduction de 78 à
64 % du taux de pension net. Cela supposerait
d’augmenter le taux de cotisation de 9 points ou de
reculer l’âge de départ de 6 ans.
Le principal inconvénient de cette méthode est lié à
la difficulté d’évaluer les réformes d’un point de vue
pratique, c’est-à-dire proposer leur mise en place et
étudier leurs conséquences à un niveau individuel
(identifier les gagnants et les perdants). À cet égard,
l’approche par les cas types
[12] et la microsimulation
peuvent être d’une grande utilité.
Les cas types dynamiques
L’approche par cas types consiste à évaluer le niveau
des pensions dont bénéficient et bénéficieront les
retraités selon une carrière professionnelle donnée et
des caractéristiques sociodémographiques données
(nombre d’enfants, statut du foyer, …). On mesure
en général le taux de remplacement plutôt que le
niveau de pension : le taux de remplacement (rapport
entre la pension liquidée et le dernier salaire) permet
d’évaluer dans quelle mesure le jeune retraité
conserve son niveau de vie quand il prend sa retraite,
mais aussi d’évacuer de la mesure la dérive liée à
l’augmentation générale du niveau de vie dans
l’économie. On peut aussi calculer le taux de
rendement interne.
Autant d’un point de vue statique les cas types sont
faciles à définir (les salariés au SMIC, les cadres
moyens, etc.), autant d’un point de vue dynamique la
notion de cas types est difficile à cerner
[13],
notamment du simple fait qu’il existe de la mobilité
sociale (un salarié ne reste pas forcément au SMIC
pendant toute sa vie). En général, les cas types
adoptés sont représentatifs d’une certaine réalité
[14],
mais il paraît difficile de se donner une distribution
des cas types représentative des différences
observées dans la société. La pertinence d’un cas
type peut aussi différer selon les cohortes
concernées : ainsi, pour la cohorte née en 1945, une
entrée dans l’activité à l’âge de 16 ans est une
hypothèse réaliste et pertinente; elle ne l’est plus si
l’on s’intéresse à une cohorte née en 1970. Par
ailleurs, le choix d’un cas type peut reposer
uniquement sur sa capacité à illustrer une propriété
particulière (avantage, anomalie, …) du système de
retraite.
L’étude de cas types nécessite une connaissance fine
de la législation en matière de calcul des retraites (cf.
le modèle Oscari de la Drees – Ministère des Affaires
sociales, voir Raynaud, 2003). Les approches par cas
type permettent d’avoir une vision simple du niveau
de vie assuré par le système malgré sa complexité
(systèmes de plafonds, cumul de plusieurs
pensions,…) et donnent une idée claire du niveau de
vie des retraites futures et des propriétés du système
dans toutes ses particularités, notamment la présence
de non-linéarités ou discontinuités dans le calcul des
pensions (voir par exemple Dupuis et El Moudden,
2002).
Les cas types peuvent être utilisés pour mesurer
l’effet des réformes sur l’évolution des niveaux de
vie ou les implications du système en termes de
redistribution intra-génération (par exemple, savoir
si les carrières ascendantes sont défavorisées …). Ils
permettent de comparer la générosité des différents
régimes en évaluant les taux de remplacement
assurés par chaque système à des profils de salaires
identiques. Ils sont aussi utilisés pour comparer la
générosité des systèmes de retraites dans différents
pays, notamment lorsque la logique des systèmes est
proche (pays d’Europe continentale ; pour une
comparaison entre l’Allemagne, la France et l’Italie,
voir Chagny et alii, 2001).
L’approche par cas types est un point de départ
nécessaire pour débuter l’analyse d’une réforme
mais inopérante pour appréhender les propriétés
globales. Cette approche pourrait connaître un
développement intéressant s’il était possible
d’attribuer à chaque cas type une pondération
suscep tible de reproduire des propriétés
distributionnelles globalement observées. En effet,
de telles pondérations permettraient d’amorcer une
analyse plus globale et donc de constituer des
agrégats de dépenses (pensions versées) et de
recettes (cotisations sur les salaires). La limite du cas
type repose, pour l’instant, sur la difficulté de trouver
ces pondérations. Une façon naturelle de dépasser
cette limite est le recours à un modèle de
microsimulation dynamique.
La microsimulation dynamique
La microsimulation dynamique est un outil de
simulation de trajectoires individuelles qui reflètent
les parcours socioéconomiques d’un échantillon
d’individus représentatifs de la population. La
nature représentative de l’échantillon permet de
reproduire des ordres de grandeurs agrégées
(moyenne des revenus, différents moments de la
distributions des revenus, taux de chômage, etc.) tout
en conservant la richesse d’évaluation basée sur un
niveau individuel. Ces modèles reproduisent alors
une réalité agrégée de la démographie et des droits à
la retraite. Ils permettent donc de déduire un
équilibre des finances publiques à partir d’unités
d’observation microéconomiques
[15].
La technique de microsimulation dynamique, dans
sa version la plus simple, n’introduit pas
véritablement des comportements. Cependant, les
modèles de microsimulation peuvent être améliorés
dès lors qu’on est en mesure d’introduire des règles
de choix individuels qui reposent sur un
comportement de maximisation d’un objectif sous
contrainte, d’où une classification également
possible avec les travaux de microéconométrie
comportementale (cf. Klevmarken et Olovsson,
1996). Par ailleurs, si un certain bouclage
macroéconomique est également pris en compte
grâce à une utilisation associée avec un modèle
macroéconométrique, un classement, dans le
tableau, en position (c) ou (d) est envisageable.
Enfin, certains modèles (cf. le recensement fourni
dans la troisième partie) reposent sur des populations
ou coh ortes fictives, ce q ui signifie que
potentiellement, ils peuvent également se classer en
(a), ou même avec les cas types ou avec les modèles
d’équilibre général calculable, en (b), si on a en plus
un bouclage macroéconomique. Dans l’état actuel de
la modélisation, la réalité est plutôt proche de la
configuration de la case (3), car aucune tentative ne
peut présenter un véritable fondement
microéconomique global des comportements ni un
bouclage réellement pertinent.
Modélisation micro-économétrique des
comportements
De nombreuses études économétriques essayent de
tester et d’estimer des modèles comportementaux
fondés sur des hypothèses de rationalité. Ces études
permettent de mesurer des modèles
comportementaux. Ces applications portent
notamment sur la démographie (choix du nombre
d’enfants), sur les choix de participation au marché
du travail et aussi sur la modélisation des choix de
départs en retraite (cf. le survey de Bommier et alii).
Il n’y a pas de véritables mises en perspective car il
faudrait pour cela disposer de prévisions.
Les modèles microéconométriques ont un “ intérêt
réduit ” pour analyser les réformes dans la mesure où
l’étroitesse de la portée de leur résultat dépend du
particularisme du comportement étudié (choix de
durée d’activité, sensibilité de l’offre de travail
pendant l’activité, etc.). Cependant, ces modèles
peuvent être réemployés dans le cadre d’une
microsimulation dynamique (sur ce point, voir
Klevmarken, 1997). Dans ce cadre-là, il peut se
poser des problèmes de cohérence globale entre les
différents modèles comportementaux car les
microfondements ne sont pas nécessairement
compatibles.
Les modèles macro-économétriques
Ces modèles reposent sur un schéma d’analyse
néokeynésien où la structure causale développée est
du type : à court terme, la demande agrégée (la
consommation, l’investissement, les dépenses des
administrations publiques et les exportations)
détermine l’offre agrégée (la production et les
importations) qui, en retour, détermine les revenus et
le taux de chômage ; les conditions de l’offre ont, à
court terme, un effet sur le commerce extérieur, via la
compétitivité et les tensions sur les capacités de
production, d’une part, et sur la consommation via
l’inflation, d’autre part. Les équations qui expriment
les comportements macroéconomiques sont
estimées par des procédures économétriques
classiques employées pour les séries temporelles.
Ces modèles ne sont pas conçus pour s’appliquer à la
réforme des systèmes de retraite. Pourtant, leur
potentiel d’utilisation se situe à plusieurs niveaux :
- à l’issue de la proposition d’équivalence
ricardienne (Barro, 1974), de la théorie du cycle de
vie (Ando et alii, 1957) ou du revenu permanent
Friedman, 1957), des auteurs comme Feldstein
(1974) ont proposé d’introduire les droits à la retraite
dans la fonction de consommation macroéconomique et ont trouvé une corrélation
positive
[16];
- ils peuvent fournir une analyse de l’impact du
vieillissement en termes de demande de biens et
services (conséquences des transferts entre
générations sur les consommations des jeunes et des
vieux ; mutation de la structure de la demande et
conséquences sectorielles);
- les modifications de la structure démographique
ont selon toute vraisemblance des effets importants
sur le marché du travail. Par exemple, l’entrée
massive en retraite des générations du baby-boom
devrait libérer de nombreux postes
[17]. Dans le
domaine de l’évaluation des retraites à long terme,
une réflexion sur le taux de chômage est donc
essentielle (cf. Rapport du Conseil économique et
social). L’attrait potentiel de ces modèles réside donc
dans l’incorporation d’un taux de chômage
endogène résultant de déséquilibres sur l’ensemble
des marchés.
On peut noter en France le travail réalisé par Beffy et
alii (2003) à l’aide du modèle MESANGE développé
par l’Insee. Ce modèle présente des propriétés
keynésiennes (régime de demande) à court terme et
néoclassiques (régime d’offre) à long terme. Ils
examinent différentes voies d’ajustement des
paramètres institutionnels face à la déformation de la
pyramide des âges. L’horizon de simulation est
relativement long : l’année 2020 a été retenue.
Les modèles d’équilibre général calculable avec
générations imbriquées (MEGCGI)
Les MEGCGI fournissent des éléments d’évaluation
sur les comportements d’accumulation de richesse,
de consommation et d’offre de travail. L’ensemble
des secteurs de l’économie est pris en compte :
cohortes de ménages, entreprises et secteur public.
L’économie est bouclée, les richesses produites sont
consommées ou stockées. Les finances publiques
sont intertemporellement équilibrées. Des marchés
en situation de concurrence pure et parfaite
fournissent des prix qui égalisent les offres et les
demandes optimales de l’ensemble des agents
[18]. La
notion d’individu dans un modèle d’équilibre
général calculable à générations imbriquées est
abstraite. Il s’agit d’un individu représentatif de
l’ensemble d’une cohorte et parfois d’une classe
sociale ; celui-ci maximise son bien-être sur
l’ensemble de son cycle de vie compte tenu des
revenus qu’il anticipe rationnellement (salaires nets
de cotisation, pensions de retraite). Les trajectoires
individuelles sont connectées à la dynamique
macroéconomique globale de l’économie par
l’intermédiaire de l’évolution des prix (le salaire et
les taux d’intérêt) et l’évolution des finances
sociales. Ce type d’exercice de simulation a une
cohérence interne forte d’autant plus que les
comportements sont parfaitement micro-fondés
(voir le
survey de Le Cacheux et Touzé, 2002). Les
points faibles de ces approches proviennent en
grande partie d’un contenu empirique, quant à lui
plus réduit au regard des autres approches.
Notamment, la valeur des paramètres n’est pas
obtenue par des techniques économétriques mais par
des méthodes de calibrage, pour lesquelles il n’existe
pas véritablement de tests (au sens de la théorie
statistique) de la validation empirique.
Dans ces modèles, l’hétérogénéité, en dehors de la
prise en compte de l’âge, a été jusqu’à présent rare.
Cela signifie que les propriétés redistributives des
systèmes de retraite sont difficiles à saisir.
Néanmoins, la nouvelle génération de modèle
introduit l’hétérogénéité de deux façons : soit une
hétérogénéité innée de productivité (chaque cohorte
est subdivisée en sous-groupes de productivité,
sortes de cas types dynamiques où il n’y pas de
mobilité sociale pendant le cycle de vie entre chacun
des sous-groupes) ; soit une introduction de chocs
idios yncratiques sur le revenu (sorte de
microsimulation stochastique
[19] avec des chocs de
productivité, un risque de chômage ou un risque de
mortalité) qui conduisent à des histoires différentes
sur le cycle de vie. Kotlikoff (1995) a été l’un des
premiers à s’intéresser à l’hétérogénéité. Sur ce
sujet, on peut trouver en France deux applications
récentes : par exemple, Hénin et Weitzenblum
(2002) s’intéressent à la première configuration
(chaque cohorte est subdivisée en plusieurs groupes
de revenu), tandis que Hairault et Langot (2002,
2003) traitent un modèle qui se rapproche de la
seconde configuration.
La microsimulation dynamique :
principes et propriétés
La microsimulation est, à la base, une démarche de
physicien et elle a été développée pour étudier les
propriétés de systèmes stochastiques complexes. Le
préfixe “micro” signifie que la simulation porte
directement sur des entités élémentaires (cellules,
particules ou individus), considérées alors comme
les plus petites, et non sur des agrégats – ces derniers
se trouvent seulement simulés indirectement –. Il
s’agit donc d’effectuer des projections sur ces entités
élémentaires et non seulement sur leur masse
[20]. Les
capacités actuelles de calcul font que cette technique
s’emploie dans de nombreuses disciplines : la
physique, la biologie, l’épidémiologie, l’oncologie,
la chimie, …, dans des optiques opérationnelles ou à
des fins purement scientifiques, mais aussi dans le
domaine de la démographie (projection de
population), de la logistique et la gestion de réseaux
de transport. Il faut noter aussi des utilisations
potentielles en matière d’organisation pour les
entreprises, notamment en ce qui concerne la gestion
du personnel (prévoir les départs et les promotions,
mais aussi estimer le passif social) et la gestion des
stocks (par exemple, quelle est la règle qui minimise
le risque d’une rupture de stock ?).
La microsimulation peut être statique ou dynamique.
Les modèles statiques reposent sur des observations
en coupe et chaque entité élémentaire est étudiée
sans perspective dynamique. En revanche, les
modèles dynamiques ont pour objet de fournir des
projections de trajectoires pour chaque composante
élémentaire et ils sont construits à partir
d’observations longitudinales. Appliqué à un
ensemble composé d’individus (la population d’une
nation), le modèle dynamique va être utilisé pour
faire vieillir
[21] (ou rajeunir s’il s’agit de reconstituer
des trajectoires individuelles incomplètement
observées) un échantillon initialement observé de la
population, mais aussi pour faire “naître” de
nouveaux individus puis pour “raconter” leur
histoire, de façon à reproduire une évolution
ressemblante, dans le sens où les propriétés
observées en termes de corrélations croisées et de
distribution des possibles sont bien reproduites, à
celle que pourrait avoir la société.
On doit à Orcutt (1957) le premier projet
d’application dans le domaine des sciences sociales,
c’est-à-dire une utilisation de la microsimulation à
des fins d’études des propriétés démographiques et
économiques d’une nation. Orcutt se soucie à
l’époqu e de la pauvreté de l’analy se
distributionn elle o fferte p ar les modèles
macroéconomiques appliqués. Il propose alors une
nouvelle voie fondée sur une modélisation des
comportements individuels. L’aspect dynamique
n’est véritablement traité qu’à partir des années 1970
dans le cadre de la construction aux États-Unis du
modèle Dynasim
[22]. Depuis les années 1990, les
physiciens (cf. Castiglione, 2001) emploient
ég alemen t d es tech niques similaires d e
microsimulation dynamique pour étudier les
microstructu res d es march és fin anciers
(
econophysics).
Dans cette partie, les informations nécessaires à la
construction d’un modèle de microsimulation
dynamique appliquée à l’analyse des retraites sont
détaillées, avant d’aborder la nature technique de
l’exercice ainsi que les interrogations sur la fiabilité
des résultats. En guise d’illustration des problèmes
liés à l’emploi d’une méthode de simulation
stochastique, deux exemples élémentaires de
microsimulation dynamique font l’objet d’une étude
précise dans une annexe.
Les informations nécessaires à la construction
d’un modèle
Dans le domaine économique et social, l’objectif de
la microsimulation dynamique est de reproduire des
trajectoires de cycles de vie qui soient pertinentes au
regard des processus d’évolution sociale observés et
des besoins de l’analyse. Ces processus décrivent les
lois qui gouvernent les destins individuels. Ils
traduisent les conséquences individuelles du
fonctionnement global de la société. Ces
conséquences traduisent des choix d’action
(mariage, départ à la retraite, etc.) ou des obligations
(licenciement, naissance, décès, etc.). Les destins
individuels sont dépendants des caractéristiques
socioéconomiques : l’environnement économique et
l’histoire passée concourent au devenir de chacun
mais ce devenir est en partie aléatoire, c’est-à-dire
qu’il est en partie inexplicable et donc soumis, à
défaut, au hasard
[23].
Ces processus font l’objet d’une modélisation
microéconométrique préalable (spécification d’une
relation puis estimation des paramètres de la relation
identifiée). Le choix d’une relation consiste à
déterminer les éléments connus qui expliquent le
mieux, d’un point de vue logique et statistique, les
évolutions des différentes valeurs prises par chaque
caractéristique ainsi que la nature purement
aléatoire. À ce stade, l’un des attraits de la
microsimulation est de tenir compte des corrélations
croisées entre les différentes caractéristiques et leurs
valeurs passées. Les observations des variables se
réalisent sous une forme quantitative continue
(mesurabledans une unité définie préalablement, par
exemple le salaire en euro), quantitative discrète (par
exemple l’âge) ou qualitative (non mesurable et par
nature discrète). En particulier, les méthodes
économétriques employées pour estimer les
processus qui décrivent l’évolution de variables
discrètes consistent à estimer directement la
probabilité de survenance d’un événement (modèle
Logit ou Probit). Lorsque le temps est considéré
comme continu, les méthodes économétriques
utilisées font appel à des modèles de durée; il s’agit
alors de fournir une estimation de la distribution de
probabilité du temps écoulé entre deux événements.
En règle générale, ne sont reprises que les
conséquences des caractéristiques individuelles et
globales (par exemple le taux de chômage) sur les
histoires individuelles et non les conséquences des
histoires individuelles sur les variables globales
(notion de bouclage macroéconomique). Cependant,
les paramètres institutionnels du régime de retraite
peuvent se relier facilement aux histoires
individuelles dès lors que les modélisateurs ont la
possibilité d’inclure des règles d’ajustements des
taux de cotisation et des règles de calcul des retraites
(taux de remplacement, âge de départ) qui préservent
l’équilibre des finances sociales (bouclage partiel).
En retour, ces ajustements peuvent jouer un rôle
important lorsque les paramètres institutionnels
modifient les comportements individuels (par
exemple, le mode de calcul des retraites peut
influencer les incitations à la cessation d’activité).
L’élément clé dans le calcul des retraites est l’histoire
salariale. L’occupation d’un emploi et le montant du
salaire constituent donc les deux caractéristiques
socioéconomiques de base qui doivent être
observées et modélisées. Un tel besoin va nécessiter
l’identification ou la reconstitution de carrières
salariales. En outre, compte tenu des clauses de
réversion dans le calcul des retraites en faveur du
conjoint survivant et de l’utilisation possible de la
microsimulation pour analyser la transmission
patrimoniale, il peut paraître utile de connaître les
liens familiaux entre les différents individus. Dans
ce but, de nombreux modélisateurs utilisent
d’ailleurs une population fermée, c’est-à-dire une
population où l’ensemble des liens familiaux
(filiation, mariage ou union libre voire divorce s’il
s’agit de reproduire les ruptures de liens) entre les
différents individus est conservé ou créé à l’aide
d’algorithmes d’appariement. Ces caractéristiques
sont souvent les principaux éléments à reproduire
pour être en mesure de calculer les pensions de
retraites.
La description des individus comprend d’autres
caractéristiques. Chacune d’elle nécessite aussi une
modélisation particulière de type microéconométrie.
La liste suivante récapitule l’ensemble des
informations généralement intégrées dans les
différents modules, dont l’interconnexion globale
constitue le modèle de microsimulation (voir par
exemple Insee, 1999) :
- la démographie : pour évaluer les évolutions de la
démographie, il est nécessaire de comprendre les
mécanismes de migration interne géographique
entre différents États ou régions d’une zone
économique), d’immigration / émigration, ainsi que
les évolutions des taux de survie et fécondité
distribution des âges pour le premier enfant puis les
autres);
- la nuptialité : l’unité individuelle n’est pas
suffisante pour appréhender correctement la
législation. Il faut en général être en mesure de
connaître les caractéristiques de la cellule familiale.
Il s’agit alors d’identifier les différents éléments qui
expliquent la formation de liens de type mariage ou
union libre ainsi que les divorces;
- l’éducation et l’acquisition de l’indépendance : il
s’agit d’identifier et de reproduire différents cursus
scolaires et de transmission de capital humain ainsi
que les mécanismes de décisions de départ du
domicile parental. L’acquisition de l’indépendance
es t en général co nnectée à la carri ère
professionnelle;
- l’état de santé : il peut apparaître important de
connaître les caractéristiques des individus en
termes de morbidité dans la mesure où la mortalité
est reliée à la maladie et dans la mesure où le
financement des dépenses de santé des plus âgés peut
s’apparenter à une forme de système par répartition
où les prestations sont en nature (pour un survey sur
les modèles de microsimulation appliqués à la santé,
voir Breuil-Genier, 1998);
- les carrières professionnelles : la modélisation des
carrières est un point crucial. Il s’agit en particulier
de retracer les transitions entre les différents états
d’activité (emploi, chômage) et d’inactivité
(scolarité, retraite, éducation des enfants), les
mécanismes de promotion salariale ou de croissance
des revenus d’activités pour les indépendants, mais
aussi les changements sectoriels dans la mesure où
ils peuvent occasionner des changements de régimes
de rattachement (par exemple carrières mixtes dans
le privé et le public);
- les revenus : pour appliquer certains barèmes
fiscaux, il est souvent nécessaire de connaître
l’ensemble des revenus des ménages et de distinguer
les revenus issus du travail (salaire, nombre d’heures
travaillées, etc.) de ceux résultant de la détention
d’un capital;
- le patrimoine : il s’agit d’identifier les principaux
éléments qui motivent les comportements
patrimoniaux (acquisition de logement ou
placements financiers) ainsi que les logiques
dynastiques (les héritages et les transmissions in vivo
de patrimoine). L’évaluation du montant des
patrimoines est un aspect important si l’on souhaite
connaître les revenus complémentaires à ceux des
pensions par répartition;
- les institutions publiques et la législation
sociale
[24] : il s’agit de décrire les différents
instruments de taxation ou de versements de
prestations ainsi que les formes d’assurances
publiques (et d’affiliation) en matière de retraite,
santé, survie et dépendance.
Ainsi, en appliquant des tables de mortalité
conditionnelle, des comportements de choix de
nuptialité et de maternité, des règles d’évolution des
salaires (ou de revenus d’exploitation pour les
entrepreneurs individuels), des règles de
licenciement ou des choix de cessation d’activité
professionnelles, etc., il va être possible de produire
(ou reproduire s’il s’agit d’invention des passés)
l’évolution professionnelle et familiale probable
d’un échantillon d’individus pour une population
donnée. On peut alors en déduire, par exemple, la
progression des dépenses des branches vieillesse (ou
du risque dépendance) tout en ayant des ordres de
grandeur sur l’évolution des distributions des
différentes caractéristiques socioéconomiques dans
la population.
Il est ainsi possible d’étudier l’impact d’une réforme
(modification du taux de cotisation, des conditions
de départ en retraite ou du calcul de la pension) selon
un certain agenda de mise en place progressive, tant
au niveau global (les montants totaux de dépenses et
de recettes) qu’en termes d’incidence sur les
inégalités intra et intergénérationnelles (par exemple
en mesurant les effets des réformes par décile de
revenu de cycle de vie). Le critère généralement
utilisé pour mesurer la générosité du régime de
retraite pour un individu est son rendement ou plus
précisément son taux de rendement interne (TRI).
La nature technique de l’exercice
D’un point de vue technique, un modèle de
microsimulation dynamique est un générateur de
trajectoires individuelles. Ces trajectoires ont une
nature stochastique
[25] puisque, à chaque période, le
hasard affecte un avenir parmi un ensemble de
possibles. Il permet ainsi de constituer un échantillon
de trajectoires individuelles qui est susceptible de
refléter, dans la mesure où le balayage aléatoire est
supposé suffisamment large et non biaisé, la réalité
économique, tant dans ses particularismes
individuels (propriétés en termes de distributions
longitudinales et verticales) que dans ses tendances
globales (évolution générale qui caractérise la
société et dont on peut établir des pronostics en
dehors d’un modèle de microsimulation).
Chaque processus identifié se présente sous une
formulation mathématique quantifiée qui traduit une
relation logique avec des éléments endogènes que
sont les caractéristiques présentes et passées de
l’individu (qui résultent elles-mêmes des chocs
passés), des éléments exogènes de nature non
stochastique
[26] (par exemple la législation) et d’un
aléa dont la distribution est connue. Ce dernier
pourra être reproduit à l’aide d’un générateur de
nombres au hasard (il s’agit de la nature exogène et
stochastique du processus).
De façon concrète, la description de la société se
réalise à l’aide d’informations de nature discrète
(qualitative ou mesure quantitative) ou continue. Le
cœur d’un modèle de microsimulation dynamique
peut donc être schématisé de la façon suivante.
Considérons des individus décrits par des
caractéristiques de nature discrète (vecteur de
variables qualitatives ou quantitatives noté
y) et de
nature continue (vecteur de variables quantitatives
noté
x). On note
z le vecteur de variables exogènes
[27]
qui décrivent les environnements institutionnel
(taux de cotisation, taux de remplacement, etc.; ces
paramètres se trouvent modifiés lorsqu’une réforme
est simulée) et macroéconomique (hypothèses sur le
taux de chômage, le taux de croissance de la
productivité, etc.). La simulation de réformes des
systèmes de retraite signifie l’utilisation de valeurs
institutionnelles alternatives.
t désigne l’indice
temporel et
i l’indice individuel.
À un instant donné t, on observe une distribution des
valeurs prises par les différentes caractéristiques
dans la population :
- les valeurs prises par les caractères continus x ∈ Ω
it sont distribuées suivant une loi caractérisée par une
fonction F x( )qui mesure la proportion d’individus
t i à l’instant t tels que x x it ≤;
- les valeurs prises par les caractères discrets
y y y y it j N ∈ { ,..., ,..., } 1 sont distribuées dans les
proportions p prob y y t it = =( ) pour y y yN =1,...,
y
avec
-
Pour un environnement global (économique et
institutionnel) donné zt, l’évolution des valeurs
prises par les caractéristiques est gouvernée par des
processus stochastiques. Pour simplifier la
présentation, seules les caractéristiques passées
– l’étendue du passé étant limitée à la période
précédente – sont supposées influer sur ces
processus : aucune codépendance directe
(simultanéité) entre deux caractéristiques observées
au même instant n’a été supposée. On peut
représenter ces processus de la façon probabiliste
suivante :
- la fonction G x x y z( ', , , ) mesure la probabilité
t t conditionnelle pour un individu i d’avoir une
réalisation x x'≤ sachant que sa situation passée
i t, +1 était x x i t, = et y y i t, =;
- la fonction q y x y z t t ( ', , , ) mesure la probabilité
conditionnelle pour un individu i d’avoir une
réalisation y y'= sachant que sa situation passée
i t, +1 était x x i t, = et y y i t, =.
Idéalement
[28], on souhaiterait, à chaque période,
calculer l’évolution exacte
[29] de la distribution des
valeurs prises en coupe (analyse transversale) par les
différentes variables dans la population :
ainsi que mémoriser l’intégralité des trajectoires
individuelles pour connaître la distribution
longitudinale des trajectoires, que l’on pourrait
mesurer par exemple comme la proportion
d’individus i tels que les histoires individuelles
vérifient :
En pratique, on ne peut pas calculer la valeur
théorique de ces distributions car la procédure de
simulation repose sur une sélection de trajectoires,
par succession de tirages aléatoires, pour un grand
nombre d’individus, et non sur une méthode de
calcul basée sur un
continuum d’individus. Le
continuum
[30] – atomicité de chaque agent – serait
une garantie pour calculer avec exactitude la
distribution. Pour cela, il faudrait recourir à des
méthodes d’intégration numérique. De tels calculs
nécessiteraien t également des ressources
informatiques importantes
[31]. Avec un modèle de
microsimulation, les distributions sont seulement
calculées à partir d’un nombre fini d’individus. Sous
certaines hypothèses, la loi des grands nombres peut
assurer l’annulation tendancielle de la variance de
l’estimateur de la moyenne mais la taille de
l’échantillon nécessaire peut être considérable. Tout
dépend alors de la vitesse de convergence vers 0 de la
variabilité de l’estimateur du moment considéré. Il
en ressort que les résultats agrégés (les différents
moments des lois de distribution des données
longitudinales ou en coupe) issus des simulations
peuvent suivre un processus aléatoire complexe avec
une variance conditionnée par la taille de
l’échantillon (voir les éléments de discussion sur
deux exemples en annexe). L’horizon temporel de
simulation joue également un rôle car les erreurs
s’accumulent et la variance de fluctuation de
l’agrégat peut croître avec la durée de la projection.
Par ailleurs, pour les distributions longitudinales, de
nombreuses trajectoires ne seront jamais simulées. Il
y a certainement matière à réfléchir sur l’importance
de ces “disparitions” dans l’utilisation des résultats
agrégés
[32], notamment pour calculer des indicateurs
d’inégalités intra et intergénérationnelles ou de
générosité du système.
Fiabilité des résultats
La microsimulation dynamique donne deux
principaux résultats : une évaluation du montant des
droits à la retraite à un niveau individuel ainsi qu’à un
niveau agrégé. Il est important de s’interroger sur la
pertinence de ces mesures. La fiabilité des
résultats
[33] s’apprécie en comparant les objectifs
idéaux de la microsimulation et les contraintes
techniques (qualité des données utilisées, taille des
échantillons, choix de spécification et puissance de
calcul des ordinateurs). Les objectifs idéaux de la
microsimulation sont de fournir des estimations de la
réalité probable dont la qualité de précision se
mesure par les faiblesses du biais en espérance et de
la variance
[34]. Les sources d’imprécision dans ces
estimations proviennent de la nature même de la
microsimulation (emploi de banques de données et
de techniques de modélisation économétrique) mais
aussi de son aspect dynamique (prise en compte du
temps et utilisation d’une méthode de simulation
stochastique).
Les sources d’imprécision liées à la microsimulation
en général
Les sources d’imprécision liées à la microsimulation
en général sont de quatre types :
- La construction d’un modèle de microsimulation
nécessite le recours à de nombreuses banques de
tant pour caractériser les individus que
identifier et quantifier les processus qui
déterminent les changements d’état de chacun
d’entre eux. Il peut donc apparaître deux types
d’erreur d’échantillonnage
[35] qui vont concerner les
individus sur lesquels porte précisément la
microsimulation, mais aussi les individus dont
l’observation a permis l’estimation des paramètres
du modèle.
- Les spécifications retenues : le recours à une
spécification de comportement ou d’une relation
causale repose toujours sur un certain arbitraire et
expose donc à l’oubli de variables ou à l’emploi de
formulations inadaptées (par exemple, modélisation
linéaire plutôt que non-linéaire, traitement des
anticipations individuelles, etc.).
- Les contraintes d’obs ervation : les
spécifications des processus peuvent en raison
d’observations manquantes ignorer l’importance de
certaines variables.
- Certains modèles utilisent une population (ou
cohorte) fictive, qui reproduit, seulement et en
principe, certaines propriétés distributionnelles (en
termes de moments et de corrélations croisées) de la
population (ou cohorte) réelle. Pour ces types
d’échantillons, il est très difficile de connaître les
propriétés d’échantillonnage.
Les sources d’imprécision spécifiques à la
microsimulation dynamique
Les sources d’imprécision spécifiques à la
microsimulation dynamique proviennent de l’aspect
dynamique et de l’utilisation d’une technique de
simulation stochastique.
- La reconstitution des passés : lorsque les données
le passé sont manquantes, il est nécessaire de
rétropoler et, de la même façon que l’on peut se
sur les estimations futures, on peut
commettre des erreurs sur les passés.
- La discrétisation du temps
[36] (fréquence
en général) peut conduire à des
approximations sur la durée effective des différents
événements (par exemple on n’est pas forcément
toute l’année mais seulement une partie).
- Les estimations de tendance dans l’évolution des
comportements ou de certaines variables
d’environnement macroéconomique (par exemple le
de chômage, l’allongement de la durée de la vie,
l’allongement de la durée des études, l’augmentation
l’offre de travail féminine, l’évolution du progrès
technique) peuvent être erronées.
- L’absence de bouclage macroéconomique
[37] :
modèles de microsimulation produisent des
d’analyse prospective tout en restant en
équilibre partiel (environnement global prédéfini).
Autant dans une analyse statique on peut considérer
dans un premier temps (en première approximation)
que le problème étudié de façon isolée n’a pas
d’influence sur le reste de l’économie, autant dans
une perspective dynamique sur longue période
(entre 40 ans et un siècle) le raisonnement avec
scénario macroéconomique inchangé, lorsqu’on
introduit des réformes, est plus délicat. Parmi les
évolutions macroéconomiques susceptibles d’être
également influencées par les réformes, on peut
noter le taux de chômage (sensible à l’évolution de
l’offre de travail), l’accumulation de capital
productif et la demande globale (par exemple
l’évolution de la consommation des vieux par
rapport à la consommation des jeunes).
- L’imperfection des générateurs de nombres au
hasard : a priori, cet élément est marginal, compte
tenu des études préalables de validation qu’ils
suscitent.
- La méthode de simulation stochastique
s’apparente à une technique d’échantillonnage de
trajectoires et l’in suffisance des tail les
d’échantillons introduit une variabilité artificielle
dans les résultats agrégés
[38]. Cette variabilité se
traduit par des évolutions erratiques. Cette
insuffisance peut rendre délicate l’exploitation des
distributions longitudinales pour évaluer le montant
total des droits à pension à un niveau agrégé ou traiter
des questions d’équité.
Pour beaucoup de ces sources d’imprécision, il est
difficile d’établir une mesure de la variance
supplémentaire et des biais qu’elles peuvent induire.
Pour certains types d’imprécision, il est toujours
possible de recourir à des méthodes d’inférence
statistique, mais celles-ci nécessitent d’importantes
ressources informatiques. Établir une marge de
confiance globale semble donc plutôt difficile
[39].
C’est pourquoi, les marges réelles de précision des
estimations que les économètres ont l’habitude de
présenter, lorsqu’ils réalisent des prévisions
macroéconomiques à l’aide de modèles usuels de
séries temporelles, ne peuvent pas vraiment être
fournies. Par ailleurs, la fiabilité des estimateurs,
obtenus par simulation stochastique, des différents
moments des distributions peut également poser un
souci important. Ce point d’interrogation fait l’objet
d’une discussion particulière dans le cadre de
l’étude, qui figure en annexe, de deux processus
stochastiques élémentaires.
La microsimulation dynamique en
pratique : un recensement des
principaux modèles
L’introduction de la microsimulation dans le
domaine des sciences sociales est due à Orcutt
(1957). Partant du constat de l’incapacité des
modèles macroéconomiques de renseigner sur
l’impact des politiques publiques sur, par exemple,
la répartition des revenus des agents dans
l’économie, Orcutt proposa de développer des outils
de simu lation basés sur des d onnées
microéconomiques. Tout d’abord statiques
[40], les
modèles de microsimulation ont vu l’introduction
d’éléments dynamiques au cours des années 1970.
Toutefois, bien que la construction du premier
modèle de microsimulation dynamique (Dynasim)
ait été initiée dès 1969 aux États-Unis, ce n’est que
depuis une quinzaine d’années que cet outil
d’analyse économique connaît son essor.
L’accroissement des capacités de calcul et la
disponibilité de données microéconomiques sont les
principaux facteurs de son développement dans les
années quatre-vingt-dix. Dans cette partie, nous
tentons de dresser un inventaire des principaux
modèles existants. Les articles de O’Donoghue
(2000) et de Zaidi et Rake (2001) sont deux articles
de référence qui fournissent de nombreuses
informations sur le contenu des modèles.
O’Donoghue (2000) inventorie et donne des détails
techniques précis sur les modèles. Zaidi et Rake
(2001) fournissent un recensement moins complet
mais tentent d’énoncer un certain nombrede règles et
bilans sur les conditions de faisabilité et de fiabilité
d’un modèle. Dans une perspective d’analyse
statistique, on peut noter l’article de Wolf (2000) qui
prés ente un bilan critiqu e de techniq ues
économétriques d’estimation employées dans la
construction des modèles de microsimulation. Un
recensement des principaux modèles opérationnels
dans le monde est ici tout d’abord effectué. Le cas
français avec le modèle Destinie est ensuite abordé
plus en profondeur.
Les principaux modèles opérationnels
Au jourd’hu i, on recense des modèles de
microsimulation dynamique dans la quasi-totalité
des pays développés. Dans les tableaux 1,2 et 3, un
résumé des particularités des principaux modèles est
donné. Ce descriptif comprend six rubriques : le pays
d’étude, l’institution qui assure la construction du
modèle, les références bibliographiques majeures, le
type de base de données utilisé, la nature (population
réelle ou fictive) et la taille de l’échantillon ainsi que
la dimension du temps (discret ou continu). Les
modèles ont été regroupés par zone géographique :
l’Amérique du Nord, l’Europe et l’Asie-Océanie.
Par son rôle pionnier et sa richesse en matière de
bases de d onnées, les États-Unis son t
incontestablement le pays le mieux doté. Les
modèles Dynasim 2 et Corsim sont certainement les
plus aboutis. Ce dernier est à la base du modèle
canadien Dynacan et du modèle suédois Sverige.
Bien que la construction des modèles reste
majoritairement dans le domaine de la recherche, les
institutions administratives sont de plus en plus
partie prenante (Dynacam, MINT, SFB3, Destinie,
Pensim, Mosart, Sesim), ce qui révèle l’intérêt que
présente la microsimulation dans l’évaluation des
politiques publiques. La quasi-totalité des modèles
présentés est utilisée afin d’analyser les systèmes de
retraite. On notera néanmoins que certains d’entre
eux permettent également d’étudier les politiques de
santé (Dynamod, Harding, LifePaths, Nedymas).
L’Europe est la région du monde qui regroupe le plus
de modèles, mais cette particularité résulte de la
multitude des régimes de retraite. L’Italie, le
Royaume-Uni et la Suède sont les trois pays les
mieux dotés, avec plusieurs modèles opérationnels.
En Australie, le modèle Natsem a un rôle dominant et
réalise de nombreux travaux méthodologiques sur le
sujet, qui sont diffusés sous la forme de technical
papers (par exemple, Galler, 1997 ; Baekgaard,
2002).
Depuis l’origine, les comparaisons entre les
différents modèles sont fréquentes et elles ont
conduit à plusieurs publications collectives. Parmi
celles-ci, on peut remarquer celles sous la direction
de Orcutt
et alii (1986), Hancock et Sutherland
(1992), Harding (1993,1996) et Milton
et alii
(2000). Les besoins de concertation se traduisent
également par l’apparition de groupes de travail
internationaux. Par exemple, le
ESRC-Sage
International Network
[41] rassemble autour du Sage
(Royaume-Uni) des constructeurs en provenance de
quatre pays européens : le SFI (Institut indépendant
et affilié au Ministère des Affaires sociales) pour le
Danemark, l’Insee pour la France, le ESRI
(
Economic and Social Research Institute) pour
l’Irlande ainsi que l’université de Lund et le
National
Insurance Board pour la Suède. Le SAGE est un
centre de recherche affilié à la
London School of
Economics.
L’expérience française en particulier
Le travail fondateur de la microsimulation
dynamique en France est attribuable à Blanchet et
Chanut (1997) et est présentée de façon détaillée
dans Insee (1999). Le modèle Destinie a été bâti
autour de l’enquête Actifs Financiers 1991; il a été
récemment mis à jour à l’aide des données de
l’enquête Patrimoine 1998. Seules les retraites
publiques de base (régime général) des salariés du
privé sont étudiées. Dans la population reproduite
par le modèle, il n’y a ni agents de l’État, ni
artisans-commerçants, ni professions libérales, ni
chefs d’entreprise. Ce modèle a depuis engendré une
série de travaux particuliers de microéconométrie
sur les ménages en matière de comportement de
fécondité (Robert-Bobée, 2001), de transferts entre
les générations (Bonnet et Mahieu, 1999), de choix
de cessation d’activité (Mahieu et Sédillot, 2002) et
de carrières salariales (Colin, 1999).
Tableau 1
modèles de microsimulation dynamique en Amérique du Nord
Tableau 2
modèles de microsimulation dynamique en Europe
Tableau 3
modèles de microsimulation dynamique en Asie et Océanie
On notera cinq références majeures d’utilisation du
modèle à des fins d’évaluation de réformes (Pelé et
Ralle, 1997 ; Blanchet et Chanut, 1998 ; Bardaji,
Sédillot et Walraet, 2002) ou des propriétés
redistributiv es du sy stème de retraite
français (Bonnet et Mahieu, 1999 ; Walraet et
Vincent, 2002).
Pelé et Ralle (1997)
[42] utilisent le modèle Destinie
pour étudier les conséquences de la réforme de 1993,
qui a augmenté la durée de cotisation nécessaire à
une retraite à taux plein (160 trimestres au lieu de
150) et accru le nombre d’années pris en compte dans
le calcul des pensions (25 au lieu de 10). L’analyse
porte sur la génération 1960, qui est la première
génération à laquelle s’appliquera intégralement la
réforme. Les auteurs trouvent que la réforme de 1993
produit des effets importants en termes de report de
l’âge de la retraite puisque 35% de l’échantillon
repousserait son départ à la retraite. Par ailleurs,
selon les situations particulières retenues, la baisse
moyenne de la pension du régime général varie entre
3,5% et 16,8%.
Blanchet et Chanut (1998) s’intéressent également à
la réforme de 1993. Leurs résultats permettent
d’illustrer les conséquences de cette réforme en
termes de variation des revenus sur le cycle de vie.
Ils ne fournissent pas d’estimations chiffrées des
conséquences de la réforme sur les inégalités de
cycle de vie. Mais ils remarquent que la
microsimulation met fortement en évidence un effet,
souvent peu commenté, selon lequel l’allongement
de la durée de référence pour le calcul du salaire
moyen n’a pas d’effet pour les travailleurs
accomplissant une carrière salariale toujours
au-dessus du plafond de la Sécurité sociale. Par
ailleurs, ils remarquent que les résultats en termes
d’inégalités sont très sensibles aux hypothèses de
mobilité salariale.
Bardaji, Sédillot et Walraet (2002) étudient trois
réformes du régime général : l’allongement de 2,5
ans de la durée de cotisation; l’abaissement de l’âge
minimal de liquidation à 58 ans ; l’indexation des
pensions sur les prix + 0,8%. La microsimulation
permet de prévoir sur 40 années les conséquences de
ces réformes en termes d’âge moyen à la liquidation,
de pension moyenne et de durée moyenne validée.
Une ventilation des résultats par sexe permet par
exemple de montrer que l’abaissement de l’âge
minimal de liquidation profite davantage aux
hommes qu’aux femmes pour les premières
générations étudiées, mais, en raiso n de
l’allongement de la durée des études et d’une
participation féminine plus grande, la tendance
s’inverse pour les générations suivantes.
Bonnet et Mahieu (1999) étudient l’influence des
évolutions démographiques, économiques et
institution nell es sur la redistribution
intergénérationnelle inhérente au système par
répartition. Les auteurs évaluent en particulier
l’évolution des taux de cotisations et des taux de
rendement du système de retraite selon les
générations et selon un certain nombre d’hypothèses
concernant l’évolution future du salaire moyen, du
taux de chômage à long terme, du taux de mortalité
ou bien encore de l’âge minimal de liquidation. Ils
montrent par exemple que si les salaires
augmentaient de 3 % par an, le taux de cotisations
n’aurait à augmenter que de 3,3 points (sous le
plafond) au lieu de 11,5 points dans le scénario
central (croissance de 2 % des salaires). De même,
une augmentation de l’âge légal de la retraite de 60 à
63 ans (pour les générations nées à partir de 1941)
permettrait de réduire le taux de cotisations en 2040
de 5,2 points (en dessous du plafond). Une telle
mesure ne modifierait pas le taux de rendement à
long terme puisque la baisse des cotisations
compenserait la diminution de la durée pendant
laquelle les pensions seraient reçues. Mais le taux de
rendement serait fortement détérioré pour les
générations de transition puisqu’elles paieraient le
même taux de cotisation tout en recevant des
pensions moins longtemps.
Walraet et Vincent (2002) s’intéressent quant à eux à
la question de la redistribution intragénérationelle.
Ils utilisent le modèle Destinie pour tester dans
quelle mesure le système de retraite français corrige
les inégalités, notamment d’opportunité salariale
liée à la maternité. Les résultats montrent clairement
que la redistribution profite assez largement aux
femmes disposant de bas revenus et aux couples
ayant élevé des enfants. Les calculs des auteurs
donnent également une évaluation des bénéfices
supplémentaires pour les femmes qui proviennent du
seul fait que le système de retraite ne tient pas compte
des différences d’espérance de vie (à ceci près que
dans un couple, le survivant peut prétendre à une
pension de réversion).
Ces travaux témoignent de l’intérêt de la
microsimulation dynamique pour prévoir le futur et
évaluer l’impact de réformes possibles. Elle permet
de prendre en considération, de façon la plus réaliste
possible, la structure de la population et des revenus,
qu’il est nécessaire de connaître compte tenu des
non-linéarités des modes de calcul des retraites dans
les systèmes existants. Ce type de recherche illustre
le potentiel de la microsimulation pour réfléchir au
caractère adapté ou non d’une formule de calcul des
retraites.
Conclusion : une mise en perspective
Dans cet article, nous avons dressé un portrait et un
recensement des modèles de microsimulation
dynamique. Au regard de cet examen, nous notons,
d’un point de vue méthodologique, que les résultats
agrégés de simulations dynamiques peuvent revêtir
un caractère fortement aléatoire et que les résultats
sur données individuelles peuvent présenter de
nombreuses imprécisions. Cette spécificité plaide en
faveur du développement d’une meilleure
connaissance théorique et empirique des propriétés
statistiques de la microsimulation. Un tel
développement permettrait de mesurer les propriétés
globales des modèles ainsi que de construire des
indicateurs de fiabilité sur les estimations. Il faut
toutefois noter que ce terrain n’est pas vierge, mais
les techniques existantes (le bootstrap par exemple)
sont souvent très coûteuses en ressources
informatiques. Néanmoins, l’accroissement des
puissances de calcul rendent cet argument de moins
en moins pertinent.
La jeunesse de la microsimulation en France fait que
la construction des modèles, quels qu’ils soient,
repose souvent sur une base de données (de taille
modeste en général) qui n’a pas été spécifiquement
conçue pour une telle utilisation (par exemple,
limitation du champ d’étude aux salariés du privé). Il
est alors nécessaire d’utiliser des banques de
données annexes pour accroître l’information
disponible, ce qui est évidemment source d’aléas.
Dans la mesure où l’intérêt de la microsimulation
n’est plus à démontrer, il semble souhaitable que les
besoins liés à l’emploi de cette méthode soient
intégrés dès la conception des bases de données.
Dans l’avenir, on peut penser qu’au sein de chaque
pays, l’apparition de plusieurs modèles engendrera
une concurrence favorable à leur amélioration par
confrontation, mais au ssi les différences
d’approches devraient permettre de fournir un
certain encadrement des évolutions probables. La
fiabilité
[43] croissante des modèles de microsimulation devrait être un argument clé pourvoir leur
utilisation plus importante dans l’orientation des
décisions en matière de finances publiques.
Dans le domaine de l’analyse des déterminants du
chômage, notamment ceux en rapport avec
l’évolution de la structure démographique de la
population active, des améliorations sont clairement
souhaitables. Un taux de chômage endogène paraît
plus crédible. À ce niveau, se pose la question de la
connexion de la microsimulation avec les outils
standards de la macroéconomie.
Enfin, nous avons noté une certaine pauvreté des
indicateurs d’inégalités sur le cycle de vie. À part le
recours à un calcul de taux de rentabilité interne de la
retraite sur le cycle de vie, les utilisateurs de modèles
semblent disposer de peu d’outils de mesure des
inégalités entre générations mais aussi au sein même
des cohortes. On peut espérer que les travaux de
recherche menés dans ce domaine seront capables de
fournir des indicateurs globaux éclairants pour les
choix publics.
Annexe : étude des propriétés de l’estimateur de la moyenne de deux processus stochastiques
élémentaires
Les informations recherchées dans l’emploi d’un modèle de
microsimulation sont de deux types : d’un point de vue
transversal, on cherche à connaître les distributions des
valeurs prises par les différentes variables ; d’un point de
vue longitudinal, on veut également observer les différentes
trajectoires individuelles et évaluer leurs distributions. Pour
cela, les simulations permettent de disposer d’estimateurs
(par exemple, une moyenne) des différents moments des
distributions (moyenne, écart type, etc). Par essence, ces
estimateurs sont des variables aléatoires soumises à un
processus stochastique. Une question d’importance est de
savoir à partir de quelle taille d’échantillons dispose-t-on de
suffisamment bons estimateurs des différents moments des
distributions longitudinales et transversales. A priori, il
semble que la précision (notamment faible variance) de ces
estimateurs est d’autant plus faible que l’horizon est long.
Dans cette annexe, nous tentons d’approfondir cet aspect
dans le cadre de deux processus stochastiques élémentaires.
Dans les deux exemples qui suivent, on étudie des processus
discrets et continus. La variable discrète comprend
seulement deux états : il s’agit d’un processus binaire. On
suppose aussi que les deux processus sont univariés–ils
peuvent donc s’étudier séparément–, ils sont parfaitement
identifiés–il n’y a pas de problème de spécification, ni
d’estimation– et les échantillons initiaux sont également
représentatifs de la population.
Étude du processus stochastique d’une variable
discrète
Considérons le processus stochastique d’une variable
discrète caractérisée par deux états 1 et 0 (par exemple,
1 = emploi; 0 = chômage). On note
p0 (resp. 1
0 −
p ) la
proportion d’individus dans l’état 1 (resp. 0). Dans le cadre
de ce processus discret, un individu initialement dans un état
1 (resp. 0) a une probabilité
u (resp. 1−
v ) d’y rester.
Intéressons-nous ici seulement à l’évolution du premier
moment de la distribution
[1], c’est-à-dire la moyenne
empirique µ
t d’un échantillon constitué de
N individus. Si
on note
xit les évolutions individuelles, la moyenne simulée