2003
Économie et Prévision
Un modèle de microsimulation pour la projection des retraites du régime général
Thierry Debrand
[(*)]
Sophie Pennec
[(**)]
Anne-Gisèle Privat
[(***)]
L’article présente le modèle de microsimulation de la Caisse Nationale d’Assurance Maladie (CNAV). Ce modèle en
cours de construction a deux objectifs : fournir une évaluation des droits à la retraite futurs des salariés du secteur privé à
l’horizon 2030, aussi bien en termes de masses que de dispersions, et mesurer les économies ou au contraire les coûts
engendrés par de nouvelles mesures. Dans cet article, une attention particulière est accordée à la modélisation des salaires
dont le rôle est prépondérant pour la simulation des retraites françaises. La démarche retenue prend en compte
simultanément les éléments micro et macro-économiques dans l’estimation économétrique des équations de salaires. Mots-clés :
microsimulation, retraite, équations de salaire .
The paper describes the CNAV microsimulation model. Currently under construction, it has two aims: to evaluate the
future pension rights of private sector employees to 2030, in terms of both mass and scatter, and to measure the savings or
costs generated by new measures. Particular attention is paid to the modelling of wages, which play a preponderant role in
French pension simulations. The method introduces both microeconomic and macroeconomic factors in the econometric
estimation of wage equations. Keywords :
microsimulation, pensions, wage equations .
Les idées et opinions exprimées dans cet article sont de la responsabilité des auteurs et n’engagent pas leurs institutions. Nous
remercions D. Blanchet, A. Koubi, R. Mahieu ainsi que les rapporteurs pour leurs remarques précises et constructives. Nous tenons
également à remercier P. Sevestre et Y. Guillotin pour leurs programmes d’estimation.
L’article présente le modèle de microsimulation de la Caisse Nationale d’Assurance Vieillesse
(CNAV). Ce modèle en cours de construction a deux objectifs : fournir une évaluation des droits à la
retraite futurs des salariés du secteur privé à l’horizon 2030, aussi bien en termes de masses que de
dispersions, et mesurer les économies ou au contraire les coûts engendrés par de nouvelles mesures.
Dans cet article, une attention particulière est accordée à la modélisation des salaires dont le rôle est
prépondérant pour la simulation des retraites françaises. La démarche retenue prend en compte
simultanément les éléments micro et macro-économiques dans l’estimation économétrique des
équations de salaires.
Les mutations présentes et à venir du marché du
travail (montée de l’activité féminine, instabilité des
carrières, rétrécissement de la vie active), avec le
vieillissement démographique, représentent des
défis majeurs pour les régimes de retraite. La retraite
étant étroitement liée à la carrière, elles auront des
conséquences importantes à la fois sur le montant et
sur la durée de versement des pensions.
Cette étude vise à développer une analyse plus fine
des liens entre retraite et mutations du marché du
travail à l’aide d’un modèle de microsimulation. Les
modèles de microsimulation créés en réponse aux
besoins croissants d’évaluation des politiques
sociales (afin d’en identifier les bénéfices, ou de
mieux évaluer leur coût ou leurs conséquences
économiques) représentent un atout important pour
l’étude des retraites sur le long terme. Ils procurent
une analyse plus explicite des droits à la retraite que
les études traditionnelles en terme d’agrégats ou de
paramètres moyens, car ils permettent de tenir
compte de la diversité des situations individuelles et
pas se ulem ent de s é volutions moye nnes. La
microsimulation permet de prévoir, outre les effets
de phénomènes structurels marquants comme
l’augmentation de l’espérance de vie, la croissance
de l’activité féminine, la réduction de la période de
vie active (allongement de la durée des études et
cessation anticipée d’activité), l’effet d’une réforme
des règles des régimes de retraite, tant au niveau des
individus qu’au niveau du système de retraite.
Notre analyse est fondée sur l’utilisation de données
administratives. En effet, les études sur l’évolution
des retraites sont pour la plupart réalisées à partir de
données d’enquêtes. Or ces données présentent
certaines limites liées notamment à la mémoire des
personnes interrogées et au fait qu’elles distinguent
mal les années travaillées des années validées pour la
retraite. La simulation repose sur le fichier des
assurés au régime général d’assurance vieillesse de
la Sécurité sociale géré par la Caisse nationale
d’assurance vieillesse (CNAV). Ce régime couvre
les salariés du secteur privé, soit près des deux tiers
de la population active française.
Le modèle est conçu pour répondre à deux objectifs.
Le premier consiste en l’évaluation de l’impact
macroéconomique de mesures complexes. Il s’agit
de fournir un chiffrage des droits à la retraite versés
par la CNAV à législation constante ou d’évaluer les
d é p e n s e s ( o u é c o n o m i e s ) s u p p l é m e n t a i r e s
occasionnées par des mesures nouvelles. Le second
est de donner une évaluation en termes de dispersion
des retraites individuelles et donc d’étudier les
inégalités. Pour atteindre ces objectifs, il faut
intégrer les mutations du modèle salarial dans les
projections. Les développements les plus importants
sont ainsi axés sur la modélisation de l’activité
(profils de salaires, scénarios d’évolution de
l’activité,…).
Notre article se compose de deux parties. La
première présente succinctement l’architecture
globale du modèle de microsimulation. La seconde
porte plus particulièrement sur la modélisation
économétrique des salaires, car celle-ci est au cœur
de tout modèle de microsimulation sur les retraites.
Nous montrons que la détermination des salaires
individuels se fait à la fois sur les marchés internes et
externes du travail.
Le modèle de microsimulation
P a r m i l e s d i f f é r e n t s t y p e s d e m o d è l e d e
microsimulation, statique, dynamique longitudinal
ou dynamique transversal, nous avons choisi un
m odè le dyna m iq ue tr a nsve r sa l. Tr a nsve r sal,
puisqu’il s’agit de déterminer année par année, sur de
longues périodes, l’effectif total des populations de
retraités et de cotisants ainsi que les montants de
retraites à verser
[1]. Dynamique, car pour simuler de
manière assez précise les évolutions futures de ces
populations, il faut être à même d’introduire des
hypothèses d’évolution tant dé mogra phiques
qu’économiques assez fines, ce qui ne peut être fait
avec la souplesse souhaitée en utilisant un modèle
statique.
Le modèle a pour principal objectif la projection du
devenir des individus présents dans le fichier des
assurés (cotisants et retraités) de la CNAV et plus
particulièrement, en ce qui concerne les cotisants, de
suivre au cours du temps les caractéristiques qui
conditionnent leurs droits à pension. La population
initiale est issue d’un échantillon au 1/20
ème du
fichier de gestion de la CNAV
[2]. Il s’agit d’une base
de données historique qui conce rne tous les
individus des générations 1935 à 1985 ayant cotisé
au régime général de la Sécurité sociale sur la
période 1947-2001. Elle rassemble l’ensemble des
inf orm ations sur la car rière profe ssionne lle,
nécessaires au calcul des droits à la retraite de chaque
cotisant. Tout d’abord, elle contient le salaire annuel
brut limité au plafond de la Sécurité sociale qui sert à
déterminer les années validées par salaire
[3]. Et
parallèlement aux années de validation par salaire,
elle contient aussi des périodes assimilées, qui sont
des périodes d’interruption de travail assimilées à
des périodes de cotisation (arrêt maladie, congé
maternité, arrêt pour cause d’accident du travail,
invalidité, chômage et service militaire). Celles-ci
donnent une information supplémentaire importante
sur le déroulement de la carrière des individus,
nota m me nt e n ce qui c onc er ne le s pé riod es
d’invalidité, de chômage indemnisé et de cotisation à
l’assurance vieillesse des parents au foyer (AVPF)
[4]
(voir encadré 1, pour une description détaillée).
Encadré 1 : la construction de l’échantillon de base de la simulation
La base de la simulation est issue d’un échantillon au
1-20ème du fichier administratif de gestion de la CNAV qui
contient la plupart des caractéristiques individuelles servant
à déterminer les droits à la retraite. Les informations
recueillies concernent plus particulièrement les individus
des générations 1935 à 1985 observés sur tout ou partie de
la période 1947-2001.
Les indications fournies dans les comptes “retraite” ont
év ol ué a u g r é des d i f f ér en te s lo i s qu i o nt ma rq u é
l’assurance vieillesse avec :
-
Le compte Rentes Ouvrières et Paysannes (R.O. P.) loi
du 5 avril 1910 à 1930, puis
-
Le compte individuel avant 1947, et enfin,
-
Le compte individuel depuis le 1er janvier 1947.
Ainsi, actuellement, chaque compte est composé de trois
grands éléments :
- L’identification de l’assuré avec l’utilisation de son
“Numéro d’identification au Répertoire des personnes
physiques” ou “NIR”.
- Les périodes d’assurance du 1er juillet 1930 à nos jours et
les informations qui s’y rapportent. Celles-ci regroupent :
les périodes d’emploi (au régime général ou dans un autre
régime de base), les périodes assimilées qui sont des
périodes d’interruption de travail assimilées à des périodes
de cot isation ( int er ru ption de tr avail pour maladie,
maternité ou accident du travail, invalidité, chômage
indemnisé – et non indemnisé avant 1980 –, périodes
militaires – service militaire et guerre–, et les périodes de
cotisation à l’Assurance Vieillesse des Parents au Foyer
(AVPF).
- La situation de l’assuré au regard de l’assurance
vieillesse et veuvage (les informations sur la catégorie et la
date d’entrée en jouissance des pensions de vieillesse du
régime général et des allocations de veuvage du titulaire du
compte sont enregistrées depuis 1975).
Les comptes individuels sont alimentés par plusieurs
sources :
- les déclarations annuelles de données sociales (DADS)
fournies par les employeurs pour les périodes de travail
(salaires) ;
- les informations sur les périodes assimilées transmises par
les caisses primaires d’assurance maladie (invalidité,
maladie, accidents du travail) et par les Assedic (chômage);
- les informations des caisses d’allocations familiales qui
versent certaines prestations familiales (AVPF) pour
lesquelles des cotisations sont versées sur la base d’un
salaire forfaitaire (Smic) ;
- les informations transmises par les régimes de retraite
ayant passé un accord avec la CNAV, qui concernent les
assurés qui appartiennent ou ont appartenu au régime
général et à ces régimes : régime des salariés agricoles et de
la SNCF (depuis 1983), EDF-GDF (à partir de 1984),
collectivités locales (CNRACL, depuis 1986), artisans
(Cancava, depuis 1987), exploitants agricoles, (depuis
1995), Organic, Mines, CGE, Agents de change, CFF.
De par sa nature de fichier de gestion, certains éléments du
fichier initial sont mal renseignés. Les renseignements sur
les caractéristiques démographiques sont incomplets. Les
informations sur les décès des affiliés sont limités, car la
gestion et l’actualisation des éléments d’état civil ne
s’e f f e c t u e n t p a s e n c o n t i n u. L e f i c h i e r n e d o n n e
d’indication directe ni sur le statut matrimonial ni sur la
fécondité. Tous ces éléments ne sont connus avec certitude
qu’au moment de la demande de retraite. Or, pour les
assurés décédés, la présence d’un conjoint et son âge sont
indispensables pour déterminer des droits de réversion au
profit du conjoint survivant. D’autre part, la connaissance
de la descendance finale est nécessaire pour déterminer le
droit aux deux principaux avantages familiaux que sont la
majoration de durée d’assurance de 2 ans par enfant pour les
femmes et la bonification de la pension de 10 % pour les
personnes ayant élevé trois enfants ou plus.
En ce qui concerne la partie économique, la situation
d’activité n’est pas clairement définie, car l’information sur
les éventuelles périodes d’activité dans un autre régime
n’est pas forcément retranscrite. Or connaître la durée
d’activité totale ou tous régimes est particulièrement
importante pour la simulation. En effet, elle est nécessaire
pour déterminer le niveau de la retraite (départ à taux plein
ou à taux réduit), ou la distribution de l’âge au départ si l’on
choisit une hypothèse de départ à taux plein pour tous. Des
estimations sont faites à partir de différents fichiers CNAV
(notamment le fichier flux avec carrière) et de l’enquête
Emploi de l’Insee.
Il faut donc faire appel à des sources de données externes
pour pallier à ces lacunes. Le nombre d’assurés survivants
au point de départ de la projection est ainsi estimé à partir de
probabilités de survie calculées par la CNAV sur la base de
l’information disponible dans le fichier et par recoupement
avec la mortalité générale de l’Insee. La modélisation des
caractéristiques familiales (nuptialité, fécondité) en vue de
l’e s t i m a t i o n d e s p r i n c i p a u x a v a n t a g e s f a m i l i a u x
(majoration de durée d’assurance et bonification de 10 %
pour enfants) est effectuée par imputation à partir des
c a r a c t é r i s t i q u e s i n d i v i d u e l l e s e t d e s d o n n é e s
d é m o g r a p h i q u e s d i s p o n i b l e s p a r a i l l e u r s ( é t a t
civil, enquêtes, par exemple).
Des développements importants sont également nécessaires
en ce qui concerne l’activité. Il a fallu faire des estimations
de taux d’activité propres au régime général et déterminer
les parts respectives de l’activité dans ce régime et dans les
autres régimes de base.
Le modèle se compose de trois modules principaux
consacrés : (1) aux aspects démographiques, (2) aux
aspects économiques et (3) à la détermination de la
pension de retraite (voir figure 1). Le point de départ
de la simulation est l’année 1995 ; cette date est
choisie de manière à disposer d’une période de
s i m u l a t i o n r é t r o s p e c t i v e q u i p e r m e t t e d e s
comparaisons avec les statistiques observées.
P l us i e ur s é v é n e m e n ts d é m o gr a ph iq u e s s o nt
nécessaires à la détermination des retraites. Ainsi la
m or ta lité et la nup tia lité i nte rvi en nen t plus
spécifiquement dans l’attribution et le montant de la
pension de réversion (montant proratisé selon le
nombre d’années de mariage en cas de remariage,
etc.). La fécondité a une influence double : d’une part
sur le nombre d’années de cotisations pour les
femmes (2 années par enfant) et, d’autre part, sur le
niveau de la pension de retraite (+10% pour les
parents de 3 enfants et plus).
La partie économique concerne à la fois le type
d’a c t i v i t é e t l e s r é m u n é r a t i o n s d’a c t i v i t é,
c ’e s t - à - d ir e l e s sa l a i r e s p u is q ue n o u s n o us
intéressons plus particulièrement au régime général
des salariés du secteur privé. Pour les entrées-sorties
d’activité, une grande partie du travail consiste à
estimer des probabilités de transition d’activité
propres au secteur privé à partir de l’enquête Emploi.
On distingue ainsi quatre situations vis-à-vis du
marché du travail : actif occupé au régime général,
actif hors régime général, chômeur et inactif. La
progression des salaires est intégrée dans le modèle
par une équation de salaire directement estimée sur
les données de l’échantillon.
Les phénomènes démographiques et l’activité sont
simulés de manière stochastique, en utilisant les
probabilités d’occurrence des événements. Par
contre, la détermination des salaires s’effectue à
partir d’équations dont nous allons dé ta iller
l’estimation dans ce qui suit.
Le dernier module intègre les règles comptables de
détermination du montant de la pension de retraite
des nouveaux retraités ainsi que la revalorisation
fa ite tou s le s a ns du m o nta nt d es r e tr aite s,
revalorisation basée sur l’évolution des prix.
Figure 1
schéma du modèle de microsimulation
La modélisation de l’évolution des
salaires
La modélisation des salaires s’effectue en mesurant à
la fois l’influence des caractéristiques individuelles
d e s s a l a r i é s e t l’i n f l u e n c e d e s é v o l u t i o n s
macroéconomiques sur les salaires au cours des
cinquante dernières années. La fonction de gains
ainsi établie en conciliant les approches micro et
macroéconomiques, est ensuite intégrée dans le
modèle de microsimulation (Debrand et Privat,
2004).
Le premier temps de l’analyse est consacré à
l’ajustement de fonctions de gains sur données
individuelles. Cette analyse prend généralement en
c om pte de s f ac te ur s te ls que l’éd uc atio n e t
l’expérience professionnelle, censés décrire le
“ capital humain ” de l’individu. Le capital humain se
comprend comme le stock de capacités productives
accumulées par l’individu au cours de la scolarité,
mais aussi, par le fait même de travailler ou grâce à la
formation continue. Il est indissociable de la
personne qui l’a acquis (Becker, 1962; 1975). Issues
de cette théorie, les fonctions de gain du type de
celles proposées par Mincer (1974) constituent un
outil standard des études économétriques du marché
du travail.
La plupart des travaux qui tentent de mesurer la
rentabilité du diplôme ou de l’expérience fondent
leurs e stim ations sur des e nquêtes en c oupe
transversale (voir par exemple Jarousse et Mingat,
1986). Les différences de salaire selon l’expérience
ne sont pas calculées sur les mêmes individus
observés à des âges différents; il ne s’agit donc pas
de véritables profils de carrière. L’utilisation de
telles données pour tester les fonctions de gains
soulève un certain nombre de critiques. Pour mettre
en évidence de façon satisfaisante le lien entre
e xp ér ie nc e pr of e ssi onn e lle et sa la ire, il e st
préférable de suivre les salaires individuels au cours
du temps et donc de disposer de données de panel
(Baudelot, 1984)
[5].
Des travaux sur données longitudinales ont déjà été
effectués sur ce thème (Topel, 1991 ; Lollivier et
Payen, 1990 ; Goux et Maurin, 1994). L’utilisation
de données longitudinales présente l’avantage de
permettre de lever l’hypothèse de stabilité de
l’environnement utilisée lors des analyses en coupes
instantanées (stabilité de la productivité globale –
donc du niveau général des salaires–, stabilité du
taux de croissance de la population associé à une
structure par âge stable et à une structure stable en
qualité, c’est-à-dire en capital humain). Dans le cas
présent, notre étude s’effectue sur cinquante années
d’obse rva tions con ce rna nt un gra nd nom br e
d’individus.
Le second temps de l’analyse consiste à introduire,
en plus des caractéristiques individuelles, l’impact
des variables macroéconomiques sur le niveau des
salaires. L’étude économétrique de la relation entre
le niveau des salaires et le chômage est une
préoccupation de longue date des économistes. De
nombreuses études s’intéressent à l’évolution des
salaires réels dans le cadre du cycle économique.
Keynes, dès 1936, dans la Théorie Générale, précise
que : “ en général une croissance de l’emploi ne peut
s’accompagner que par une diminution des salaires
réels ”. Mais a contrario, plusieurs études ont conclu
depuis à une relation négative entre le chômage et le
niveau des salaires. Par exemple, Bils (1985), dans
un e é tud e m e né e s ur do nn é e s in di vi du e lle s
américaines, montre qu’une augmentation d’un
point du taux de chômage se traduit par une
diminution des sala ires r éels de 1,5 à 2 %.
L’évolution des salaires serait donc pro-cyclique.
Cette conclusion a été validée par des articles plus
récents sur données anglo-saxonnes, qui établissent
que la cyclicité des salaires est plus forte parmi les
travailleurs à bas salaires (Solon et alii, 1994). Ces
résultats sont inhérents au cadre institutionnel
propre à chaque pays ; il n’est donc pas certain que
ces conclusions soient identiques pour d’autres pays.
D’autres études s’intéressent surtout à l’effet sur le
salaire de l’interaction entre les caractéristiques
individuelles de l’employé et l’influence des
conditions sur le marché du travail (mesurées via le
taux de chômage). Par exemple, Arozamena et
Centeno (2001) étudient la manière dont les
interactions entre l’ancienneté et les conditions sur le
marché du travail agissent dans le processus de
d é t e r m in a t i on d e s s a l a ir e s. I l s c he r c h e n t à
comprendre le mode de fixation des salaires qui peut
être influencé par les conditions externes sur le
marché du travail.
À la suite de ces précédentes études, notre travail
intègre les variables macroéconomiques dans les
fonctions de gains. Outre le taux de chômage, nous
introduisons deux autres variables qui influencent la
détermination des salaires, à savoir le Smic et la
productivité du travail. Notre objectif est d’aboutir à
une mesure des liens existant entre variations
macroéconomiques et salaires, et par conséquent de
fournir une mesure de l’impact des évolutions
macroéconomiques sur les retraites, puisque le lien
entre parcours professionnel et retraite est très fort.
La productivité est une variable communément
introduite dans les projections sur les retraites. Le
Smic quant à lui, est une variable-clé utilisée dans la
plupart des modèles macroéconométriques français,
qu i e st a jou té e pou r t en ir co m pt e d u c a dr e
institutionnel. Les rapports sur les retraites de ces
quinze dernières années ont évalué les ressources et
les dépenses futures des régimes de retraite en
r e t e n a n t u n c e r t a i n n o m b r e d’h y p o t h è s e s
macroéconomiques communes, en particulier en
matière de salaire moyen, de productivité, de
chômage et de population active. Ainsi, la prise en
compte de ces variables permet de faire le lien avec
les évolutions m acroéconomiques d’ensemble
retenues traditionnellement dans les projections sur
les retraites et d’introduire un bouclage macroé c o n o m i q u e p a r t i e l d a n s l e m o d è l e d e
microsimulation.
Données et méthodes d’estimation
L’estimation des salaires est réalisée à partir de
l’échantillon des cotisants, restreint aux personnes
observées sur la période 1947-2000, âgées de 16 à 59
ans, qui ont perçu un salaire suffisant pour valider au
moins 5 années au régime général, avec un âge
d’entrée au régime général inférieur à 30 ans, et dont
toute la carrière ne s’effectue pas au plafond.
Ainsi, au départ, l’échantillon contient 2 765 252
observations et 174 615 individus des générations de
1935 à 1985. Après sélection, nous disposons d’un
panel non cylindré de 1 910 442 observations
relatives à 110 378 individus des générations de 1935
à 1979 (voir tableau 1). Nous vérifions que pour
chaque génération, le salaire moyen de cette
sous-population est voisin du salaire d’ensemble
[6].
Dans le détail, cet échantillon se compose de 62 831
hom m es e t 47 547 f em m es a vec 1 174 296
observations pour les hommes et 736 146 pour les
femmes. 20,2 % des individus ont un salaire
supérieur ou égal au plafond, avec des différences
selon les sexes : chez les hommes, 25,6 % des
observations sont supérieures ou égales au plafond,
contre 11,7 % chez les femmes.
L e s d o n n é e s r e p r é s e n t a n t l a c o n j o n c t u r e
économique depuis 50 ans, appariées à ces données
individuelles, sont construites à partir de deux bases
différentes. La base construite par Laroque, Ralle,
Salanié et Toujas qui couvre la période allant de
début 1946 à fin 1991. Les séries provenant de la
deuxième base sont issues d’une base construite par
Villa et Salanié à l’Insee et sont rétropolées avec les
taux de croissance issus de la première base pour
obtenir une base de données couvrant toute la
période 1946 à 2000. Toutes les séries monétaires
sont exprimées en francs constants (année 2000).
Compte tenu de la nature des données à notre
disposition, l’analyse est menée en retenant deux
groupes d’observations : d’une part, les observations
pour lesquelles les salaires sont inférieurs au plafond
et, d’autre part, la totalité des observations (salaires
sous ou au niveau du plafond). Pour étudier ce
second groupe, nous devons recourir à une méthode
économétrique spécifique pour traiter du problème
de la troncature au plafond.
L’estimation de fonctions de gains sur données de
panel se heurte à deux types de biais. Premièrement,
il s’agit des biais liés à l’endogénéité du capital
humain, c’est-à-dire à la corrélation entre les effets
spécifiques et certaines variables explicatives et,
deuxièmement, des biais liés aux effets de sélection
ou d’attrition (Guillotin et Sevestre, 1994). La nature
particulière des données que nous étudions nous
amène aussi à tenir compte d’un troisième type de
biais lié à la troncature au plafond de la Sécurité
sociale (voir encadré 2 pour une présentation
d é t a i l l é e d e c e s b i a i s e t d e s m é t h o d e s d e
redressement retenues).
Nous utilisons les méthodes des moindres carrés
ordinaires (MCO) et des variables instrumentales
(VI). En effet, lorsqu’il est supposé exister une
corrélation entre les variables explicatives et l’effet
individuel aléatoire, il est souhaitable de ne pas
utiliser la méthode des MCO ou celle des Moindres
carrés quasi-généralisés (MCQG) : il est plutôt
recommandé de recourir à la méthode des variables
instrumentales. Le principe général de la méthode
est le suivant. Certaines variables explicatives parmi
les X sont supposées endogènes et corrélées avec les
effets individuels.
Dans ce cas, les estimateurs des MCO sont biaisés et
le modèle estimé peut s’écrire:
avec
où les variables Z sont invariantes dans le temps et les
X sont les variables qui varient dans le temps et pour
chaque individu. On considère k1 variables parmi les
X qui sont non corrélées avec l’effet individuel ui
(notées X ) ainsi que k variables au sein des Z qui
12i ne sont pas corrélées avec l’effet individuel (notées
Z1 ). Les X2 sont les variables de X qui sont corrélées
avec l’effet individuel.
Tableau 1
échantillon des salaires
Tableau 1 : échantillon des salaires
Individus Observations sur les salaires
Effectifs % Effectifs % au plafond
Hommes 62 831 56,9 % 1 174 296 25,6 %
Femmes 47 547 43,1 % 736 146 11,7 %
Ensemble 110 378 100,0 % 1 910 442 20,2 %
Source : CNAV, Echantillon au 1-20ème des référentiels nationaux, 2002.
CNAV, Echantillon au 1-20ème des référentiels nationaux, 2002.
Encadré 2 : les biais d’estimation
Les biais d’estimation liés à l’endogénéité du capital
humain
Une corrélation existe sans doute entre certaines variables
explicatives, telles que l’expérience et le niveau de diplôme,
et les effets spécifiques individuels qui apparaissent dans les
per t ur bat i ons o u car act ér ist iq ues i nd iv id uel le s n on
observées (qui comprennent notamment les capacités
personnelles des individus). Les effets de la corrélation entre
le capital humain initial (l’expérience) et l’effet individuel
rep résen tat if des car actér i st iq ues in div idu ell es non
observées (capacités personnelles, acquis familiaux),
c’est-à-dire la corrélation entre une variable explicative de
la fonction de gains et une composante de la perturbation
aléatoire, rendent non convergentes les méthodes usuelles
d’estimation. Cependant, lorsque le nombre d’individus
tend vers l’infini et que le nombre de périodes est grand, ce
biais devient moins important. Une solution consisterait à
ra ison ner sur une est im ati on int r a- in div id uel le q ui
“élimine” l’effet spécifique. Mais cette solution ne convient
pas dans la mesure où la transformation intra-individuelle
fait disparaître la composante de capital humain initial au
même titre que toute variable explicative invariante dans le
temps. Il est alors nécessaire de retenir une autre méthode
d’e s t i m a t i o n t e l l e q u e l a t e ch n i q u e d es v a r i a b l es
instrumentales (VI) par exemple.
Afin d’évaluer les biais liés à l’endogénéité du capital
hu m ai n ( f or m a t io n et ex p ér i en c e), de u x m ét h od e s
d’estimation seront utilisées : l’estimation des MCO et
l’estimation par la méthode des variables instrumentales
(VI) à la Hausman-Taylor (Hausman et Taylor, 1981). Dans
de nombreuses études traitant des données de panel, la
méthode des moments généralisés (GMM) est utilisée. Au
vu de la modélisation choisie (statique) et de la spécificité de
nos données (panel non cylindré de grande taille aussi bien
en effectifs qu’en observations), il ne nous semble pas que
cette méthode soit la plus adéquate.
Les biais d’estimation liés aux effets de sélection
Les ef fet s du p rocessus de sélect ion d es i ndiv idu s
appartenant à l’échantillon peuvent poser problème y
compris dans le cas d’un échantillon non cylindré. Les
estimations réalisées par Guillotin et Sevestre (1994) les ont
conduit à rejeter l’hypothèse d’absence de processus de
sélection. En effet, les individus peuvent être absents de
l’échantillon sur une ou plusieurs périodes d’observation,
alors la probabilité pour un individu d’appartenir à
l’é ch a nt i l l o n p eu t n e p a s êt r e i n d ép e nd a n t e d e l a
perturbation du modèle, en particulier des caractéristiques
individuelles non observées prises en compte dans l’effet
spécifique. En cas d’existence d’un tel problème de
sélection, les estimations qui ne prennent pas en compte ce
problème sont biaisées.
Si la probabilité d’appartenir à l’échantillon n’est pas
indépendante des perturbations du modèle considéré, alors
il est possible de recourir à une technique destinée à repérer
des biais éventuels. Dans ce cas, la correction de ce biais
suppose la prise en compte du processus de sélection dans
l’estimation du modèle.
L’une des méthodes consisterait à spécifier une équation
explicative du processus de sélection et à introduire le
résultat de son estimation dans la régression. Mais comme
le soulignent Guillotin et Sevestre (1994), cette procédure
dite procédure d’Heckman (1979) se révèle très lourde à
mettre en oeuvre lorsqu’on travaille sur des données de
panel et que l’on souhaite prendre en compte l’existence de
spécificités individuelles non observées.
De plus, l’utilisation de cette méthode nécessite que la
sélection des individus appartenant à l’échantillon soit
unique. Les raisons des entrées-sorties d’activité sont sans
doute très différentes d’un individu à l’autre. Il est donc
difficile de formaliser ces processus de sélection de
manière suffisamment simple pour permettre l’estimation
du modèle. Pour analyser les biais de sélection, nous avons
choisi de suivre l’approche retenue par Guillotin et Sevestre
qui s’inspirent de Nijman et Verbeek (1992). Cette méthode
consiste simplement à approcher la correction mise en jeu
d a n s l a m é t h o d e d’H e c k m a n e n a j o u t a n t c o m m e
régresseurs supplémentaires au modèle des variables
indicatrices de présence ou d’absence dans l’échantillon.
La significativité des coefficients associés à ces variables
est alors un indice de l’existence de biais de sélection et leur
introduction dans le modèle doit permettre une correction
de ce biais. Certes, cette correction est imparfaite mais elle
est facile à mettre en œuvre, même en présence de multiples
processus de sélection.
Pour ce faire, nous avons choisi les deux variables
suivantes :
-
pa est une variable qui indique la présence des individus en
t-1 dans l’échantillon : elle vaut 1 pour les individus présents
en t -1,0 sinon.
-
dd est une variable indicatrice pour les individus ayant
connu une interruption de carrière : elle vaut 1 en cas
d’interruption, 0 sinon.
Les biais d’estimation liés à la troncature au plafond
Dans notre panel, le salaire n’est pas une variable continue.
En effet, le salaire observé concerne seulement les années où
les actifs salariés perçoivent un salaire qui est inférieur au
plafond. Pour les autres années, on ne dispose que de la
valeur du plafond, puisque le régime général de la sécurité
sociale n’a besoin que du salaire plafonné pour calculer la
retraite. La relation entre l’âge et le salaire peut être
différente de la relation observée si on se limite aux
observations pour lesquelles on a toute l’information.
La solution consiste alors à prendre en compte le biais de
sélection l ié à la natur e par ticuli èr e de l a vari able
dépendante à l’aide d’un modèle Tobit encore appelé
“ modèle à variables dépendantes censurées”, estimé par la
méthode en deux étapes proposée par Heckman (1979). Les
coefficients du modèle Tobit sont d’autant plus proches des
coefficients des MCO que le “ degré de censure” est réduit.
La procédure revient à ajouter l’inverse du ratio de Mills
associé au processus de sélection comme régresseur
supplémentaire du modèle à estimer.
Dans un souci d’efficacité, nous ne prenons pas en
considération la structure à erreurs composées du résidu
dans la première étape de l’estimation de ce modèle. L’effet
individuel est traité dans la deuxième étape en estimant
l’é q u a t i o n a v e c l’i n v e r s e d u r a t i o d e M i l l s p a r
l’intermédiaire d’une méthode à variables instrumentales.
Le choix de nos instruments se fait selon la méthode
proposée par Hausman et Taylor (1981) qui utilisent
l e s i n st r u m e n t s s u iv a n t s : le s v a r i a bl e s X
1 transformées par les opérateurs Between et Within,
les variables X transformées par l’opérateur
2 Within, et les variables Z non corrélées. L’ensemble
1 de ces instruments peut se noter sous la forme :
Z WX WX BX ZHT =( , , , ) 1 2 1 1,
[7],
[8].
Puis, le m odèle de dé pa rt est transfor mé en
multipliant chacun des termes par la matrice de
projection : P Z Z ZZ HT HT HT HT = ( ', et l’on
Z− ) '1
applique la méthode des MCO à ce modèle. Enfin, on
obtient les estimations par la méthode des variables
instrumentales (VI).
L’ajustement des fonctions de gains est en premier
lieu réalisé sur les caractéristiques individuelles, en
vue d’analyser les modifications dans la formation
des salaires. Ensuite, nous introduisons des variables
macroéconomiques dans les équations afin de savoir
comment les caractéristiques individuelles et le
cycle économique interagissent sur la détermination
des salaires. Enfin, nous présentons la manière dont
les fonctions de gains sont introduites dans le modèle
de microsimulation.
Les effets des caractéristiques individuelles sur les
salaires
Le salaire réel est représenté, à un terme résiduel
près, sous forme d’une fonction quadratique de l’âge
et d’effets de génération. L’âge est utilisé comme
proxy de la notion d’expérience sur le marché du
travail, car nous n’avons aucune information sur le
diplôme ou la catégorie socioprofessionnelle ou
encore l’âge de fin d’études dans le fichier initial.
Cette hypothèse s’inspire des nombreuses études
existantes qui utilisent l’âge dans les équations de
gains (Lollivier et Payen, 1990).
La régression comprend également des indicatrices
de sexe, de perception d’indemnités de chômage ou
d’invalidité, et enfin de perception de cotisations à
l’assurance vieillesse des parents au foyer (AVPF). Il
s’agit de variables instantanée s, c’e st-à -dire
mesurant l’effet de ces variables à une date donnée.
L’AVPF permet aux bénéficiaires de certaines
prestations familiales de disposer gratuitement de
c o t is a t io n s à l’a s su r a nc e vi e i ll e s se a f in d e
compenser leurs interruptions d’activité, aussi bien
au niveau de la durée d’assurance que du salaire.
Comme nous ne disposons pas de données sur la
fécondité dans le fichier de la CNAV, la perception de
cotisations au titre de l’AVPF est utilisée comme un
indicateur des interruptions de carrière liées à la
présence d’enfants dans le foyer
[9]. Certaines études
montrent que l’existence d’enfants à un effet sur le
lien d’interdépendance entre offre de travail,
expérience professionnelle et salaire (Heckman,
1974; Mincer et Polachek, 1974). L’hypothèse d’un
coût de l’enfant sous la double forme d’une perte
immédiate de revenu et d’une dégradation du capital
humain liée à la moindre accumulation d’expérience
professionnelle qui affecte l’ensemble du cycle de
vie se retrouve largement confirmée par les études
(Barnet-Verzat, 1996). Par contre, cette variable
n’est pas conservée dans l’équation des hommes, car
ils sont très peu à percevoir de l’AVPF et les études
empiriques qui s’intéressent à la perte de revenu
induite par la réduction du temps de travail ne
décèlent pas d’effet sensible de la présence d’enfants
sur le temps de travail des hommes.
La spécification adoptée pour la fonction de gains est
la suivante (Debrand et Privat, 2004) :
avec αi t i i t u v, , = +
p o u r i = 1, …, n; t =1 9 4 7, …, 2 0 0 0 e t
g=1935,…,1979.
où wi t, est le salaire de l’individu (i) à une date
donnée (t). b et c s’interprètent comme les effets
sp é c i f iq ue s d e l’â g e su r le s a l a ir e ( c o m m e
l’ancienneté e n première approximation). La
variable indicatrice dum_i_cho indique la présence
de périodes assimilées “chômage” à la date t;
dum_i_inva est une indicatrice de présence d’une
période d’invalidité en t; dum_i_avpf est une
indicatrice de l’AVPF; dumsex est une indicatrice du
sexe qui vaut 1 pour les femmes; pa et dd sont deux
variables de pr ise e n c om pte du “ statut” de
l’individu : pa indique la présence des individus en
t - 1 dans l’échantillon et dd est égale à 1 si l’individu
a au moins une interruption dans sa carrière; Gg est
une variable indicatrice de la génération g. Les effets
de génération mesurés par dg sont relatifs aux effets
qui s’exercent sur l’ensemble des individus qui ont
connu le même événement au même moment. Les
erreurs du modèle sont supposées décrites par un
modèle à erreurs composées où u représente l’effet
i des caractéristiques individuelles non observées et
v est un terme idiosyncratique. Le salaire est donc
i t, déterminé par les caractéristiques individuelles du
travailleur ( f (.)) et par des effets dus à sa date de
naissance ( h (.)).
Les estimations sont menées d’abord uniquement sur
les salaires inférieurs au plafond puis sur l’ensemble
des salaires (inférieurs ou égaux au plafond). Chaque
équation est estimée sur l’ensemble, puis séparément
pour les hommes et pour les femmes en raison des
fortes disparités de salaire entre hommes et femmes.
Les résultats de l’ajustement par les méthodes des
MCO et des VI sur l’ensemble (hommes et femmes
regroupés) sont donnés dans le tableau 2. On
retrouve une forte dépendance du salaire en fonction
de l’âge. Les signes des paramètres sur l’âge et l’âge
au carré (noté
age2) sont conformes au type
d’évolution que l’on s’attendait à trouver (concave),
c’est-à-dire que le salaire augmente avec l’âge mais
avec une vitesse décroissante. Les résultats de
l’estimation par les MCO sont comparables aux
études sur données en coupe qui donnent des
rendements de l’éducation de l’ordre de 8 à 10 %
(Colin, 1999 ; Fournier, 2001)
[10]. Les estimations
par la méthode des VI, comprises entre 5 et 6 %, sont
plus faibles que celles obtenues par les MCO.
L’estimation de la constante n’est pas fortement
affectée, mais les coefficients des variables
age,
age2 et
sexe se trouvent légèrement affaiblis par la
prise en compte de l’endogénéité de la formation et
du diplôme.
Les coefficients associés aux variables pa et dd sont
non nuls. Les estim ations conduisent à faire
apparaître un impact significativement positif du
nombre d’années de présence dans l’échantillon. Ce
qui peut signifier, comme l’indiquent Guillotin et
Sevestre (1994) dans leur étude, que les individus
ayant la présence la plus longue sur le marché du
travail perçoivent un salaire plus élevé, et peut
encore être interprété par le fait que plus les individus
sont entrés dans la vie active en début de période,
plus ils ont bénéficié d’une conjoncture favorable.
Les indicatrices de génération sont de plus en plus
élevées, ce qui signifie qu’en moyenne, les salaires
réels ont augmenté d’un groupe de génération au
suivant. Par rapport à la génération 1935, prise ici
comme référence, l’augmentation est de 16 % pour
les générations 1936 à 1944 inclus, de 46,5 % pour
les générations 1945 à 1954, de 75,2 % pour les
géné rations 1955 à 1964, de 92 % pour les
générations 1965 à 1974 et de 98,1 % pour les
générations 1975 à 1979. Ces dernières ont donc un
salaire de près de deux fois plus élevé que la
génération de référence (1935). Les écarts d’une
g é n é r a t i o n à l a s u i va n t e d e v i e n n e n t m o in s
importants pour les générations 1965 à 1979
[11].
Si l’on considère l’ensemble des salaires (inférieurs
ou égaux au plafond), on observe que la troncature
concerne 20,2 % des observations totales (voir
ta blea u 1). Les signe s des c oeff ic ien ts son t
identiques à ceux des deux régressions précédentes
(voir tableau 2). Les commentaires précédents sont
donc également valables. Toutefois, les coefficients
devant l’âge et l’âge au carré sont moindres et la
valeur des coefficients associés aux générations
diminue fortement. Ceci est dû à l’existence du
plafond qui a sans doute un effet de saturation sur les
variables associées à l’âge (age et age2). Les
estimations incluant le plafond font disparaître
l’impact des indicatrices de génération, car le
plafond fluctue au cours du temps. L’introduction de
l’inverse du ratio de Mills dans la régression, calculé
à partir de la probabilité que le salaire soit supérieur,
permet de déduire de cette estimation l’effet de
saturation sur le salaire pour l’ensemble de la
population. On voit que le coefficient de cette
variable est positif et significatif. Les facteurs non
mesurés qui augmentent la probabilité d’avoir un
salaire supérieur au plafond exercent donc un effet
positif sur le salaire.
Au vu des résultats obtenus sur la dummy sexe, il
semble exister une différence significative entre les
hommes et les femmes, cet écart tendant à croître au
cours de la carrière salariale (Debrand et Privat,
2002a). Il nous semble donc plus judicieux de
modéliser séparément les hommes et les femmes, car
les évolutions des rémunérations entre hommes et
femmes sont très différentes et ne peuvent être
appréhendées uniquement par les dummies sexe et
AVPF (voir tableau 2).
Le pouvoir explicatif de l’équation des femmes
semble moins bon. Il manque sans doute un plus
gr a nd n om br e de va ri ab le s ex plic a tiv es qui
expliquent la rémunération des femmes. La forme de
la courbe de la rémunération moyenne des femmes
est moins concave (le coefficient associé à l’âge est
plus élevé pour les hommes et celui associé à l’âge au
carré est plus faible en valeur absolue pour les
femmes), ce qui indique que le salaire des hommes
augmente plus rapidement que celui des femmes.
Les formes des courbes peuvent être un indicateur de
la politique de rémunération dans les entreprises. Les
hommes ont des progressions de carrière plus
longues et donc des évolutions de salaires plus
marquées.
Au niveau des dernières générations, on retrouve
toujours la même progression des salaires chez les
hommes et chez les femmes, mais il existe certaines
différences. Les indicatrices de génération pour les
femmes semblent indiquer que la progression des
salaires d’une génération à l’autre a été plus
i m p o r t a n t e p o u r l e s f e m m e s, l e n i v e a u d e
rémunération d’origine des femmes étant beaucoup
plus faible en début de période. Toutefois, la
progression plus rapide de leur salaire ne permet pas
aux femmes de rattraper le salaire des hommes.
Si l’on considère l’ensem ble des salaires, la
troncature est moins importante chez les femmes
(voir table au 1). Le gain d’estim ation lié à
l’utilisation de cette méthode est donc plus important
dans le cas des salaires masculins. Les résultats de
l’estimation des salaires à l’aide du modèle Tobit
généralisé sont donnés dans le tableau 2.
Tableau 2
équations de salaire sur données individuelles (Variable dépendante : log du salaire annuel réel )
Tableau 2 : équations de salaire sur données individuelles (Variable dépendante : log du salaire annuel réel )
Hommes Femmes Ensemble
Salaires sous plafond Tous salaires Salaires sous plafond Tous salaires Salaires sous plafond Tous salaires
Tobit Tobit Tobit Tobit Tobit Tobit
MCO VI
+ MCO +VI MCO VI +MCO +VI MCO VI +MCO +VI
Constante 8,261 8,349 8,682 8,713 8,461 8,522 8,740 8,726 8,417 8,489 8,766 8,775
(0,0054) (0,0069) (0,0044) (0,0048) (0,0068) (0,0086) (0,0062) (0,0073) (0,0042) (0,0055) (0,0036) (0,0041)
Age 0,101 0,074 0,073 0,059 0,076 0,049 0,059 0,041 0,090 0,063 0,067 0,052
(0,0003) (0,0002) (0,0003) (0,0002) (0,0004) (0,0002) (0,0004) (0,0002) (0,0002) (0,0002) (0,0002) (0,0001)
Age2/100-0,098-0,063-0,065-0,047-0,067-0,031-0,048-0,023-0,086-0,049-0,058-0,038
(0,0004) (0,0003) (0,0004) (0,0002) (0,0006) (0,0004) (0,0005) (0,0003) (0,0003) (0,0002) (0,0003) (0,0002)
g1936-g1944 0,133 0,140 0,133 0,134 0,180 0,189 0,170 0,182 0,148 0,160 0,143 0,150
(0,0028) (0,0061) (0,0021) (0,0038) (0,0039) (0,0079) (0,0034) (0,0065) (0,0023) (0,0050) (0,0018) (0,0034)
g1945-g1954 0,381 0,413 0,359 0,383 0,486 0,541 0,461 0,517 0,415 0,465 0,389 0,430
(0,0028) (0,0060) (0,0020) (0,0038) (0,0038) (0,0077) (0,0033) (0,0064) (0,0023) (0,0049) (0,0018) (0,0034)
g1955-g1964 0,608 0,672 0,585 0,627 0,738 0,864 0,718 0,824 0,654 0,752 0,629 0,700
(0,0028) (0,0061) (0,0021) (0,0038) (0,0039) (0,0078) (0,0034) (0,0064) (0,0023) (0,0049) (0,0018) (0,0034)
g1965-g1974 0,756 0,846 0,757 0,806 0,850 1,027 0,842 0,980 0,785 0,920 0,782 0,867
(0,0030) (0,0062) (0,0023) (0,0039) (0,0040) (0,0079) (0,0036) (0,0066) (0,0024) (0,0050) (0,0019) (0,0035)
g1975-g1979 0,833 0,916 0,871 0,913 0,878 1,080 0,902 1,048 0,839 0,981 0,872 0,957
(0,0072) (0,0105) (0,0064) (0,0079) (0,0096) (0,0139) (0,0090) (0,0121) (0,0058) (0,0086) (0,0052) (0,0067)
Dum_i_cho-0,396-0,627-0,257-0,353-0,316-0,574-0,239-0,431-0,401-0,614-0,246-0,382
(0,0016) (0,0028) (0,0015) (0,0022) (0,0021) (0,0037) (0,0020) (0,0033) (0,0013) (0,0023) (0,0012) (0,0019)
Dum_i_inva-0,434-0,770-0,301-0,443-0,372-0,772-0,275-0,548-0,402-0,780-0,284-0,479
(0,0105) (0,0212) (0,0093) (0,0157) (0,0113) (0,0242) (0,0107) (0,0208) (0,0077) (0,0162) (0,0070) (0,0125)
Dum_i_avpf-0,386-0,776-0,302-0,601-0,393-0,748-0,294-0,510
(0,0053) (0,0093) (0,0050) (0,0082) (0,0051) (0,0089) (0,0047) (0,0071)
Dumsex-0,146-0,149-0,102-0,109
(0,0007) (0,0013) (0,0006) (0,0010)
Pa 0,481 0,881 0,438 0,660 0,451 0,831 0,435 0,750 0,469 0,865 0,436 0,690
(0,0018) (0,0032) (0,0017) (0,0025) (0,0023) (0,0039) (0,0022) (0,0034) (0,0014) (0,0025) (0,0013) (0,0020)
Dd 0,125 0,078 0,088 0,075 0,210 0,066 0,159 0,072 0,163 0,071 0,117 0,073
(0,0009) (0,0018) (0,0007) (0,0012) (0,0011) (0,0022) (0,0010) (0,0018) (0,0007) (0,0014) (0,0006) (0,0010)
Mills 0,466 0,463 0,445 0,373 0,465 0,436
(0,0011) (0,0010) (0,0012) (0,0012) (0,0008) (0,0008)
R2 0,525 0,470 0,503
N 62 831 62 831 62 831 62 831 47 547 47 547 47 547 47 547 110 378 110 378 110 378 110 378
Observations 873 428 873 428 1 174 1 174 296 650 296 650 296 736 146 736 146 1 523 724 1 523 724 1 910 442 1 910 442
296
Écart type 0,402 0,373 0,363 0,327 0,433 0,362 0,410 0,347 0,417 0,362 0,383 0,337
Notes : 1. Ecart type entre parenthèses; N est la taille de l’échantillon. 2. Note de lecture colonne 1 : le second groupe de générations g1945-1954,
gagne en moyenne 38,1 % de plus que la génération 1935.
Source : échantillon des référentiels nationaux 2002, CNAV.
échantillon des référentiels nationaux 2002, CNAV.
Le ratio de Mills, largement significatif aussi bien
chez les hommes que chez les femmes, justifie
l’utilisation de cette méthode. Les commentaires
sont dans l’ensemble les mêmes que les précédents.
On retrouve un r approchem ent des ca rrières
salariales entre les hommes et les femmes. Les
c a r r iè r e s de s f e m m e s so n t d e p l u s e n p l us
comparables à celles hommes, mais il subsiste des
écarts importants.
Après avoir étudié les caractéristiques individuelles
qui déterminent en partie le niveau et l’évolution des
salaires, nous allons à présent nous intéresser à
l’impact des conditions économiques d’ensemble
sur ces salaires.
L’impact des variables macroéconomiques sur la
détermination des salaires individuels
L’impact de la conjoncture économique sur les
salaires individuels a fait l’objet de nombreuses
études. La plupart des études faites aux États-Unis
utilisent le taux de chômage global ou l’emploi
c o m m e i n d i c a t e u r s c y c l i q u e s ( A b r a h a m e t
Haltiwanger, 1995). Notre étude poursuit la même
méthodologie, mais nous choisissons aussi d’étudier
l’effet de la productivité et d’introduire le salaire
minimum (Smic). Ainsi, nous introduisons trois
variables macroéconomiques, à savoir le taux de
chômage, le Smic et la productivité. L’écart mesuré
entre deux générations par les dummies semble
s’expliquer par l’évolution macroéconomique
d’ensemble, ainsi nous ne conservons pas les
dummies de génération dans l’équation.
Dès lors, le salaire d’un individu se décompose en
deux éléments :
où
u est le taux de chômage,
ln(
smic) est le
logarithme du Smic et
ln(
pte) est le logarithme de la
productivité. La fonction
f (.) correspond plutôt aux
caractéristiques internes du marché du travail (elles
dépendent des caractéristiques des entreprises et du
salarié), tandis que
g (.) décrit les caractéristiques
externes du marché du travail, c’est-à-dire l’effet de
la conjoncture économique
[12].
Plusieurs études se sont déjà attachées à montrer
l’i m p a c t d e l a c o n jo n c t u r e s u r le s s a l a i r e s
individuels. Par exemple, Beaudry et Dinardo
(1991) combinent un modèle de contrat avec des
effets cycliques afin d’examiner la relation entre les
salaires et le cycle économique d’un point de vue
théorique et d’un point de vue empirique. Ils
concluent que le taux de chômage courant n’affecte
pas les salaires si l’on contrôle les conditions sur le
marché du travail, dès lors qu’un travailleur a été
embauché dans l’emploi qu’il occupe encore.
Cependant, leur modèle ne rend pas compte d’un
effet de l’expérience et ne donne aucune prédiction
sur la façon dont les rendements de l’expérience et le
c y c l e é c o n o m i q u e i n t e r a g i s s e n t d a n s l a
détermination du salaire. Ce modèle ne cherche donc
pas à savoir comment les fluctuations sur le marché
du travail associées aux conditions économiques
affe ctent le profil de sa laire en f onc tion de
l’ancienneté.
Récemment, Arozamena et Centeno (2001) ont
étudié le lien entre ancienneté et taux de chômage. Ils
établissent que l’élasticité du salaire au taux de
chômage dépend de l’ancienneté dans l’entreprise.
Cette élasticité est plus faible pour les actifs qui ont le
plus d’a ncie nne té. S e lon ce s a uteu rs, si les
entreprises protègent plus les salariés les plus
anciens dans l’entreprise des fluctuations du marché
du travail, l’effet du cycle économique sur les
salaires sera fonction de la composition du personnel
en termes d’ancienneté.
L’équation que nous avons estimée précédemment,
suite à l’ajout de ces variables, peut se réécrire
comme suit :
C o m m e p o u r l’é t u d e s u r l e s c o m p o s a n t e s
individuelles, nous utilisons la même démarche
d’estimation, c’est-à-dire tout d’abord à partir du
sous-échantillon sous plafond puis pour l’ensemble
des individus (sous et au plafond). Les résultats
figurent dans le tableau 3. Nous nous attachons
surtout à interpréter les résultats obtenus par la
méthode des VI.
Les résultats sont fort comparables avec ou sans
variables macroéconomiques (voir tableaux 2 et 3).
Au vu du tableau 3, on retrouve bien un profil
concave avec l’âge, un effet négatif du chômage, de
l’invalidité et de la présence d’enfants, un écart entre
les sexes de 14,2 % en faveur des hommes si l’on ne
considère pas le plafond et un écart de 11,4 % avec le
plafond. Les coefficients obtenus avec le plafond
sont inférieurs à ceux obtenus sans plafond. On
retrouve bien l’effet de saturation lié à l’existence du
plafond.
Suite à l’ajout de variables macroéconomiques, on
observe que les élasticités du salaire par rapport aux
conditions m acroéconomiques ont les signes
attendus, c’est-à-dire un effet négatif du taux de
chômage, un effet positif du salaire minimum et un
effet positif de la productivité. Une diminution de
1 % du taux de chômage aura un impact positif de
0,6 % sur les salaires. Cela indique que les tensions
sur le m arché du travail influence nt bien la
détermination du salaire. Certains auteurs montrent
que c’est essentiellement le niveau du salaire à
l’e m bau che qui e st in flue ncé. Ce c i p ourr ait
expliquer les différences observées lors de l’étude
sur les caractéristiques individuelles. Plus la
conjoncture est bonne, plus l’écart entre deux
générations est grand. Il y a aussi un effet de la
productivité sur les salaires. Le coefficient positif de
la v ar i a ble smic m on tr e l’im po rt a nc e d e l a
détermination du salaire minimum sur le niveau de
salaire global des salariés sous plafond. Deux effets
coexistent : un effet sur le niveau de salaire des
personnes les moins bien rémunérées (au Smic) et un
effet d’échelle, car si le Smic augmente, les
personnes qui touchent légèrement plus que le Smic
voudront voir leur salaire augmenter. Ces trois
variables macroéconomiques semblent donc bien
mesurer l’impact des marchés externes sur la
formation du salaire individuel.
Dans la section précédente, nous avons vu que
l’ensemble des coefficients était différent entre les
hommes et les femmes. Dans le tableau 2, nous
observions que les valeurs des variables indicatrices
temporelles n’étaient pas parfaitement identiques.
Ces écarts peuvent venir d’une différence de
sensibilité aux variables macroéconomiques entre
les hommes et les femmes.
L’étude séparée des équations décrivant l’évolution
du salaire des hommes et des femmes confirme les
différences de sensibilité (tableau 3). Tout d’abord,
nous retrouvons les différences de concavité entre
les deux sexes. De plus, les coefficients devant les
dummies caractérisant le fait d’avoir eu une période
de chômage ou d’invalidité sont significatifs et de
bon signe. Leurs valeurs sont tout à fait comparables
à celles des estimations précédentes.
E n c e q u i c o n c e r n e l e s v a r i a b l e s m a c r o -
économiques, il existe de réelles différences entre les
hommes et les femmes. Ces estimations confirment
l’i m p a c t d u c h ô m a g e s u r l e s s a l a i r e s. L a
rémunération des femmes semble légèrement plus
influencée par le chômage que celle des hommes. La
productivité a un impact plus fort pour les hommes
que pour les femmes. L’emploi masculin est en
moyenne caractérisé par un niveau de qualification
plus élevé et des tâches plus techniques. Dès lors, les
a m él ior a tion s te c hniq ue s ou te ch nol ogi que s
influencent plus le travail des hommes que celui des
femmes, ce qui a une influence directe sur le salaire.
En moyenne, les salaires féminins sont plus faibles
que les salaires masculins. En toute logique, il doit y
avoir plus de femmes avec une rémunération
équivalente ou légèrement supérieure au Smic ;
alors, toute augmentation du salaire minimum
influencera plus la rémunération moyenne des
femmes que celle des hommes. Il est nécessaire de
s’interroger sur l’impact de ces différences en
projection lors des simulations. Ces écarts entre les
hommes et les femmes ne provoqueront-ils pas des
divergences structurelles entre les hommes et les
f e m m e s ? I l e s t p r ob a b le q u e le s e ff e t s s e
c om pense nt. P ar exe m ple, une ha usse d e la
productivité aura un effet plus grand sur le salaire des
homm es que sur celui des fem mes mais une
augmentation du salaire minimum aura un impact
plus important sur le niveau des rémunérations
féminines. De plus, le Smic sur le long terme est
relativement corrélé avec la productivité et l’on
r e m a r q u e q u e l a s o m m e d e s c o e f f i c i e n t s
correspondant à la productivité et au Smic pour les
hommes est proche de celle des femmes.
Tableau 3
équations de salaire sur données micro et macro-économiques
(Variable dépendante : log du salaire annuel réel )
Tableau 3 : équations de salaire sur données micro et macro-économiques
(Variable dépendante : log du salaire annuel réel )
Hommes Femmes Ensemble
Salaires sous plafond Tous salaires Salaires sousplafond Tous salaires Salaires sous plafond Tous salaires
t
MCO VI Tobit+MCO Tobit+VI MCO VI Tobit+MCO Tobit+VI MCO VI Tobit+MCO Tobi+VI
Constante 0,582 0,555 1,523 1,202-1,282-0,897-0,455-0,319-0,096-0,049 0,847 0,661
(0,0365) (0,0361) (0,0291) (0,0279) (0,0464) (0,0439) (0,0419) (0,0392) (0,0289) (0,0281) (0,0242) (0,0228)
Age 0,065 0,082 0,035 0,053 0,032 0,023 0,015 0,010 0,051 0,058 0,027 0,035
(0,0003) (0,0003) (0,0003) (0,0003) (0,0004) (0,0004) (0,0004) (0,0003) (0,0002) (0,0002) (0,0002) (0,0002)
Age2/100-0,079-0,105-0,043-0,069-0,040-0,032-0,021-0,016-0,063-0,076-0,034-0,049
(0,0004) (0,0004) (0,0003) (0,0003) (0,0005) (0,0005) (0,0005) (0,0004) (0,0003) (0,0003) (0,0003) (0,0003)
Dum_i_cho-0,412-0,590-0,277-0,481-0,344-0,583-0,270-0,562-0,382-0,602-0,271-0,524
(0,0015) (0,0024) (0,0014) (0,0025) (0,0020) (0,0036) (0,0019) (0,0038) (0,0012) (0,0021) (0,0012) (0,0022)
Dum_i_inva-0,443-0,718-0,308-0,607-0,382-0,782-0,284-0,723-0,412-0,758-0,293-0,662
(0,0100) (0,0180) (0,0089) (0,0175) (0,0108) (0,0231) (0,0101) (0,0250) (0,0074) (0,0148) (0,0067) (0,0152)
Dum_i_avpf-0,384-0,746-0,303-0,748-0,389-0,715-0,294-0,677
(0,0050) (0,0088) (0,0048) (0,0095) (0,0049) (0,0081) (0,0045) (0,0083)
Dumsex-0,144-0,142-0,100-0,114
(0,0006) (0,0012) (0,0006) (0,0012)
Pa 0,486 0,714 0,445 0,816 0,466 0,852 0,451 0,969 0,477 0,784 0,448 0,866
(0,0018) (0,0028) (0,0016) (0,0027) (0,0022) (0,0038) (0,0020) (0,0040) (0,0014) (0,0023) (0,0013) (0,0024)
Dd 0,114 0,104 0,078 0,092 0,202 0,170 0,153 0,151 0,153 0,133 0,109 0,110
(0,0009) (0,0015) (0,0007) (0,0013) (0,0011) (0,0020) (0,0010) (0,0021) (0,0007) (0,0012) (0,0006) (0,0012)
U-0,013-0,011-0,008-0,007-0,020-0,01-0,015-0,005-0,016-0,012-0,011-0,006
(0,0003) (0,0003) (0,0002) (0,0002) (0,0004) (0,0004) (0,0003) (0,0003) (0,0007) (0,0002) (0,0002) (0,0002)
Ln(pte) 0,430 0,621 0,474 0,633 0,328 0,488 0,378 0,563 0,387 0,582 0,440 0,63
(0,0058) (0,0060) (0,0047) (0,0047) (0,0071) (0,0073) (0,0065) (0,0070) (0,0045) (0,0047) (0,0038) (0,0039)
Ln(smic) 0,649 0,528 0,582 0,491 0,906 0,781 0,831 0,707 0,752 0,631 0,674 0,566
(0,0049) (0,0048) (0,0039) (0,0037) (0,0063) (0,0059) (0,0057) (0,0052) (0,0039) (0,0037) (0,0033) (0,0030)
Mills 0,464 0,348 0,439 0,319 0,461 0,355
(0,0011) (0,0011) (0,0012) (0,0012) (0,0008) (0,0008)
R2 0,561 0,518 0,544
N 62 831 62 831 62 831 62 831 47 547 47 547 47 547 47 547 110 378 110 378 110 378 110 378
Observations 873 428 873 428 1 174 1 174 296 650 296 650 296 736 146 736 146 1 523 724 1 523 724 1 910 442 1 910 442
296
Écart type 0,387 0,346 0,347 0,308 0,413 0,345 0,390 0,323 0,400 0,347 0,366 0,313
Note : Écart type entre parenthèses. N est la taille de l’échantillon.
Source : Échantillon des référentiels nationaux 2002, CNAV.
Échantillon des référentiels nationaux 2002, CNAV.
Insertion de l’équation dans le modèle
de microsimulation
L a c o m b i n a i s o n d e s é l é m e n t s m i c r o e t
macroéconomiques nous permet ainsi de connaître le
salaire moyen d’un individu pour une génération
donnée et d’observer l’élasticité du niveau des
s a l a i r e s p a r r a p p o r t a u x v a r i a b l e s m a c r o -
économiques. L’insertion dans le modèle des deux
équations, l’une pour les hommes, l’autre pour les
femmes, nécessite une modélisation de l’effet
individuel.
Un effet individuel fixe z est rajouté au profil de
i salaire théorique estimé à partir de l’équation de
salaire. Cet effet individuel est supposé représentatif
du profil individuel de salaire et prend donc
implicitement en compte les interruptions de
carrière. Il permet de recouper la courbe théorique
avec le revenu d’activité effectivement observé dans
le fichier des comptes individuels.
pour i=1,...., n et t =1947,..., 2000
où z est une variable caractéristique de l’effet
i individuel telle que :
En effet v étant un choc idiosynchratique, son
i t, espérance mathématique est nulle, contrairement à
celle de zi.
Cette variable mesure l’écart entre la trajectoire
individuelle passée et celle prédite par les profils
estimés. Pour la projection des salaires, on applique
l’équation aux individus en utilisant l’effet fixe
individuel estimé pour 2000. D’autres méthodes de
modélisation des résidus sont envisageables (Colin,
1999), mais nous choisissons de ne pas les appliquer
ici, compte tenu de la nature de nos données.
Finalement, l’équation de salaire introduite dans le
modèle de simulation s’écrit comme suit :
Pour effectuer la projection, il faudra se donner des
hypothèses sur la tendance générale de croissance de
la productivité, sur le taux de chômage et un terme de
croissance du niveau général des prix. Par exemple,
le rapport du Conseil d’orientation des retraites
(2002) prend comme hypothèse, dans le scénario
central, un taux de chômage qui varie de 9,7 % en
2001-2005 à 4,5 % en 2005-2040 et une productivité
qui varie de 1,8 à 1,6 sur les mêmes intervalles.
Ces salaires serviront ensuite au calcul des droits à la
r e t r a i t e s e l o n l e s b a r è m e s e n v i g u e u r, o u
prévisionnels.
L’analyse approfondie de l’évolution des carrières
salariales, au cours des cinquante dernières années,
montre que les changements dans la formation des
salaires s’expliquent par les effets conjugués des
c a r a c t é r i s t i q u e s i n d i v i d u e l l e s d e s s a l a r i é s
( e xp é r ie nc e p r of e s sio nn e ll e, se x e, p r é se n c e
d’enfants) et du cycle économique (productivité,
chômage,…). Les estimations nous permettent aussi
de mesurer l’évolution des différentiels de salaires
entre hommes et femmes. Mais surtout, la fonction
de gains obtenue est un moyen d’intégrer à la fois les
d i m e n s i o n s m i c r o é c o n o m i q u e s e t m a c r o -
économiques intervenant dans la détermination des
salaires au sein du modèle de microsimulation.
Le modèle s’applique strictement aux cotisants du
régime général et il simule les changements de
r é gim e ( r é gim e g é né r a l/a u tr es r ég im e s ) q ui
n’avaient pas été jusqu’ici introduits dans les
modèles de microsimulation sur les retraites en
France. Par exemple, le modèle de microsimulation
Destinie de l’Insee retient les conditions d’activité
de l’ensemble de la population pour effectuer cette
modélisation (Bardaji, Sédillot et Walraet, 2003).
Enfin, le modèle de microsimulation des retraites du
régime général est conçu pour être un complément
important des projections réalisées actuellement au
niveau global par la CNAV. Il constituera dans un
avenir proche un outil opérationnel d’évaluation de
l’im p a c t de r é fo r m e s ta n t a u ni ve a u g lob a l
qu’individuel. Grâce à ce modèle, on pourra simuler
les effets des différentes réformes envisagées sur le
calcul de la retraite (réforme de 1993 : passage des 10
aux 25 meilleures années pour le salaire de référence,
allongem ent progressif à 40 ans de la durée
d’assurance nécessaire pour une retraite au taux
p l e i n, … ; r é f o r m e d e 2 0 0 3 : p o u r s u i t e d e
l’allongement de la durée d’assurance exigée pour le
taux plein à 41 ans en 2012, départs anticipés à la
retraite dès 40 ans de cotisation,…) mais aussi les
conséquences de nouvelles réformes éventuelles sur
les modalités d’attribution des avantages familiaux.
·
Abraham K. G. et Haltiwanger J. C. (1995). « Real Wages
and the Business Cycle », Journal of Economic Literature, vol.
33, pp. 1215- 1264.
·
Arozamena L. et Centeno M. (2001). « Tenure, Business
Cycle and the Wage-Setting Process », Working paper, 31 p.
·
Bardaji J., Sédillot B. et Walraet E. (2003). « Un outil de
prospective des retraites : le modèle de microsimulation
Destinie », publié dans ce numéro d’Économie et Prévision.
·
Barnet-Verzat C. (1996). « Estimation de la perte de revenus
salariaux de la femme en présence d’enfants », Économie et
Prévision, n° 122, pp. 69-81.
·
Baudelot C. (1984). « Les carrières salariales », Données
sociales Insee, pp. 132-38.
·
Beaudry P. et DiNardo J. (1991). « The Effect of Implicit
Contracts on the Movements of wages over the Business
Cycle : Evidence from Micro Data », Journal of Political
Economy, 99, pp. 665-88.
·
Becker G. S. (1962). « Investment in Human Capital : a
Theorical Analysis », Journal of Political Economy, Supp.
·
Becker G. S. (1975). Human capital : a Theorical and
Empirical Analysis, 2ème édition, Columbia University Press,
New York.
·
Bils M.J. (1985). « Real wages over the Business Cycle :
Evidence From Panel Data », Journal of Political Economy,
vol. 93, n°4, pp. 666- 689.
·
Bonnet C. et Chambaz C. (2000). « Les avantages familiaux
dans le calcul des retraites », Dossiers solidarité et santé, n° 3,
juill-sept, pp. 47-63.
·
Colin C. (1999). « Modélisation des carrières salariales dans
Destinie », Documents de travail Insee, n° G 9902,29 p.
·
Conseil d’Orientation des retraites (2002). « Retraite :
renouveler le contrat social entre les générations », La
Documentation française,
·
Debrand T. et Privat A.G (2002a). « L’évolution des
carrières salariales au cours des cinquante dernières années »,
Retraite et société, n° 36, pp. 188-202.
·
Debrand T. et Privat A.G (2002b). « Individual Real Wages
over the Business Cycle : The Impact of Macroeconomic
V ari at i ons o n I nd ivi du al Careers a nd I mp li cat i on s
concerning Retirement Pensions »,, Document de travail
INED, n° 111,37p.
·
Debrand T. et Privat A.G (2004). “Salaires individuels et
évolutions macroéconomiques en France”, Revue de l’OFCE,
n° 89, pp. 271-309.
·
Fournier (2001). « Comparaison des salaires des secteurs
public et privé », Document de travail Insee, n° G 2001/11,30
p.
·
Goux D. et Maurin E. (1994). « Education, expérience et
salaire : tendances récentes et évolution de long terme »,
Economie et prévision, n° 116, pp. 155-178.
·
Guillotin Y. et Sevestre P. (1994). « Estimations de fonctions
de gains sur données de panel : endogénéité du capital humain
et effets de la sélection », Économie et Prévision, n° 116,
pp. 119- 35.
·
Hausman J. et Taylor W.E. (1981). « Panel Data and
Unobservable Individual Effects », Econometrica, vol. 49,
pp. 1377-1398.
·
Heckman J. J. (1974). « Shadow prices, Market Wages, and
Labor Supply », Econometrica, vol. 42, n° 4, pp. 679-694.
·
Heckman J. J. (1979). « Sample Selection Bias as a
Specification Error », Econometrica, vol. 47, January,
pp. 153-161.
·
Imbens G.W. et Lancaster T. (1994). « Combining Micro
and Macro Data in Microeconometric Models », Review of
Economic Studies, vol. 61, pp. 655-680.
·
Jarousse J.P. et Mingat A. (1986). « Un réexamen du modèle
de gain de Mincer », Revue économique, vol. 37, n°6, nov, pp.
999-1031.
·
Keynes J.M. (1936). The General Theory of Employment,
Interest and Money, London, Macmillan.
·
Lollivier S. et Payen J.F. (1990). « L’hétérogénéité des
carrières individuelles mesurée sur données de panel »,
Économie et Prévision, n° 92-93, pp. 87- 96.
·
Lollivier S. et Payen J.F. (1990). « Salaires : la valeur de
l’expérience », Données sociales, Insee, pp. 123-125.
·
Mincer J. (1974). Schooling, Experience and Earnings,
Columbia University Press, New York.
·
Mincer J. et Polachek S. (1974). « Family Investments in
Human Capital : Earnings of Women », Journal of Political
Economy, vol. 82, n° 2,2ème partie, pp. S76- S108.
·
Moulton B. R. (1990). « An illustration of a pitfall in
estimating the effects of aggregate variables on micro units »,
The Review of Economics and Statistics, pp. 334-338.
·
Nijman T. et Verbeek M. (1992). « Incomplete Panels and
Selection Bias », The Econometrics of Panel Data, L. Matyas
and P. Sevestre eds., Kluwer.
·
Riboud M. (1978). L’accumulation du capital humain,
Economica.
·
Solon G., Barsky R. et Parker J.A. (1994). « Measuring the
Cyclicality of Real Wages : How Important is Composition
Bias », Quarterly Journal of Economics, n° 109, pp. 1- 26.
·
Topel R. (1991). « Specific Capital, Mobility and Wages :
Wages Rise with Job seniority », Journal of Political Economy,
vol. 99, pp. 145- 176.
[(*)]
Union Sociale pour l’Habitat. Direction des Études Économiques et Financières.
E-mail : t
thierry. debrand@ union-habitat. org
[(**)]
Institut National d’Études Démographiques.
E-mail : p
pennec@ ined. fr
[(***)]
Institut National d’Études Démographiques/CNAV- Direction de l’Actuariat Statistique.
E-mail : a
anne-gisele. privat@ cnav. fr
[(1)]
Le modèle s’appuie sur des données en coupe transversale
et suit les individus de diverses cohortes sur une partie de leur
cycle de vie, alors qu’un modèle purement longitudinal suit
des cohortes d’individus sur l’ensemble de leur cycle de vie.
[(2)]
Depuis janvier 1999, le fichier de gestion de la CNAV,
appelé fichier des “ référentiels nationaux ”, est composé de
trois systèmes nationaux : le SNGI ou système national de
gestion de l’identification (NIR et état civil complet des
personnes), le SNGC ou système national de gestion des
carrières, et le SNGD ou système national de gestion des
dossiers (état du traitement des dossiers pour chaque assuré
quel que soit leur type : rachat, régularisation, annulation,
reversement, liquidation de droit propre, de réversion ou d’un
avantage complémentaire).
[(3)]
Le
plafond de la Sécurité sociale sert de référence au calcul
de la pension de retraite. Ce plafond revalorisé chaque année
s’élève à 28 224 euros par an en 2002. La règle de validation
au régime général impose d’avoir travaillé au moins 200
heures au Smic pour valider un trimestre de cotisation, dans la
l i mi te d e qu at r e tr i me str es p ar an. Cet te r èg le e st
implicitement fondée sur un emploi à mi-temps (253 heures de
Smic par an). En 2002, le montant annuel du salaire minimum
pour valider quatre trimestres est de 5 336 euros.
[(4)]
“
L’assurance vieillesse des parents au foyer ” (AVPF) est
l’un des principaux avantages familiaux présents dans le
système de retraite français. Ce dispositif permet aux
bénéficiaires de certaines prestations familiales (telles que
l’allocation pour jeune enfant, l’allocation parentale
d’éducation, le complément familial… ) de bénéficier
gratuitement de cotisations à l’assurance vieillesse afin de
compenser leurs réductions d’activité, aussi bien au niveau de
la durée d’assurance que du salaire (pour plus de détails, voir
Bonnet et Chambaz, 2000).
[(5)]
Riboud, dans son ouvrage (1978), précise que “ la fonction
de gains est une construction économétrique qui peut être
ajustée au profil des salaires d’un individu au cours de son
cycle de vie (ou au profil du salaire moyen d’un groupe
d’individus) ” (Guillotin et Sevestre, 1994).
[(6)]
L’échantillon comporte un petit nombre d’enregistrements
dont le salaire est “ aberrant ” ou mal renseigné. Ce filtre
permet donc aussi d’éviter que de tels enregistrements
perturbent les résultats des ajustements. Les personnes
inactives n’ayant jamais travaillé et présentes uniquement
parce qu’elles perçoivent de l’AVPF ont également été
exclues par ce filtrage.
[(7)]
Pour une présentation plus détaillée de la méthode
d’Hausman-Taylor, se reporter à Guillotin et Sevestre (1994).
Nous avons testé les autres méthodes de VI proposées par ces
auteurs ; les résultats obtenus sont similaires.
[(8)]
Les variables instrumentales sont définies de la façon
suivante :
X1 : variables transformées par les
between et
within :
Inpter Insmicr u, , et
X2 : variables transformées par
les
within :
age,
age2.
[(9)]
Certes, cette mesure est imparfaite, car cette variable ne
concerne qu’une catégorie bien particulière de ménage, à
savoir les ménages à faibles revenus ; mais son introduction
dans la régression est surtout destinée à estimer son effet
instantané pour les bénéficiaires.
[(10)]
À côté de ce modèle principal, nous avons estimé un
modèle avec deux variables pour représenter l’expérience
(
exp) et la durée des études (
etud) afin de comparer nos
résultats à ceux des études précédentes sur données françaises.
Nous avons construit ces variables à partir de l’âge et de la date
d’entrée sur le marché du travail, car nous n’avions aucune
information sur ces variables dans notre panel, et obtenu des
résultats comparables sur celles-ci.
[(11)]
Si l’on détaillait les estimations par générations, sans faire
de groupes, on observerait un effet de génération plus faible
pour les générations de 1975 à 1979 que pour les générations
juste avant elles. Cet effet contradictoire s’explique par le fait
que les individus de ces générations perçoivent en moyenne
des rémunérations plus faibles que les autres, dans la mesure
où l’on n’observe que leur début de carrière.
[(12)]
Il existe une littérature abondante sur l’introduction des
variables macroéconomiques et des problèmes inhérents dans
les modèles microéconométriques (voir Imbens et Lancaster,
1994 ou Moulton, 1990).