Accueil Revues Revue Numéro Article

M@n@gement

2003/1 (Vol. 6)

  • Pages : 50
  • DOI : 10.3917/mana.061.0001
  • Éditeur : AIMS

ALERTES EMAIL - REVUE M@n@gement

Votre alerte a bien été prise en compte.

Vous recevrez un email à chaque nouvelle parution d'un numéro de cette revue.

Fermer

Pages 1 - 28 Article suivant
1

Cet article présente la technique d’analyse de données des modèles linéaires hiérarchiques, qui permet de travailler sur des données multiniveaux de plus en plus fréquentes dans les recherches en management. Dans un premier temps, ses principes statistiques sont exposés ainsi que les principales décisions à prendre par l’utilisateur. Dans un second temps, un exemple d’application est commenté.

2

Les recherches en management ont souvent comme caractéristique d’étudier des phénomènes qui impliquent des relations entre des variables mesurées à différents niveaux conceptuels : des industries, des entreprises, des domaines d’activité stratégiques, des produits… ou encore des unités qui regroupent des équipes composées de groupes plus petits eux-mêmes faits d’individus. Ainsi, un aspect distinctif des processus organisationnels étudiés en management est qu’ils prennent place à différents niveaux d’analyse (House, Rousseau et Thomas-Hunt, 1995).

3

Le terme de recherches multiniveaux s’est ainsi développé et désigne l’étude simultanée d’au moins deux niveaux d’analyse : par exemple, un niveau concernant des individus et un autre niveau concernant des entreprises. Les recherches multiniveaux (Klein, Tosi et Cannella, 1999) intègrent donc à la fois les données micro- et macro-organisationnelles nécessaires à une meilleure compréhension des organisations (Tosi, 1992 ; House, Rousseau, et Thomas-Hunt, 1995 ; Klein, Tosi et Cannella, 1999). Selon House, Rousseau et Thomas-Hunt (1995), un tiers des articles parus dans Academy of Management Journal et Administrative Science Quarterly de 1988 à 1993 considère à la fois des variables micro- et macro-organisationnelles. Ce courant de recherche a donc une importance certaine dans les recherches en management, comme le numéro spécial d’Academy of Management Review publié en 1999 en atteste (Klein, Tosi et Cannella, 1999), et permet de dépasser certaines limites inhérentes à des recherches purement macro ou micro organisationnelles.

4

Par exemple, les perspectives macro-organisationnelles, comme la dépendance des ressources ou les coûts de transaction, ont tendance à faire des prédictions sur l’organisation et son fonctionnement en traitant l’intérieur de l’entreprise (individus, équipes, groupes…) comme une boîte noire (House, Rousseau et Thomas-Hunt, 1995), alors queles recherches micro-organisationnelles se focalisent sur les comportements et attributs des individus et groupes en les considérant de façon indépendante des variables de contexte. De même, comme Granovetter (1985) le fait remarquer, la théorie des coûts de transaction fait abstraction de variables micro telles que le narcissisme, le machiavélisme ou la moralité des individus au cœur des transactions. Chaque dimension ignore l’autre, entraînant ainsi une vision partielle de phénomènes intégrés.

5

Les approches micro-organisationnelles doivent donc prendre en compte des variables de contexte et les approches macro-organisationnelles des variables comportementales. Ainsi, des variables dites micro-organisationnelles interagissent au sein d’un même modèle avec des variables macro-organisationnelles dans le cadre d’une approche multiniveaux.

6

Une fois la collecte des données faite, le chercheur ayant la volonté de réaliser une telle recherche est confronté au problème de l’analyse de ces données. Or, ce mélange de niveaux d’analyse au sein d’un même modèle de recherche pose de nombreux problèmes et suppose l’utilisation d’un certain type d’analyse de données qui permet de pallier aux insuffisances de techniques telles que les régressions avec estimation par les moindres carrés ordinaires (MCO), lesquelles donnent souvent des résultats statistiques erronés pour ce type de modèle. Il est alors nécessaire d’utiliser des modèles linéaires hiérarchiques (HLM) qui permettent précisément de travailler sur des modèles multiniveaux. Cette technique, bien que datant du début des années 80 pour ses principes statistiques, n’a connu réellement un développement dans ses utilisations que depuis quelques années suite à des progrès dans les techniques statistiques s’accompagnant de la création de logiciels d’analyse. Le développement des recherches multiniveaux bénéficie donc du développement récent de cette technique et des logiciels permettant de la mettre en œuvre de façon relativement simple.

7

L’objectif principal de cet article est de familiariser les chercheurs en management à cette technique d’analyse de données, de leur fournir un guide pratique d’utilisation. En effet, les utilisations des HLM restent confidentielles en management alors que les modèles multiniveaux sont considérés de façon positive par de nombreux chercheurs. Cet article a donc une visée uniquement pédagogique en voulant présenter de façon synthétique la logique des HLM et leurs utilisations afin d’améliorer leur diffusion et, ainsi, augmenter les outils d’analyse de données à la disposition des chercheurs en management. De ce fait, il ne s’agira pas ici de détailler les HLM pour des experts en statistiques mais de donner les clés pour qu’un chercheur en management les comprenne et les utilise correctement dans ses recherches. Les références citées dans cet article permettent, cependant, à qui souhaite pousser plus loin son expertise de le faire.

8

Les modèles linéaires hiérarchiques se retrouvent dans la littérature sous différents noms : multi levels linear models en sociologie (Mason et al., 1983 ; Goldstein, 1987), random-coefficient regression modelsen économétrie (Rosenberg, 1973) ou encore covariance componentsmodels en statistique (Dempster, Rubin et Tsutakawa, 1981 ; Longford, 1987).

9

Le terme de modèle linéaire hiérarchique a été introduit par Lindley et Smith (1972) dans leur contribution sur l’estimation bayesienne des modèles linéaires. Il a été repris par Bryk et Raudenbush (1992) pour mettre en avant la caractéristique fondamentale de ces approches : la prise en compte de données ayant une structure hiérarchisée. L’approche de Lindley et Smith (1972) a pendant longtemps été très peu utilisée, ou seulement dans des cas très simples et très minoritaires, car elle nécessitait l’estimation de covariances avec des données déséquilibrées. Différentes évolutions techniques ont permis de lever cet obstacle et ont abouti à la création de logiciels d’analyse de données permettant la réalisation d’analyses linéaires hiérarchiques.

10

Rappelons que si, dans cet article, nous ne détaillons principalement que les HLM les plus utilisés (c’est-à-dire à deux niveaux), pour autant, tout ce qui est présenté ici s’applique pour des modèles plus complexes à trois niveaux.

11

Dans une première partie, les principes des HLM sont présentés. Pour cela, la nature des recherches multiniveaux, terrain de prédilection des HLM, est rapidement expliquée, puis les problèmes posés par l’analyse de ces modèles sont détaillés avant de présenter la logique des HLM, en faisant appel le plus possible pour cela à des présentations graphiques. Toujours dans cette première partie, les procédures d’estimation des différents coefficients des HLM sont expliquées ainsi que les hypothèses d’utilisation de ces modèles. Ensuite, les principales décisions à prendre pour réaliser un HLM sont présentées.

12

Dans une deuxième partie, l’objectif pédagogique de cet article est décliné dans des illustrations qui permettent, à partir d’exemples fictifs, de détailler les résultats obtenus avec le logiciel HLM5 (Raudenbush, Bryk, Cheong et Congdon, 2000) et d’en faire comprendre la lecture.

PRINCIPES DES MODELES LINEAIRES HIERARCHIQUES

13

Avant de détailler les principes des HLM, il est nécessaire de présenter les principales caractéristiques des recherches mutiniveaux, domaine d’application des HLM.

RECHERCHES MULTINIVEAUX

14

De nombreux concepts [1][1] Voir le numéro spécial d’Academy of Management Review... (l’innovation, l’image de marque, les réseaux…) ne peuvent être étudiés en prenant en compte un seul niveau d’analyse posant, de ce fait, le problème de l’intégration de données mesurées à des niveaux différents au sein d’un même modèle de recherche. Il peut être nécessaire, par exemple, de mesurer et prendre en compte dans une même recherche des variables relatives à des individus, des départements ou divisions qui regroupent ces individus, des filiales composées de ces divisions, des entreprises faites de filiales… Il existe ainsi différents niveaux de collecte des données et, donc, d’analyse.

15

Imaginons un exemple très simple d’un cas typique de ces recherches : une recherche qui porte sur des employés au sein d’entreprises. Un certain nombre d’entreprises sont sélectionnées puis, au sein de chaque entreprise, un certain nombre d’employés est interrogé. Ceci revient donc à un échantillonnage à deux niveaux : des entreprises sont choisies puis des employés sont questionnés au sein des entreprises retenues. Les employés ne sont donc pas sélectionnés indépendamment les uns des autres : le fait de choisir une entreprise explique la possibilité pour un employé d’être interrogé. Les observations collectées (au niveau des employés) ne sont donc pas indépendantes (Snijders et Bosker, 1999).

16

A présent, nous souhaitons étudier des relations incluant simultanément des variables mesurées pour des employés et des entreprises. Ces relations possibles vont être représentées de façon simple par des figures en utilisant la démarche de Tacq (cité par Snijders et Bosker, 1999) : une ligne en pointillés indique une différence entre deux niveaux, au dessus de la ligne se trouve le niveau supérieur et au dessous le niveau inférieur, les variables de niveau 1 (ici relatives aux employés) sont notées en minuscules, de niveau 2 (ici relatives aux entreprises) en petites majuscules et de niveau 3 en majuscules grasses. Une flèche indique une relation causale.

17

Une recherche multiniveaux considère donc dans le même modèle des interactions entre variables de différents niveaux. Ceci peut se représenter comme dans la Figure 1.

18

Cas 1 : le chercheur s’intéresse à l’effet que peut avoir une variable Z(de niveau 2) sur une variable y (de niveau 1) en tenant compte del’effet de x (de niveau 1). Par exemple, l’effet des politiques de gestion de ressources humaines des entreprises sur la motivation des employés, en tenant compte de leur ancienneté. La politique de gestion de ressources humaines caractérise les entreprises, alors que l’ancienneté et la motivation se mesurent au niveau de chaque employé.

Figure 1 - Différents types de recherches multiniveaux

19

Cas 2 : la question porte sur l’effet d’une variable Z de niveau 2 sur une variable y mesurée au niveau 1. Par exemple, l’effet de la culture d’entreprise (niveau 2) sur l’implication de chaque employé dans l’entreprise. Cas 3 : la relation entre deux variables de niveau 1 (x et y) dépend de Z.Par exemple, la relation entre implication et rémunération des employés dépend de la taille de l’entreprise.

20

Cas 4 : il s’agit d’un modèle à 3 niveaux. Ces modèles sont des combinaisons des quatre autres cas et un seul type de modèle est ici présenté dans un but d’illustration : tous ces types seraient trop nombreux à décrire. Une variable Z (de niveau 2) a un impact sur une variable y(de niveau 1) en tenant compte de l’effet de x (de niveau 1). De plus, la relation entre Z et y est dépendante d’une variable W de niveau 3. Par exemple, en plus de nos employés et entreprises, supposons à présent que l’on s’intéresse à ces relations pour deux pays. Le chercheur sélectionne donc deux pays, puis des entreprises au sein de ces deux pays, puis des employés au sein de ces entreprises. Nous avons à présent trois niveaux d’analyse imbriqués : les employés, les entreprises, les pays. Un exemple du cas 4 pourrait être une recherche sur l’effet de la politique de gestion de ressources humaines sur la motivation des employés, en tenant compte de leur ancienneté dans l’entreprise, ainsi que de la nationalité de l’entreprise. Cette dernière variable est à un troisième niveau, car elle caractérise des entreprises qui sont regroupées dans un pays.

21

Les recherches multiniveaux sont nombreuses et peuvent être fréquemment utilisées par des chercheurs en management. Il suffit pour s’en convaincre de remplacer le terme “employés” par “produits”, “filiales”, “managers” et “entreprises” par “industries”, “zones géographiques”, “groupes” (voir le Tableau 1 pour d’autres exemples)… Selon le thème de la recherche, un objet peut être de niveau 1 ou 2. Une recherche qui s’intéresse à des relations entre des entreprises au sein d’industries et entre industries considérera les entreprises composants ces industries comme le niveau 1 et les industries seront le niveau 2.Dans l’exemple précédent sur les employés et les entreprises, les employés constituent le niveau 1 et les entreprises le niveau 2.

Tableau 1 - Exemples de données à deux niveaux

22

Dernier exemple, une recherche sur les performances des employés peut amener à considérer et mesurer des variables relevant de différents niveaux d’analyse. La performance d’un individu au sein du service peut s’expliquer par sa formation, ses compétences, sa motivation. Ces variables sont collectées au niveau des individus. Ensuite, il peut exister d’autres variables caractéristiques du service dans lequel se trouve l’individu et qui peuvent avoir un impact sur son activité. Par exemple, il peut s’agir de la taille du service, son mode de management, l’ambiance, le pourcentage annuel de promotion, le soutien accordé par les autres membres de l’équipe… Ces variables sont mesurées au niveau du service et ont la même valeur pour tous les individus se trouvant dans un service donné. Enfin, d’autres variables organisationnelles, valables pour toutes les unités d’une entreprise, peuvent jouer, comme la culture de l’entreprise, sa croissance… Ces dernières variables sont mesurées au niveau de l’entreprise et ont donc la même valeur pour toutes les unités d’une entreprise.

23

Dans ce simple exemple, une recherche essayant d’expliquer la performance d’employés de différentes unités dans différentes entreprises, aura à travailler à trois niveaux d’analyse différents (individus, unités, entreprises) qui s’imbriquent les uns dans les autres. Il est nécessaire de traiter toutes ces données en tenant compte de leur structure hiérarchique. En conservant le mode de représentation de laFigure 1, cette recherche pourrait en partie se présenter comme dans la Figure 2.

24

En plus des modèles multiniveaux et exemples présentés, il existe un autre type de modèle : l’analyse de données longitudinales. Une variable est mesurée sur un même individu mais à plusieurs échéances. Les différentes observations relatives à un individu ne sont donc pas indépendantes. Il est alors possible de considérer ces données longitudinales comme étant multiniveaux : le niveau 1 porte sur les observations collectées au cours du temps pour un même individualors que le niveau 2 est relatif aux différents individus. De telles recherches peuvent donc aussi s’analyser avec une démarche multiniveaux. Toutefois, ce type de modèle dépasse le cadre de cet article (voir Bryk et Raudenbush, 1992, ou Snijders et Bosker, 1999, pour plus de détails sur ces analyses).

Figure 2 - Exemple de recherche à trois niveaux

PROBLÈMES POSÉS PAR LA STRUCTURE HIÉRARCHIQUE DES DONNÉES

25

Une fois les données collectées aux différents niveaux d’analyse, deux problèmes se posent : comment agréger ou désagréger ces données et, surtout, comment analyser des relations entre des variables de niveaux hiérarchiques différents. Tant que les analyses portent sur des variables mesurées à un même niveau (toutes au niveau de l’individu, par exemple), il ne se pose aucun problème particulier. La difficulté augmente quand il s’agit de travailler sur des relations entre données mesurées à différents niveaux.

26

L’hétérogénéité des niveaux d’analyse peut se traiter de trois façons différentes (Hofmann, 1997). La première possibilité, la plus fréquente, est de désagréger les données de façon que chaque unité de niveau inférieur (niveau 1) se voit assigner un indicateur représentant l’unité de niveau supérieur (niveau 2) dans laquelle elle se trouve. Par exemple, chaque individu se verra attribuer une valeur pour une variable mesurée au niveau de son groupe de travail. De ce fait, les individus d’un même groupe auront tous la même valeur pour cette variable qui est en fait d’un niveau hiérarchique supérieur. L’analyse de données (une régression linéaire) se fait ensuite sur l’ensemble des unités de niveaux inférieurs (les individus). Cette approche pose le problème de l’indépendance des observations car plusieurs individus reçoivent le même score pour cette variable et l’appartenance des individus à un même groupe est ignorée alors qu’ils partagent un même contexte et interagissent. De plus, comme Hofmann (1997) le décrit, les tests statistiques portant sur les variables de niveau supérieur (niveau 2) sont alors fondés sur le nombre total d’observations de niveau inférieur (niveau 1) ce qui peut influencer les estimations de l’écart-type et des inférences statistiques associées. Le fait d’ignorer la structure des données fait que les écart-types estimés seront plus faibles, ce qui peut augmenter le risque d’erreur de type I pour ces variables de niveau 2 (Barcikowksi, 1981 ; Bryk et Raudenbush, 1992 ; Hox, 1997). Ce point peut facilement être illustré par l’exemple suivant. Une variable W de niveau 2 comportant 48 observations a été désagrégée en 1440 observations de niveau 1 comme si, pour chaque unité de niveau 2, nous avions collecté 30 observations de niveau 1. Les 48 observations ont donc été dupliquées 30 fois afin d’arriver à 1440 observations et ainsi pouvoir analyser toutes les données au niveau 1. Une telle manipulation change de façon importante certaines statistiques pour cette variable W , comme cela est visible Tableau 2, ce qui pourra avoir des conséquences importantes sur les inférences statistiques la concernant. Plus généralement, il existe plusieurs recherches qui comparent (à partir de données réelles ou de simulations) l’analyse de données multiniveaux avec des régressions (qui supposent la désagrégation des données de niveau 2 au niveau 1) et des HLM (Tate et Wongbundhit, 1983 ; Bassiri, 1988 ; Busing, 1993 ; Kelly et Mathew, 1994 ; Rodriguez et Goldman, 1995 ; Rowe, 1999 ; Kim, 1990 ; Goldstein, 1995 ; Kreft et Leeuw, 1998). Elles mettent en évidence les limites importantes des régressions sur ce type de données, à savoir : hétérogénéité des régressions (voir page 7), corrélation intra classe, et mauvaise estimation des écarts types et des tests de signification (Burstein, 1980a, 1980b). Par exemple, le problème des corrélations intra-classe vient du fait que certains groupes au sein desquels sont collectés les informations sont assez homogènes (la corrélation intra-classe indique le degré de ressemblance entre unités appartenant au même groupe). Barcikowski (1981) montre l’impact de la corrélation intra-classe sur la valeur réelle du seuil de signification alpha pour un test t réalisé initialement pour une valeur nominale de alpha de 0,05. Avec une faible corrélation intra-classe de 0,05 et un nombre de groupe égal à 10, ce seuil de signification réel est en fait de 0,11 alors qu’il était supposé de 0,05. Autre exemple, des managers répondent chacun à 25 cas, avec une corrélation intra-classe de 0,10 ; les tests réalisés pour une valeur nominale de alpha de 0,05 correspondent en fait à un seuil de signification alpha réel de 0,29 (Hox, 1997). Ceci indique pourquoi l’analyse de données multiniveaux avec des régressions augmente le risque d’erreur de type I. Ainsi, pour ces multiples raisons, les régressions (moindres carrés ordinaires, généralisés…) ne permettent pas d’estimer simultanément et correctement des modèles hiérarchisés (multiniveaux).

27

La deuxième approche envisageable, opposée de la première, peut être d’agréger les données de niveaux inférieurs (niveau 1) et de travailler à ce niveau d’intégration (niveau 2), par exemple en utilisant la moyenne de chaque variable de niveau inférieur pour réaliser une analyse au niveau supérieur. En plus des biais liés à la méthode d’agrégation, un des principaux inconvénients de cette approche est d’ignorer la variance qui peut exister aux niveaux inférieurs. En effet, toute l’information existante au sein d’un groupe est ignorée, or elle peut représenter jusqu’à 80 à 90 % de la variation totale. Ceci pourra avoir comme conséquence de rendre les relations entre les variables agrégées beaucoup plus fortes et, parfois, très différentes des relations entre variables non agrégées.

Tableau 2 - Statistiques pour une variable W de niveau 2 désagrégée au niveau 1

28

Enfin, la troisième possibilité est d’utiliser les modèles linéaires hiérarchiques. Ces modèles sont spécifiquement conçus pour dépasser les limites de l’agrégation ou de la désagrégation en modélisant les relations à différents niveaux et évitant ainsi au chercheur le recours aux deux précédentes approches. Ils considèrent l’existence des régressions au sein de chaque groupe et modélisent ensuite les variations de ces différentes droites entre groupes. La variance est ainsi divisée en deux composantes : la variance au sein de chaque groupe et la variance entre groupes.

29

Le principal avantage des HLM est donc d’analyser les relations à l’intérieur d’un niveau hiérarchique (un individu, un groupe…) aussi bien qu’entre niveaux. Pour cela, deux modèles sont simultanément étudiés : un modèle de niveau 1 qui porte sur les relations au niveau le plus fin, un modèle de niveau 2 qui modélise la façon dont ces relations au sein du premier niveau varient entre unités. Cette approche à deux modèles définit les modèles linéaires hiérarchiques (Bryk et Raudenbush, 1992).

LOGIQUE DES HLM

30

Pour présenter la logique des HLM, utilisons l’exemple proposé par Bryk et Raudenbush (1992 : 9-23). Considérons une situation très simple où nous voulons étudier la relation entre une variable expliquéey et une variable explicative x au sein d’un groupe d’individus. Cette relation linéaire correspond à l’équation suivante :

31

A présent, nous nous intéressons toujours à cette même relation mais en prenant en compte deux groupes d’individus. Nous pouvons identifier deux régressions qui décrivent les relations entre y et x pour les deux groupes (Figure 3).

32

Les deux droites de régression indiquent que les groupes 1 et 2 diffèrent de deux façons : leurs moyennes (ordonnées à l’origine ?01 et ?02) et leurs pentes (?11 et ?12) sont différentes.

Figure 3 - Nuages de points et régressions pour deux groupes d’individus

33

Considérons maintenant J groupes. La relation est étudiée pour un échantillon aléatoire de J groupes d’une population. La relation peut à présent s’écrire pour n’importe quel groupe :

34

où : yij  : valeur de la variable dépendante y pour l’individu i dans le groupe ;

35

xij  : valeur de la variable indépendante x pour l’individu i dans le groupe ;

36

?0j et ?1 : intersections et pentes estimées séparément pour chaque groupe ;

37

rij  : terme d’erreur pour l’individu i dans le groupe j.Une fois étudiée la façon dont les J groupes se différencient selon leur ?et ?1, il peut être intéressant de construire un modèle pour estimer ?0j et ?1j . Nous pouvons par exemple utiliser certaines variables qui caractérisent les groupes—niveau 2— (et non plus les individus comme dans la phase précédente) pour les expliquer. Dans un objectif de simplicité, nous ne prenons en compte qu’une seule variable Wj . Nous obtenons donc les deux régressions :

38

où : W : variable mesurée au niveau 2 ;

39

u0j et u0j  : termes d’erreur pour le groupe j.

40

Cette approche permet de gérer l’hétérogénéité des régressions qui existe quand les relations (les ? ij ) entre les variables explicatives et la variable expliquée varient entre les groupes, comme c’est le cas dans l’exemple précédent. Les modèles de régression à paramètres fixes ne permettent pas d’explorer la variation qui existe entre les groupes (Kim, 1990). Les HLM répondent à ce problème en calculant séparément des équations de régression pour chaque groupe puis en modélisant les variations entre groupes selon des caractéristiques des groupes.

41

Le modèle de niveau 1 va permettre de mettre en évidence le modèle de régression de chaque groupe. Le niveau 2 analysera les variations entre les modèles des groupes. Pour cela, les intersections et les pentes des modèles (régressions linéaires) de niveau 1 peuvent être considérées comme étant un échantillon aléatoire d’une population d’intersections et de pentes mesurées au niveau des groupes. Ce second niveau est donc analysé par la réalisation de régressions qui ont comme variable dépendante respectivement les intersections et les pentes des régressions de niveau 1 (c’est-à-dire les n régressions faites pour les n groupes). Les variables indépendantes Wj seront des variables mesurées au niveau du groupe et qui peuvent expliquer des variations entre les modèles des différents groupes.

42

La logique de cette démarche peut s’illustrer par un exemple graphique volontairement simple. Prenons le cas d’un HLM de la forme :

43

Ceci revient à considérer que les droites de régressions entre yij et xij pour les différents groupes j varient seulement pour leur ordonnée à l’origine (? 0j ). Les pentes de ces droites sont strictement identiques, cequi explique que le sous-modèle ? 1j = ? 10  ne comporte pas de variable indépendante et de terme d’erreur. Une représentation d’un tel cas se trouve Figure 4.

44

Nous voyons sur cette figure que les quatre pentes sont identiques : ? 11  = ? 12  = ? 13  = ? 14  = ? 10 . En revanche, les ordonnées à l’origine (? 0j ) sont différentes pour chaque groupe. Le sous-modèle de niveau 2 permet donc d’expliquer (modéliser) ces différences en prenant en compte l’effet de W sur les ? 0j . Ceci peut se représenter comme sur laFigure 5.

Figure 4 - Relations entre x et y pour quatre groupes d’individus

Figure 5 - Relation entre les ?0j et une variable W de niveau 2

ESTIMATION DES EFFETS ALEATOIRES ET DES EFFETS FIXES DANS LES HLM

45

Deux types d’effets sont estimés dans les HLM : les effets aléatoires et les effets fixes (pour plus de détails, voir Hofmann, 1997).

46

Les effets fixes correspondent aux ? des équations de niveau 2. Il s’agit des effets qui ne varient pas selon les unités de niveau 1 et portent donc sur les variables de niveau 2. Ils sont estimés en utilisant une régression selon la technique des moindres carrés généralisés (MCG). En effet, il n’est pas possible d’estimer directement les paramètres des régressions de niveau 2 car les ?0j et ?1j ne sont pas observés, mais nous disposons de suffisamment d’informations pour y arriver en substituant les équations [2a] et [2b] dans l’équation [1]. Nous obtenons : La première partie de l’équation [3b] est qualifiée de modèle “fixe” car les coefficients sont fixes (non stochastiques) alors que la deuxième partie (u 0j + r ij ) est la partie aléatoire. Ceci explique pourquoi ces modèles sont aussi parfois nommés modèles “mixtes”.

47

L’équation [3a] ne correspond pas à l’équation linéaire habituellement utilisée dans la méthode des moindres carrés ordinaires (MCO). Une estimation efficace et une validation d’hypothèses en utilisant les MCO supposent que les résidus soient indépendants, aient une distribution normale et une variance constante. En revanche, le terme d’erreur de l’équation [3a] (u 0j + u 1j xij + r ij ) est plus complexe et a les caractéristiques originales suivantes :

48
  • u 0j et u 1j sont identiques pour tous les individus dans le groupe j ce qui rend les résidus dépendants au sein d’un même groupe ;

  • les résidus ont des variances inégales car u 0j + u 1j xij dépend de u 0j et u 1j , qui varient selon les groupes, et de la valeur de xij qui varie pour chaque individu.

49

Les ?ij sont donc estimés par une régression selon la technique des moindres carrés généralisés. Les effets aléatoires décrivent les effets qui varient entre unités et correspondent donc aux variations au sein du modèle de niveau 1. Les estimations des coefficients de niveau 1 (les ?) pour chaque unité j sont calculées par un score composite fait à partir des données de chaque unité j et d’une estimation basée sur les données des autres unités (Bryk, Raudenbush et Congdon, 1999). Ce point est un aspect original et important des HLM qui va être succinctement présenté pour en faire comprendre la logique.

50

Considérons l’exemple d’un HLM, volontairement le plus simple possible et qui correspond à une analyse de variance avec effets aléatoires :

51

Quel est le meilleur estimateur de ?0 ? Nous disposons de deux estimateurs :

52
  • selon le niveau 1 : y .j est un estimateur non biaisé de ?0j avec une variance Vj (Vj = ?/ nj avec nj = nombre d’unités au sein du groupe j) ;

  • selon le niveau 2 : ??00 est un estimateur commun de chaque ?0j .

53

Un estimateur bayesien [2][2] L’estimateur bayesien est aussi qualifié de shrinkage... (Lindsey et Smith, 1972) ?* 0j est calculé en combinant ces deux estimateurs en fonction d’un coefficient ? :

54

Le coefficient ? j dépend de la qualité de y.j comme estimation de ?0j , c’est-à-dire plus y .j est une estimation précise de ?0j , plus ? j tendra vers 1 et moins de poids sera donné à la moyenne des groupes ??00. Selon la qualité respective des estimations de ?0j obtenues par le niveau 1 et par le niveau 2, les ?* 0j seront plus ou moins redressés vers ?00.

55

A présent, reprenons cette même démarche mais en voulant expliquer les variations du modèle de niveau 1 par une variable de niveau 2, Wj . Dans ces modèles, seul ?0j est supposé varier au niveau 2 en fonction de Wj . Quel est le meilleur estimateur de ?0 ?

56

Le modèle de niveau 1 ne change pas mais le modèle de niveau 2 devient :

57

Niveau 2 : ?0j = ?00 + ?01 Wj + u 0j avec u 0j ~ N(0, ?00)

58

Il existe deux estimateurs de ?0 : selon la moyenne de l’échantillon ? ^0j =y .j et selon les valeurs prédites de ?0j à partir de Wj soit Dans ce cas, l’estimateur Bayesien devient :

59

Ceci revient à ramener (redresser) les droites de régression obtenues par une régression MCO non plus vers la moyenne ?00 mais vers la valeur prédite par le modèle de niveau 2. Plus le modèle de niveau 2 aura une précision élevée, au détriment de la fiabilité du modèle de niveau 1, plus son poids augmentera dans le calcul des ?* ij et plus les valeurs de l’estimateur bayesien correspondront aux valeurs prédites par le modèle de niveau 2.

60

Par exemple, si ?00 = 0,2 et ?= 20 pour le groupe 5 comportant 40 individus, V= 20 / 40 soit 0,5, alors ?5= 0,2 / 0,7 = 0,30. Le ?05 obtenu par la régression MCO au sein du groupe 5 (niveau 1) sera donc fortement redressé vers la valeur estimée par le niveau 2 (régression MCG ; voir équation [3b]) car les estimations faites au niveau 2 semblent avoir moins de variations et être de meilleure qualité que celles de niveau 1.

61

A la différence des régressions (MCO, MCG…), les HLM utilisent donc simultanément toute l’information disponible à plusieurs niveaux d’analyse pour évaluer les modèles, comme l’illustre l’estimation des ?* ij .

HYPOTHESES D’UTILISATION DES HLM

62

Les méthodes statistiques mobilisées par les HLM s’appuient sur un certain nombre d’hypothèses qu’il est important de noter pour appliquer de façon correcte cette technique. Ces hypothèses sont les suivantes :

63
  • les modèles sont linéaires ;

  • les variables explicatives de niveau 1 sont indépendantes des résidus de niveau 1 ;

  • les erreurs aléatoires de niveau 2 (u qj ) ont une distribution normale, chacune avec une moyenne de 0, une variance de ? qq  ;

  • les variables explicatives de niveau 2 sont indépendantes des résidus de niveau 2 ;

  • les erreurs de niveau 1 et de niveau 2 sont indépendantes ;

  • chaque r ij est indépendant et normalement distribué avec une moyenne de 0 et une variance de ?au sein de chaque groupe j de niveau 2 (variance constante des résidus de niveau 1 quelque soit le groupe j).

64

En revanche, il peut être intéressant de noter que les HLM permettent de travailler sur des données déséquilibrées (c’est-à-dire n’ayant pas le même nombre d’observations dans chaque unité de niveau 2).

TAILLE DES ECHANTILLONS

65

Le nombre d’observations s’appréhende à deux niveaux : n le nombre d’observations au sein de chaque unité de niveau 2 et N le nombre d’unités de niveau 2. Après plusieurs recherches, Kreft (1996) considère que, pour obtenir des résultats de qualité avec les HLM pour analyser des relations multiniveaux, un échantillon minimal de n = 30 et N = 30 est nécessaire. Il faut donc au moins 30 groupes composés chacun de 30 individus. Il existe cependant un arbitrage entre n et N : si n augmente alors N peut diminuer, et réciproquement. Par exemple, N = 150 permet de n’avoir que n = 5 pour obtenir la même qualité (puissance) de résultat qu’avec n = 30 et N = 30 (Kreft, 1996).

66

Les principes et spécificités des HLM étant exposés, il est à présent nécessaire de s’intéresser aux choix que doit faire le chercheur lors de la réalisation d’un HLM.

DECISIONS A PRENDRE LORS DE LA REALISATION D’UN HLM

67

L’utilisation des HLM est assez simple et nécessite seulement quelques choix. Le principal porte sur la spécification des modèles. Les autres choix sont le centrage des variables indépendantes, le type de méthode utilisée pour estimer les paramètres, et, enfin, le choix d’un logiciel.

SPECIFICATION DES MODELES

68

La première démarche pour réaliser un HLM à deux niveaux est de spécifier les modèles des deux niveaux. Le modèle de niveau 1 décrit les relations au sein de chaque groupe et les modèles de niveau 2 modélisent les variations des paramètres de niveau 1 entre groupes. Il n’y a donc qu’un modèle de niveau 1 qui reprend les variables explicatives souhaitées par le chercheur. En revanche, il y a Q+1 équations de niveau 2, avec Q correspondant au nombre de variables explicatives présentes dans le modèle de niveau 1.

69

Il existe de nombreux types de HLM mais trois s’avèrent plus utiles pour les recherches en gestion.

70

Le premier type est particulier et est toujours réalisé en début d’analyse : l’analyse de variance à un facteur avec effets aléatoires (déjà rapidement évoqué page 12). Le HLM est alors de la forme la plus simple possible :

71

Dans ce cas particulier, il n’y a donc aucune variable explicative dans les deux sous-modèles et les yij et ?0j sont construits comme aléatoires. Il s’agit en fait d’une analyse de variance avec la moyenne ?00, un effet de niveau 2 : u 0j , et un effet de niveau 1 : rij . Cette analyse est souvent faite dans un premier temps avant de développer un HLM plus complexe car elle fournit des informations sur la partition de la variance entre ces deux niveaux, le coefficient intra-classe ? = ?00 / (?00 + ?2), et teste l’hypothèse d’égalité de la moyenne entre les groupes. S’il n’y a pas de variance systématique entre unités de niveau 2, alors il est inutile de développer des HLM pour expliquer une telle variance.

72

Certains aspects de niveau 2 (la croissance d’un domaine d’activité stratégique, la structure d’une entreprise, sa technologie, sa taille…) ont un impact similaire sur chaque unité de niveau 1 (un produit, une division…). Ceci correspond au cas déjà exposé Figures 4 et 5. Ce type d’effet ne modifiera donc que la valeur moyenne du résultat entre groupes de niveau 2. Il laisse inchangé la distribution des effets entre individus au sein d’un groupe. Pour reprendre les équations des HLM, seule l’intersection ?0j variera entre groupes et sera donc expliquée par des variables W j de niveau 2. La forme des différents sous-modèles sera :

73

Les effets de niveau 2 jouent à la fois sur la valeur moyenne mais aussi sur la distribution des effets entre unités de niveau 2. Les pentes et les intersections varient selon les groupes ou organisations (niveau 2). Une variable W de niveau 2 expliquera alors non seulement l’intersection des régressions au sein de chaque groupe, comme dans le cas précédent, mais aussi l’intensité de la relation (leur pente). Par exemple, plus la valeur de W “taille de l’entreprise” augmente plus la relation constatée pour x et y entre employés est faible (?1j devient de plus en plus petit). A présent, ?0j et ?1j sont donc expliqués par des variables de niveau 2 (Wj ). Les sous-modèles seront :

74

Une fois les modèles du HLM spécifiés, la seconde décision importante porte sur le centrage des x.

CENTRAGE DES VARIABLES INDEPENDANTES

75

Dans les HLM, les intersections et pentes des modèles de niveaux 1 sont les variables dépendantes des modèles de niveau 2. La signification des ordonnées à l’origine dans le modèle de niveau 1 va dépendre des valeurs de xij avec notamment ?0j qui sera la valeur deyij pour un individu i avec une valeur de 0 pour xij . Se pose alors la question de savoir si xij = 0 a un sens compte tenu de la variablemesurée. Par exemple, une degré de formalisation nul est-il possible en entreprise ? Il en va de même pour des dimensions relatives à la technologie, la centralisation… La même question se pose pour les variables de niveau 2 (Wj ).

76

Contrairement aux régressions habituelles (à un seul niveau) où l’ordonnée à l’origine n’est pratiquement jamais analysée, pour un HLM, l’ordonnée à l’origine ?0j joue un rôle plus important car elle est la variable dépendante d’un des sous-modèles de niveau 2. Sa valeur devient alors importante et ne peut plus être négligée. Selon le choix du chercheur d’une métrique pour xij , cela aura des conséquences sur la valeur de ?0j et son interprétation. Ceci est illustré par l’exemple graphique de la Figure 6.

77

Les droites de régression entre x et y pour les trois groupes sont différentes pour leur pente mais avec une ordonnée à l’origine identique par rapport à l’axe yi. Il n’y aura donc aucune variation à expliquer entre ces trois groupes pour le sous-modèle de niveau 2 portant sur ?0j qui sera donc de la forme ?0j = ?00 + u 0j .

78

Pourtant, sur ce dernier point, si nous changeons la métrique de xij en ajoutant, par exemple, 20 unités aux valeurs de xij sans changer yij , alors nous déplaçons l’axe yi vers yi b et changeons la valeur des ?0j . Il existe à présent une différence entre les trois groupes toujours pour les pentes de leurs régressions mais, aussi, pour les ordonnées à l’origine. Il est alors possible de développer un sous-modèle de niveau 2 qui explique ces différences pour ?0j à la différence du cas précédent. De même, un changement des valeurs de xij en enlevant 20 unités, donnera un axe yi c et de nouvelles valeurs pour les ?0j . La métrique utilisée pour xij joue donc un rôle important dans les HLM ce qui soulève la question de leur interprétation et centrage éventuel.

79

Pour rendre ces valeurs plus interprétables, différentes approches ont donc été développées. Il y a trois grandes possibilités pour les données de niveau 1. La première est de garder les valeurs d’origine etdonc de ne pas les modifier. Ceci est faisable quand l’ordonnée à l’origine des droites de régression a un sens quand la valeur de x est 0. Par exemple, une rentabilité financière de 0 est possible, rendant la valeur correspondante de ?0j plausible, ce qui permet de garder les valeurs initiales. En revanche, une valeur de 0 pour la taille de l’entreprise ne l’est pas toujours.

Figure 6 - Impact du choix de la métrique de xij sur la valeur de ?0j

80

La seconde option est de centrer les variables indépendantes autour de la moyenne générale de l’échantillon et de soustraire cette valeur de la valeur de chaque observation (x ij –?x..). Dans ce cas, ?0j , qui correspond à une valeur de yij pour xij centrée, égale 0 indique la valeur pour un individu ayant un profil moyen au sein de l’échantillon composé de tous les individus (quelque soit leur groupe ; niveau 2). L’analyse porte donc sur la position relative des observations de niveau 1 vis-à-vis de la position moyenne de l’échantillon.

81

Enfin, la troisième possibilité est de centrer les valeurs autour de la moyenne de chaque groupe (x ij –?x.j ). Cette fois ci, ?0j correspond à la valeur moyenne au sein du groupe où se trouve l’individu pour la variable indépendante centrée. Les écarts de l’individu i par rapport à la position moyenne de son groupe j sont alors analysés. Dans ces deux derniers cas, l’ordonnée à l’origine de la droite de régression peut être plus facilement interprétable selon la nature des variables étudiées.

82

Pour les variables indépendantes de niveau 2, logiquement, il n’y a que deux possibilités : garder les valeurs d’origine ou les centrer autour de la moyenne générale de l’échantillon. Ce choix est cependant moins important et beaucoup moins fréquent que pour les variables de niveau 1.

83

Cette question du centrage des données a donné lieu à plusieurs travaux récents qui développent les conséquences de ces choix. Hofmann et Gavin (1998) traitent en détail de cette question.

ESTIMATION DES PARAMETRES

84

Les paramètres à estimer dans l’équation [3a] sont les paramètres de la régression et les composants de la variance (?et ?00). Il existe principalement deux méthodes pour réaliser cette opération avec l’hypothèse des HLM que u0j et r ij aient une distribution normale : le maximum de vraisemblance (ML) et le maximum de vraisemblance restreint (REML).

85

Sans détailler ces approches, ce qui serait trop long ici et apporterait peu à un utilisateur des HLM, il est important de retenir qu’elles diffèrent peu pour l’estimation des coefficients de la régression mais peuvent entraîner des différences plus importantes pour les composants de la variance. Le REML estime ces composants de la variance en tenant compte de la perte de degrés de liberté, laquelle vient de l’estimation des paramètres de la régression. En revanche, le ML l’ignore, biaisant ainsi les estimations. Par exemple, l’équation [1] a deux coefficients, ce qui fait que la méthode REML corrigera l’estimation de ?2par (n – 2 – 1), n étant le nombre d’observations, alors que la méthode ML ne le fait pas.

86

Dans le cas d’un nombre de groupes (niveau 2) relativement petit (N < 30) ceci peut créer des différences importantes (Snijders etBosker, 1999) : les résultats obtenus par la méthode REML sont généralement plus faibles que ceux de la méthode ML d’un ratio de l’ordre de (N – F) / N où N est le nombre de groupes (niveau 2) et F est le nombre d’éléments de la partie fixe de l’équation [3b] (Bryk et Raudenbush, 1992 : 44).

87

Si le nombre de groupes est plus important (N > 30), les différences entre les méthodes REML et ML sont extrêmement faibles et donc négligeables.

LOGICIEL

88

Suite au développement de nouveaux logiciels, la réalisation de HLM est devenue depuis quelques années assez facile d’un point de vue pratique. Les principaux logiciels dédiés à ce type d’analyse sont HLM 5.0 de Raudenbush, Bryk, Cheong et Congdon (2000), Mln de Rasbash et Woodhouse (1995) et VARCL de Longford (1990). Il est à noter cependant que des HLM peuvent se faire avec d’autres logiciels plus généralistes, comme SAS (Proc MIXED) ou SPSS, mais leur usage est plus difficile que celui des logiciels conçus pour les HLM. Le logiciel utilisé dans la suite de cet article est HLM 5.0 qui présente l’avantage de pouvoir spécifier de façon séparée, pour chaque niveau, des sous-modèles plutôt que directement une équation de la forme de l’équation [3b].

LECTURE DES RESULTATS : TESTS STATISTIQUES

89

Les HLM fournissent deux types de tests pour la validation d’hypothèses. Des tests t pour les paramètres des régressions de niveau 2 (les ?) et de niveau 1 (les ?) qui testent que les estimations de ces paramètres sont bien différentes de zéro.

90

Des tests du Chi-deux permettent de tester que la variance des résidus de niveau 2 (variance des u ij c’est-à-dire les ?00, ?11…) est différente de zéro de façon significative. Si les valeurs des probabilités associées aux Chi-deux sont inférieures au seuil généralement retenu de 5 %, cela signifie que l’intersection et/ou les pentes des différents groupes sont significativement différentes entre groupes. Il reste donc une variance systématique au niveau 2 qui peut éventuellement être modélisée en ajoutant des variables de niveau 2 et en développant donc un HLM avec des sous-modèles de niveau 2 plus complets. Si les valeurs du Chi-deux ne sont pas significatives, alors toute la variance au niveau 2 a été modélisée avec les variables retenues et le modèle pourra être considéré comme fixe (sans composante aléatoire).

EXEMPLE D’APPLICATION

91

Un exemple d’application à partir de données fictives va être présenté. L’objectif est d’illustrer la réalisation d’un HLM et la lecture des résultats.

92

Nous avons généré des observations pour une recherche fictive qui porterait sur des employés dans des d’entreprises. On trouve doncdans cette recherche deux niveaux hiérarchiques : au niveau 1, les employés travaillant dans une même entreprise et au niveau 2, les entreprises sélectionnées. Au sein des cent entreprises enquêtées, on a interrogé j employés, j variant de 25 à 64. Les conditions de la collecte n’auraient pas permis de questionner le même nombre de personne dans chaque entreprise, ce qui explique cette différence du nombre d’observations collectées au niveau 1. Ainsi, les données sont déséquilibrées, j variant selon l’entreprise. Au total, 4565 observations de niveau 1 ont été collectées pour 100 entreprises.

93

Au niveau 1, la variable dépendante y et la variable explicative x sont mesurées pour les employés. Au niveau 2, nous supposons l’existence de deux variables explicatives W et Z qui caractérisent l’entreprise. Par exemple, W peut être le fait que l’entreprise soit côtée en bourse ou non, cette variable est donc dichotomique (0, 1). Z au contraire est supposée être une variable continue (par exemple le chiffre d’affaires).

94

L’objectif est de répondre à la question suivante : est-ce que x et y sont en relation ? Si oui, est-ce que la relation entre x et y dépend de Z et ? Ceci peut se représenter, selon les conventions présentées page 4, par la Figure 1. Afin de répondre à ces questions nous devons procéder par étapes.

ETAPE 1 : ANALYSE DE VARIANCE

95

La première étape a été de réaliser une analyse de variance à un facteur à effets aléatoires. Avant d’élaborer un HLM plus sophistiqué pour expliquer une variance entre groupes de la variable dépendante y, il est déjà utile de vérifier si cette variance existe de façon significative. Comme cela a été exposé dans la partie précédente, un HLM de la forme suivante a été réalisé :

96

Le premier résultat intéressant de cette analyse, réalisée avec le logiciel HLM5 (Raudenbush et al., 2000), est :

Figure 7 - Modèle à tester

97

Dans le cas de ce type de HLM, ?représente la variance intragroupe de y et ?00 la variance intergroupe de y. Ceci permet de calculer le coefficient de corrélation intraclasse :

98

Il s’avère donc que 17,3% de la variance est entre entreprises.

99

Deux autres résultats sont utiles : le test t et le test du Chi-deux, indiqués ci-dessous.

100

Le test t indique que la moyenne générale de l’échantillon pour y est significativement différente de 0 et le test du Chi-deux confirme qu’il existe une variance systématique au niveau 2 (?00 est significativement différent de 0). Cette variance systématique au niveau 2 peut donc être ensuite modélisée en développant un HLM plus complet. Une fois ces premiers test réalisés, il est donc pertinent de développer des HLM élaborés.

ETAPE 2 : MODELES AVEC X

101

A présent, pour répondre à la première question, il est nécessaire de commencer à développer un HLM plus complexe. Pour cela, nous allons spécifier le modèle 1 selon l’hypothèse de la recherche tout en gardant les sous-modèles de niveau 2 de l’étape précédente. La forme des modèles testés est :

102

Le modèle de niveau 2 permet de gérer le problème de la non indépendance des observations. Si, suite à cette analyse, le test du Chi-deux confirme qu’il existe une variance systématique au niveau 2 qui peut être modélisée, alors nous élaborerons des sous-modèles de niveau 2 plus complets avec les variables dépendantes W et Z. Le HLM donne les résultats suivants :

103

Selon ces résultats, il est possible d’identifier un modèle expliquant de façon significative y. Les coefficients s’interprètent comme des coefficients non standardisés de régressions linéaires classiques, chacun donnant l’impact de l’augmentation d’une unité de xij sur yij , avec la valeur de p associée. Donc, la valeur de ?0j est 12,76 (au seuil de 0,00), qui est la valeur moyenne de y pour les 100 entreprises étudiées, alors que la valeur de ?1j est 2,36 (au seuil de 0,00) ce qui indique que quand la valeur de xaugmente d'une unité pour un employé, la valeur de y augmente de 2,36.

104

Si les valeurs de x avaient été centrées autour de la moyenne de chaque entreprise (c’est-à-dire x ij = (xij X .j )) alors la valeur de 2,36 pour ?1j indiquerait qu’un écart d’une unité de la valeur xpour un employé par rapport à la valeur moyenne de x pour son entreprise entraîne une augmentation de 2,36 de y. Le résultat suivant permet de voir si il est utile d’aller plus loin dans notre analyse :

105

Ici encore, comme pour l’analyse de l’étape 1, le test t indique que la moyenne générale de l’échantillon pour y est significativement différente de 0 et le test du Chi-deux confirme qu’il existe une variance systématique au niveau 2 qui peut donc être ensuite modélisée en développant un HLM plus complet. Nous pouvons donc continuer à construire notre modèle de niveau 2 selon notre question de recherche.

106

Concernant l’estimation des paramètres des HLM, le logiciel HLM5 utilise par défaut le maximum de vraisemblance restreint (Restricted Maximum Likelihood : REML, que l’on trouve sous le nom de MLR chez Bryk et Raudenbush [1992]) qui est généralement adapté aux objectifs du chercheur.

ETAPE 3 : MODÈLES AVEC X, W ET Z

107

A présent, nous allons ajouter les variables W et Z uniquement dans le sous-modèle de ?00. Avant de voir si W et Z ont un impact modérateur sur la relation entre x et y, nous voulons voir si ces deux variables de niveau 2 ont un impact sur les ordonnées à l’origine de chaque régression de niveau 1. Ce type d’effet ne modifie donc que la valeur moyenne du résultat entre entreprises (unités de niveau 2) et laisse inchangée la distribution des effets entre individus au sein d’une entreprise. De ce fait, seule l’intersection ?0j variera entre groupes et sera donc expliquée par des variables W et Z. Les Figures 4 et illustraient déjà un tel cas pour une seule variable de niveau 2. La forme des différents sous-modèles sera :

108

Les résultats de cette analyse sont :

109

W (0,78) et Z (3,35) ont bien un effet positif significatif sur les ordonnées à l’origine des régressions pour les différentes entreprises étudiées. Par exemple, quand la valeur de Z augmente pour une entreprise, l’ordonnée à l’origine de la régression obtenue pour les individus iau sein de l’entreprise augmente (?02 = 3,35). Les résultats sur les composants de la variance montrent qu’il reste encore une variance systématique qui peut être modélisée pour ?0j et ?1j . Nous pouvons donc, pour finir, passer à la dernière phase et tester le modèle complet.

ETAPE 4 : MODÈLES AVEC X, W ET Z, ET EFFET MODÉRATEUR DE W ET Z

110

L’étape 3 a permis de constater que W et Z ont un impact sur les ordonnées à l’origine des régressions entre x et y. En plus, nous voulons voir si l’intensité de la relation entre x et y dépend du niveau de Wet/ou Z.A la différence des analyses précédentes, il s’agit donc de voir si les variables W et Z ont un impact non seulement sur l’intersection mais aussi sur les pentes des modèles de niveau 1. Les modèles testés seront donc :

111

Le résultat de l’analyse avec HLM 5 est :

112

W (–1,80) et Z (0,97) ont effectivement un rôle modérateur significatif (seuil de 0,000 pour W et 0,004 pour Z) sur l’intensité de la relation entre x et y. Par exemple, quand la valeur de W augmente, la pente de la relation linéaire entre x et y est moins forte (?11 = –1,805).

113

Ici, les tests du Chi-deux de la variance résiduelle au niveau 2 ne sont pas utiles compte-tenu de notre objectif : nous ne souhaitons pas ajouter d’autres variables à nos sous-modèles de niveau 2. Cependant, toujours dans un objectif pédagogique, nous indiquons ces résultats :

114

Si nous avions voulu continuer à construire un modèle en ajoutant d’autres variables, cela n’aurait pu se faire que pour le sous-modèle deniveau 2 expliquant ?0j . Pour ?1j , il ne reste plus de variance significative à modéliser (p = 0,419).

COMPARAISON DES RESULTATS AVEC UNE REGRESSION MCO

115

Les résultats obtenus avec un HLM ne présentent pas les biais déjà énoncés d’une régression MCO faite en ignorant la structure hiérarchisée des données (cf. page 8). Pour illustrer la différence entre ces deux techniques, une régression MCO a été réalisée en désagrégeant les variables de niveau 2 (variables W et Z dans les entreprises) et en faisant fonctionner l’analyse sur les 4565 observations recueillies au niveau 1 (c’est-à-dire au niveau des employés). Le modèle testé dans les deux cas est celui de l’étape 3. Ces résultats sont indiquésTableau 3. Les résultats obtenus avec HLM y sont également rappelés pour faciliter la comparaison.

116

Les différences de résultats pour les variables de niveau 2 sont importantes avec les valeurs des coefficients de W et Z qui changent ainsi que la probabilité associée de W qui est plus élevée pour le HLM que la régression MCO.W reste significatif pour le HLM, mais au seuil de 5% au lieu de 1% dans la MCO. Dans un autre cas, il aurait été possible que W ne soit plus significatif pour le HLM au seuil de 5% alors que la régression MCO aurait toujours eu un résultat significatif. Au niveau 1, le coefficient de x diffère également légèrement entre le HLM et la régression MCO. Les conclusions du chercheur sur ces variables seront donc erronées s’il travaille à partir d’une régression MCO sur données désagrégées.

117

Il est à noter que si les données de l’exemple avaient été équilibrées (même nombre d’observations j dans chaque unité de niveau 2), alors les différences entre MCO et HLM auraient principalement porté sur les probabilités associées aux coefficients et non sur les valeurs mêmes de ces coefficients comme ici.

UN EXEMPLE DE HLM A TROIS NIVEAUX

118

Les HLM les plus fréquents sont à deux niveaux mais, comme cela a déjà été indiqué, il existe aussi des HLM à trois niveaux. Leurs principes et utilisations sont exactement les mêmes que ceux à deuxniveaux mais la plus grande difficulté vient du nombre de coefficients expliqués par des sous-modèles qui devient rapidement très élevé avec le nombre de variables.

Tableau 3 - Comparaison des résultats obtenus avec une régression MCO et un HLM pour le modèle de l’étape 3

** p<0,01 *p<0,05

119

Nous allons présenter un nouvel exemple fictif [3][3] Les données utilisées dans cet exemple sont différentes... volontairement simple d’un HLM à trois niveaux. La conception de modèles plus complexes à trois niveaux nécessite déjà une bonne maîtrise des HLM et s’adresse plutôt à des spécialistes de cette technique. De ce fait, ils ne correspondent pas à l’objectif pédagogique de cet article et ne seront pas détaillés. De plus, leur utilisation est très rare en management.

120

Le modèle que nous voulons tester porte sur trois niveaux et est de la forme suivante :

121
  • niveau 1 : relation entre x et y pour des employés, i représentant un employé.

  • niveau 2 : impacts des variables W et Z caractérisant les entreprises de ces employés, j représentant une entreprise.

  • niveau 3 : variable V (par exemple un indice de concentration de l’industrie) caractérisant les industries auxquelles appartiennent les entreprises, k représentant une industrie.

122

Nous supposons que les entreprises ont été choisies parmi 20 industries. De ce fait l’échantillonnage s’est fait en trois temps : 1/sélection des 20 industries ; 2/sélection des entreprises au sein de ces industries ; 3/sélection des employés au sein de ces entreprises. Comme cela a été expliqué, nous avons donc trois niveaux hiérarchiques avec des observations non indépendantes.

123

Supposons que nous avons un HLM de la forme du modèle testé lors de l’étape 3 précédente : deux variables de niveau 2 (W et Z) ont un impact sur la valeur des ordonnées à l’origine des régressions de chaque entreprise j. Mais, en plus, nous voulons voir si une variable V,mesurée pour l’industrie (niveau 3), a un impact sur la valeur moyenne de l’effet de W et Z déjà mis en évidence. De ce fait, nous supposons que V a une influence uniquement sur l’ordonnée à l’origine des sous-modèles de niveau 2 soit ?00k .

124

Le modèle que nous voulons tester sera alors de la forme :

125

Même dans ce modèle très simple (une seule variable indépendante de niveau 1, deux variables de niveaux 2 sans effet modérateur) nous avons déjà quatre sous-modèles de niveau 3 à spécifier, ce qui illustre bien la grande complexité qui existe quand des HLM de niveau 3 sont développés.

126

Ensuite, la démarche est exactement la même que celle présentée pour le modèle à deux niveaux : l’étape 1 consiste à faire une analyse de variance à effets aléatoires (modèles des trois niveaux sans variable indépendante) puis de progressivement ajouter des variables. Il serait trop long de refaire et présenter ici toutes les étapes pour arriver au HLM avec ce modèle complet. Le Tableau 4 présente les résultats de la dernière analyse HLM sur le modèle complet.

127

Nous pouvons ainsi constater que quand la valeur de V augmente, ?00k diminue (?001 = –0,0069). V a bien un effet significatif sur l’impact de W et Z sur les droites de régression de chaque unité j. L’ordonnée à l’origine des régressions des entreprises varie avec les industries. Les analyses de la variance aux différents niveaux montrent que le modèle de niveau 2 peut encore être complété par d’autres variables tout comme le modèle de niveau 3 pour ?00k et ?10k .

CONCLUSION

128

Malgré leur grand intérêt pour de nombreuses recherches en sciences de gestion, les HLM ont connu un développement quasiment confidentiel pour le management alors que, de plus en plus, il est souhaitable de travailler à différents niveaux d’analyse. Leur développementa pourtant été important dans des domaines comme les sciences de l’éducation, qui travaillent traditionnellement sur des données multiniveaux. Leur apport potentiel aux recherches en management semble donc important.

Tableau 4 - Résultats du modèle complet à trois niveaux

129

Cet article a proposé aux chercheurs en management une présentation des principes et de l’utilisation de cette technique afin de mieux la faire connaître et utiliser. Il a également donné des informations et des références pour des utilisateurs plus experts des analyses de données qui souhaiteraient ensuite approfondir ce thème par eux-mêmes. Ainsi, nous espérons que cet article aura servi à mieux diffuser les HLM dans la communauté académique en management en faisant prendre conscience que leur compréhension et utilisation est relativement simple, notamment pour les HLM à deux niveaux.

130

Note. L’auteur remercie David Hofmann pour ses conseils sur les HLM ainsi que les évaluateurs anonymes pour leurs commentaires et suggestions qui ont permis d’améliorer cet article.


REFERENCES

  • Barcikowski, R.S. 1981 Statistical Power with Group Mean as the Unit of Analysis, Journal of Educational Statistics, 6 (3) : 267-285.
  • Bassiri-Gharb, D. 1988 Large and Small Sample Properties of Maximum Likelihood Estimates for the Hierarchical Linear Models, Thèse de Ph. D. non publiée, Educational Psychology and Special Education, Michigan State University.
  • Bryk, A.S., et S.W. Raudenbush 1992Hierarchical Linear Models : Applications and Data Analysis Methods, Newbury Park, CA : Sage.
  • Bryk, A.S., S.W. Raudenbush, et R. Congdon 1999HLM : Hierarchical Linear and Nonlinear Modeling with the HLM/2L and HLM/3L Programs, Chicago : Scientific Software International.
  • Burstein, A. 1980a The Analysis of Multi-Level Data in Educational Research and Evaluation,Review of Research in Education, 8 : 153-223.
  • Burstein, A. 1980b The Role of Levels of Analysis in the Specification of Educational Effects, inR. Dreeben et J. Thomas (Eds.), Analysis of Educational Productivity : Issues in Microanalysis, Cambridge, MA : Ballinger.
  • Busing, F.M.T.A. 1993 Distribution Characteristics of Variance Estimates in Two-Level Models, Cahier de recherche, Department of Psycho-metrics and Research Methodology, Leiden, Pays-Bas.
  • Dempster, A.P., D.B. Rubin, et R.K. Tsutakawa 1981 Estimation in Covariance Components Models, Journal of the American Statistical Association, 76 (374) : 341-353.
  • Granovetter, M. 1985 Economic Action and Social Structure : The Problem of Embeddedness, American Journal of Sociology, 91 (3) : 481-510.
  • Goldstein, H.1987 Multilevels Mixed Linear Models Analysis Using Iterative Generalized Least Squares, Biometrika, 73 (1) : 43-56.
  • Goldstein, H.1995Multilevel Statistical Models, Londres : Arnold.
  • Hofmann, D.A. 1997 An Overview of the Logic and Rationale of Hierarchical Linear Models,Journal of Management, 23 (6) : 723- 744.
  • Hofmann, D.A., et M. Gavin 1998 Centering Decisions in Hierarchical Linear Models : Implications for Research in Organizations, Journal of Management, 24 (5) : 623-641.
  • House, R., D. Rousseau, et M. Thomas-Hunt 1995 The Meso Paradigm : A Framework for the Integration of Micro and Macro Organizational Behavior, in L.L. Cummings and B.M. Staw (Eds.), Research in Organizational Behavior, Vol. 17, Greenwich, CT : JAI Press, 71-114.
  • Hox, J. 1997 Multilevel Modeling : When and Why, inI. Balderjahn, R. Mathar et M. Schrader (Eds.), Classification, Data Analysis and Data Highway : Proceedings of the 21st Annual Conference of the Gesellschaft für Klassification, University of Potsdam, March 12-14, New York, NY : Springer-Verlag, 147-154.
  • James, W., et C. Stein 1961 Estimation with Quadratic Loss,in J. Neyman (Ed.), Proceedings of the Fourth Berkeley Symposium on Mathematical Statistics and Probability,Berkeley, CA : University of California Press, 361-379.
  • Kelly, R.J., et T. Mathew 1994 Improved Nonnegative Estimation of Variance Components in some Mixed Models with Unbalanced Data, Technometrics, 36 (2) : 171-181.
  • Kim, K.S. 1990 Multilevel Data Analysis : A Comparative Examination of Analytical Alternatives (Data Analysis) Comparison of Analytical Alternatives, Thèse de Ph. D. non publiée, Los Angeles, CA : University of California.
  • Klein, K.J., H. Tosi, et A. Cannella 1999 Multilevel Theory Building : Benefits, Barriers, and New Developments,Academy of Management Review,24 (2) : 243-248.
  • Kreft, I.G., et J. de Leeuw 1998Introducing Multilevel Modeling, Thousand Oaks, CA : Sage.
  • Lindley, D.V., et A.F.M. Smith 1972 Bayes Estimates for the Linear Model,Journal of the Royal Statistical Society,Series B, 34 (1) : 1-41.
  • Longford, N. 1987 A Fast Scoring Algorithm for Maximum Likelihood Estimation in Unbalanced Mixed Models with Nested Random Effects, Biometrika, 74 (4) : 817-827.
  • Longford, N. 1990VARCL Software for Variance Component Analysis of Data with Nested Random Effects (Maximum Likelihood),Princeton, NJ : Educational Testing Service.
  • Mason, W.M., G.M. Wong, et B. Entwistle 1983 Contextual Analysis through the Multilevel Linear Model, in S. Leinhardt (Ed.), Sociological Methodology, San Francisco, CA : Josey-Bass, 72-103.
  • Morris, C.N. 1983 Parametric Empirical Bayes Inference : Theory and Applications, Journal of the American Statistical Association,78 (381) : 47-55.
  • Rasbash, J., et G. Woodhouse 1995Mln Command Reference, Londres : University of London, Institute for Education.
  • Raudenbush, S., A. Bryk, Y.F. Cheong, et R. Congdon 2000HLM 5 : Hierarchical Linear and Nonlinear Modeling, Chicago, IL : Scientific Software International.
  • Rodriguez, G., et N. Goldman 1995 An Assessment of Estimation Procedures for Multilevel Models with Binary Responses, Journal of the Royal Statistical Society, Series A, 158 (1) : 73-89.
  • Rosenberg, B. 1973 Understanding Correlates of Change by Modeling Individual Differences in Growth, Psychometrica, 50 : 203-228.
  • Rowe, K.J. 1999 Accounting for the Hierarchical Structure of Data in Psychosocial Research : An Annotated Example Using Multilevel Structural Equation Modeling, in M. Mok et G.S. Birke (Eds.), Collected Papers on Applications in Multilevel Modeling,Sydney : Macquarie University Press.
  • Snijders, T. et R. Bosker 1999Multilevel Analysis : An Introduction to Basic and Advanced Multilevel Modeling, Thousand Oaks, CA : Sage.
  • Tate, R.L. et Y. Wongbundhit 1983 Random Versus Nonrandom Coefficient Models for Multilevel Analysis,Journal of Educational Statistics, 8 : 103-120.
  • Tosi, H.1992The Environment/Organization/Person Contingency Model : A Meso Approach to the Study of Organizations, Greenwich, CT : JAI Press.
  • Quelques sites Internet :
  • Harvey Goldstein Institute for Education, University of London http://www.ioe.ac.uk/hgpersonal
  • Teaching Resources and Materials for Social Scientists (site sur la modélisation multiniveaux) http://tramss.data-archive.ac.uk
  • Centre for Multilevel Group http://multilevel.ioe.ac.uk/index.html

Notes

[1]

Voir le numéro spécial d’Academy of Management Review dirigé par Klein, Tosi et Cannella (1999).

[2]

L’estimateur bayesien est aussi qualifié de shrinkage estimator (James et Stein, 1961 ; Morris, 1983).

[3]

Les données utilisées dans cet exemple sont différentes de celles de l’exemple précédent.

Plan de l'article

  1. PRINCIPES DES MODELES LINEAIRES HIERARCHIQUES
    1. RECHERCHES MULTINIVEAUX
    2. PROBLÈMES POSÉS PAR LA STRUCTURE HIÉRARCHIQUE DES DONNÉES
    3. LOGIQUE DES HLM
    4. ESTIMATION DES EFFETS ALEATOIRES ET DES EFFETS FIXES DANS LES HLM
    5. HYPOTHESES D’UTILISATION DES HLM
    6. TAILLE DES ECHANTILLONS
    7. DECISIONS A PRENDRE LORS DE LA REALISATION D’UN HLM
      1. SPECIFICATION DES MODELES
      2. CENTRAGE DES VARIABLES INDEPENDANTES
      3. ESTIMATION DES PARAMETRES
      4. LOGICIEL
    8. LECTURE DES RESULTATS : TESTS STATISTIQUES
  2. EXEMPLE D’APPLICATION
    1. ETAPE 1 : ANALYSE DE VARIANCE
    2. ETAPE 2 : MODELES AVEC X
    3. ETAPE 3 : MODÈLES AVEC X, W ET Z
    4. ETAPE 4 : MODÈLES AVEC X, W ET Z, ET EFFET MODÉRATEUR DE W ET Z
    5. COMPARAISON DES RESULTATS AVEC UNE REGRESSION MCO
    6. UN EXEMPLE DE HLM A TROIS NIVEAUX
  3. CONCLUSION

Pour citer cet article

Arrègle Jean-Luc, « Les modèles linéaires hiérarchiques : 1. principes et illustration », M@n@gement, 1/2003 (Vol. 6), p. 1-28.

URL : http://www.cairn.info/revue-management-2003-1-page-1.htm
DOI : 10.3917/mana.061.0001


Pages 1 - 28 Article suivant
© 2010-2014 Cairn.info
back to top
Feedback