Economie & prévision
La Doc. française

I.S.B.N.sans
198 pages

p. 71 à 87
doi: en cours

Veille sur la revue
Veille sur l'auteur
Vous consultez

no 150 2001/4-5

2001 Économie et Prévision

Développement d’un index d’états de santé pondéré par les utilités en population française : le Health Utilities Index

Catherine Le Galès  [(*)] Catherine Buron  [(*)] Nathalie Costet  [(*)] Sophia Rosman  [(*)] Gérard Slama  [(**)]
par Catherine Le Galès, Catherine Buron, Nathalie Costet, Sophia Rosman et Gérard Slama Le Health Utilities Index (HUI) est constitué d’une classification d’états de santé et d’une fonction de pondération de ces états. La classification permet de décrire la santé d’un individu ou d’une population à un moment donné et au cours du temps. Les états de santé étant multidimensionnels, la théorie de l’utilité multiattribut de Keeney et Raiffa, prolongement de la théorie de l’utilité espérée, permet de construire la fonction de pondération supposant que chaque dimension du HUI est un attribut de la fonction d’utilité. Après avoir rappelé les fondements théoriques retenus pour modéliser la fonction d’utilité multiattribut associée au HUI3, l’enquête de révélation des préférences effectuée en population française et la construction des fonctions d’utilité moyenne et médiane sont présentées et discutées.Mots-clés : théorie de l’utilité multiattribut, états de santé, enquête. The Health Utilities Index is a generic multi-attribute preference-based system for assessing health-related quality of life. It has been used in cost-effectiveness evaluations in North America and in international multicentre studies but was not available in France. After cross-cultural adaptation and validation of the HUI3 classification for the French population, the purpose of this survey was to derive population weights for the French instrument. Face-to-face interviews were conducted on a representative sample (n=365) of the French population. Visual Analogue Scale and Standard Gamble techniques were used to measure preferences. Based on the multi-attribute utility theory, collected data provided utility functions for person-mean and median.Keywords : multiattribute utility theory, health, related quality of life, survey.
Cette recherche a bénéficié d’un financement par le Programme Hospitalier de Recherche Clinique (Direction des Hôpitaux) lors des appels d’offre de 1995 et 1996. Nous remercions également Samuel Aballéa pour sa participation rigoureuse et efficace à l’analyse des données d’enquête. Une 1ère version de ce texte a fait l’objet d’une communication orale au colloque du Collège des Économistes de la Santé, L’état de la réforme, qui s’est tenu à Paris les 3 et 4 février 2000.
Le Health Utilities Index (HUI) est constitué d’une classification d’états de santé et d’une fonction de pondération de ces états. La classification permet de décrire la santé d’un individu ou d’une population à un moment donné et au cours du temps. Les états de santé étant multidimensionnels, la théorie de l’utilité multiattribut de Keeney et Raiffa, prolongement de la théorie de l’utilité espérée, permet de construire la fonction de pondération supposant que chaque dimension du HUI est un attribut de la fonction d’utilité.
Après avoir rappelé les fondements théoriques retenus pour modéliser la fonction d’utilité multiattribut associée au HUI3, l’enquête de révélation des préférences effectuée en population française et la construction des fonctions d’utilité moyenne et médiane sont présentées et discutées.
Le Health Utilities Index (HUI), développé par Torrance et alii à l’Université de McMaster (Canada), est une méthode générique de mesure des états de santé et de la qualité de vie associée à la santé (Feeny et alii, 1995; Torrance et alii, 1995; Torrance et alii, 1996; HUG/HUI Web page). Il est constitué d’une classification d’états de santé et d’une fonction d e pondératio n de ces états. La classification repos e sur u ne concep tion multidimensionnelle de la santé. Elle permet de décrire l’état de santé d’un individu ou d’une population à un moment donné et au cours du temps et repose plutôt sur des concepts de capacité fonctionnelle que de performance. Le choix des dimensions qui la composent a évolué au cours du temps. La première version du HUI avec quatre attributs de 4 à 8 niveaux (activité physique, activité habituelle, fonction socio-psychologique et problèmes de santé) s’inscrit dans la ligne des travaux de Bush sur l’Index du Quality of Well-Being (Fanshel et Bush, 1970, Kaplan et Bush, 1982). La deuxième version (7 dimensions de 3 à 5 niveaux : sensation, mobilité, émotion, cognition, activité élémentaire, douleur, fertilité), publiée au milieu des années quatre-vingt, introduit surtout les apports des travaux de Cadman sur les dimensions de l’état de santé considérées comme importantes à l’issue d’une enquête en population (Cadman et Goldsmith, 1986 ; Cadman et alii, 1986). Le HUI2 étant construit pour être, principalement, un outil d’évaluation de l’état de santé d’enfants (ayant été) atteints de cancer, le développement de la classification HUI3 avait, lui, pour objectif de disposer d’un instrument pouvant être utilisé dans une population quelles que soient ses caractéristiques démographiques ou médicales. Cette dernière version retient ainsi 8 dimensions (la vue, l’ouïe, l’élocution, la capacité à marcher, la dextérité, l’état psychologique, la mémoire et la capacité à réfléchir et la douleur) avec chacune 5 à 6 niveaux. Un état de santé est donc un vecteur de 8 éléments, le premier indique le niveau pertinent sur la première dimension (la vue) pour l’individu dont la santé est décrite, le second, le niveau sur la seconde dimension (l’ouïe). Au total, 972 000 états de santé sont possibles. La fonction de pondération permet de valoriser les états de santé les uns par rapport aux autres sur une échelle allant de 0 à 1. Ses principes fondateurs sont, d’une part, que les individus ont des préférences pour les états de santé, qu’ils peuvent les révéler et, d’autre part, que ces préférences individuelles doivent être prises en compte lorsqu’il s’agit de comparer ou de choisir, en univers risqué, entre des actions de santé dont les conséquences s’expriment par différents états de santé. Cette fonction s’appuie donc sur la théorie économique des choix rationnels axiomatisée par von Neumann et Morgenstern (1947) selon laquelle l’utilité, c’est-à-dire le niveau de satisfaction subjective, est le critère dont les individus cherchent à maximiser l’espérance mathématique lorsqu’ils font des choix en univers risqué. La fonction de pondération du HUI est la fonction d’utilité collective associée aux états de santé de la classification, construite sur la base des préférences recueillies auprès d’un échantillon de personnes appartenant à la population générale. Les états de santé étant multidimensionnels, la théorie de l’utilité multiattribut de Keeney et Raiffa (1976), prolongement de la théorie de l’utilité espérée lorsque les conséquences sont complexes, permet plus spécifiquement de construire cette fonction d’utilité en supposant que chaque dimension du HUI est un attribut de la fonction d’utilité.
Le HUI est donc un instrument à la gamme d’usages très étendue :
  • l’existence d’une classification d’états de santé génériques aux propriétés métrologiques évaluées lui permet de satisfaire les trois caractéristiques indispensables à une méthode de mesure d’états de santé que sont la capacité de discrimination, celle d’évaluation et celle de prédiction ;
  • le fondement théorique de la fonction de pondération par les préférences le rend conforme aux exigences actuelles de l’analyse économique des actions de santé et plus particulièrement aux recommandations en matière d’analyse coût-efficacité (Gold et alii, 1996). Selon celles-ci, les méthodes prenant en compte simultanément les éléments de durée et de qualité de vie doivent être les méthodes de référence pour évaluer l’efficacité. La classification et la fonction, combinées à des informations quant à la durée de survie, permettent, en effet, d’intégrer les préférences des individus dans la quantification des conséquences et de disposer d’une mesure plus puissante de la notion d’efficacité que les indicateurs physiques unidimensionnels traditionnellement utilisés
  • Buron et alii, 1997a).
Après avoir rappelé les fondements théoriques retenus pour modéliser la fonction d’utilité multiattribut associée à la classification française du HUI3 [1], cet article décrit le protocole de révélation des préférences individuelles développé et analyse les données recueillies au cours de l’enquête effectuée en population française en juin 1999. Les fonctions d’utilité multiattribut des individus moyen ou médian sont présentées et discutées.
 
Fondements théoriques et méthodologiques
 
 
Théorie de l’utilité multiattribut
La théorie de l’utilité multiattribut permet, à la fois, de modéliser, en univers risqué, les préférences pour les états de santé multidimensionnels de la classification HUI3 et de traiter le caractère multidimensionnel de l’état de santé en évitant de mobiliser une approche globale (parfois qualifiée d’holistique, Fischer, 1979) qui consisterait à révéler directement les préférences individuelles pour les 972 000 états de santé de la classification HUI3.
Dans ce cadre théorique, la fonction d’utilité multiattribut u E u x x x j j i j j ( ) ( ,..., ,..., ) ( ) ( ) ( ) =1 8 associée aux états de santé E j j ( =1,..., 972 000) est caractérisée par p lusieurs arguments qui correspondent respectivement à un niveau particulier de chacune des huit dimensions (attributs) de la classification. La spécificité de la théorie de l’utilité multiattribut est d’établir, sur la base de l’ancrage axiomatique de la théorie de l’utilité espérée, des hypothèses supplémentaires permettant d’exprimer une fonction d’utilité multiattribut comme une co mbinaison mathématique f des fonctions d’utilité X pour i chacun des attributs X (fonctions d’utilité i uniattribut conditionnelles) :
Une telle approche permet donc d’évaluer indirectement la fonction d’utilité multiattribut des différents états de la classification, à partir de l’évaluation d’éléments plus simples et moins nombreux.
L’hypothèse fondamentale de la théorie de l’utilité multiattribut est l’hypothèse d’indépendance en termes d’utilité (Farquhar, 1977 ; Fischer, 1979 ; Fishburn, 1965 ; Keeney, 1971,1974 ; Keeney et Raiffa, 1976). Selon cette hypothèse, un attribut X i (ou un sous-ensemble d’attributs) est dit indépendant en termes d’utilité de son ensemble complémentaire si l’ordre de préférence sur des loteries, dont les états de santé diffèrent les uns des autres uniquement sur le niveau de l’attribut X, est i identique si l’on modifie le niveau des attributs de l’ensemble complémentaire. Si cette hypothèse seule est vérifiée pour chacun des huit attributs, la fonction d’utilité multiattribut est dite multilinéaire (1). Cette hypothèse renforcée ou complétée conduit aux formes multiplicative (2) ou additive (3) :
où :
  • a fonction d’utilité multiattrib ut u E u x x x( ) ( ,..., ,..., )=, définie sur les états de i1 8 santé E caractérisés par 8 attributs (i =1,2,..., 8), est n ormalisée sur [0,1 ] de sorte que
  • * *
  • u E u x x x i ( ) ( ,..., ,..., ) * * = = 1 8 1 et u x i ( ) = 1 8 0 où xi* représente le u x x x ) ( ,..., ,..., o o o o = meilleur niveau de l’attribut Xi et xio le pire niveau de cet attribut ;
  • les fonctions d’utilité uniattribut conditionnelles ulement x( ), définies sur l’attribut X sont éga i ii normalisées sur [0,1], telles que u x i i ( ) * =1 et u x i i ( ) o =0;
  • les’échelle, telles que k sont des constantes d o o i k u x x x x x i i i i =- + ( ,..., , , ,..., ) *1 1 1 8o o, qui correspondent respectivement aux utilités des états de santé extrêmes, pondérations respectives des utilités uniattributs conditionnelles. Un état extrême associé à un attribut particulier est tel que tous les attributs sont caractérisés par leur niveau le plus bas (°), sauf l’attribut concerné caractérisé, lui, par son niveau le plus élevé (* ) ;
  • les paramètres k k k, ,...,2 8 sont des paramètres ij ij...1 1 d’interaction d’ordre 2,3,…,8.
Dans la lignée des travaux de Torrance et alii, 1996, la modélisation que nous avons retenue pour construire la fonction d’utilité multiattribut repose sur un double choix : d’une part, celui d’une fonction d’utilité multiattribut de forme multiplicative, d’autre part, l’adhésion au mode de construction qualifié d’approche explicitement décomposée. Le choix de la forme multiplicative résulte d’un compromis entre le souci d’une forme qui représente au mieux les caractéristiques des préférences, empiriquement révélées, et l’impératif de réduction de la réalité, nécessaire pour que le protocole empirique de révélatio n des préféren ces individuelles ait les qualités d’acceptabilité indispensables. La composition multiplicative a aussi l’intérêt, contrairement à la forme additive, de tenir compte des interactions entre les préférences sur les différents attributs d’un état de santé. De plus, un protocole de révélation des préférences fondé sur la forme multiplicative permet d’évaluer une fonction d’utilité additive, les deux formes ayant la plupart de leurs paramètres en commun. Il existe deux principaux modes de construction d’une fonction d’utilité p our des conséquences multidimensionnelles : l’approche « statistique » et l’approche « explicitement décomposée » (Farquhar, 1977; Fishburn, 1965; Keeney et Raiffa, 1976). La première approche permet d’estimer statistiquement la fonction d’utilité multiattribut à partir des utilités révélées po ur un cert ain nombre d’états multiattributs, soit en utilisant une analyse de variance (Anderson, 1970) soit une régression par les moindres carrés ordinaires (Fischer, 1979). La limite importante de cette approche est que ses résultats ne sont valides que dans le cas d’un nombre restreint d’attributs (six au plus) (Fischer, 1979 ;
Llewellyn-Thomas et alii, 1984). L’approche explicitement décomposée permet, quant à elle, de réduire le nombre de jugements nécessaires à l’obtention des utilités associées à des conséquences multidimensionnelles et de disposer d’information sur les effets distincts des différentes dimensions (Buron et alii, 1997a). Elle est donc particulièrement adaptée quand la fonction d’utilité multiattribut est définie sur de nombreux attributs comme c’est le cas de la classification HUI3.
Retenir cette approche pour construire une fonction d’utilité multiplicative d’états de santé implique de révéler les préférences, en univers risqué, pour les différents niveaux de chaque attribut de la classification HUI3 et pour les états de santé multidimensionnels extrêmes de type o o ( ,..., , , ,..., ) * x x x x x i 1o o. Cependant, pour des i i1 1 8- + raisons de spécificité de la notion d’état de santé mais également de faisabilité, certaines modifications ont du lui être apportées.
Adaptation de l’approche explicitement décomposée
Tout d’abord, nous avons été amenés à modifier la spécification des états de santé extrêmes. Plutôt que d’utiliser les états de santé extrêmes de type o o ( ,..., , , ,..., ) * x x x x x i i i1 1 1 8o o- +, tels qu’ils sont définis par la théorie multiattribut, nous avons retenu des
* * états extrêmes de type( ,..., , , ,..., ) * * x x x x x i i i1 1 1 8- +o. En effet, les personnes enquêtées appartenant à la population générale dans un état du type ( ,..., ,..., ) * * * x x x i1 8, ou dans un état très proche de celui-ci au moment de l’enquête, la spécification traditionnelle des états extrêmes caractérisée par un seul attribut à son niveau optimal (* ) et tous les autres à leurs pires niveaux (°), aurait rendu ces états extrêmes difficiles à évaluer.
La spécification retenue [2], inverse de celle trad itionnellement définie par la théo rie multiattribut, a des implications sur le mode de construction de la fonction d’utilité multiattribut. En effet, elle revient à changer le référent des pondérations des fonctions uniattributs et implique de raisonner, dans un premier temps, en termes de désutilité.
La fonction de désutilité multiplicative d’états de santé est donc la suivante :
dans lesquelles les paramètres [3] c c, et $u ii correspondent respectivement aux désutilités des * * états extrêmes ( ,..., , , ,..., ) * * x x x x x i i i1 1 1 8- +o, au paramètre exprimé en fonction de ces désutilités
des attributs. Elle autorise, ensuite, la construction de la fonction d’utilité multiattribut puisque u E u E( ) $( )= -1.
L’obtention des paramètres de la fonction de désutilité multiplicative nécessite le recours à des méthodes de révélatio n des préférences individuelles en univers risqué adaptées au champ de la santé (équivalent probabiliste et équivalent certain). Compte tenu de la spécification qualitative des conséquences, la méthode de l’équivalent probabiliste (EP) semblait la plus pertinente. Cependant, son utilisation exclusive risquait de rendre le recueil long et répétitif [4]. Nous avons donc également mobilisé une méthode de révélation des préférences en univers certain (méthode de l’échelle visuelle analogique, EVA) conduisant à l’obtention de valeurs [5]. Les valeurs et utilités révélées pour les mêmes états de santé ont ensuite été mises en relation afin de déterminer une fonction de transformation de toute valeur en utilité. Cette dernière étape prend appui sur le cadre théorique développé par Dyer et Sarin, 1979. La forme relationnelle entre valeurs et utilités peut alors être interprétée en termes d’attitude à l’égard du risque en étendant, au contexte multidimensionnel, le travail de Dyer et Sarin (1982). En effet, sous certaines hypothèses, il est possible d’établir une relation de la forme u E g v E( ) [ ( ) ]=, entre valeurs et utilités, et d’interpréter la fonction de transformation g en termes d’attitude à l’égard du risque « relatif » [6] (Buron, 1999).
Agrégation des préférences
L’objectif de ce travail est, non seulement de disposer d’informations sur les utilités que les individus donnent à des situations de santé par la spécification de fonctions d’utilité multiattribut individuelles, mais aussi de construire une fonction d’utilité multiattribut pour l’ensemble d’un groupe de personnes issues de la population générale. Ceci nous oblige alors, d’une part, à accepter l’hypothèse si controversée de la comparabilité des utilités individuelles et, d’autre part, à adopter une règle d’agrégation qui ne peut qu’être discutable.
La procédure de construction de cette fonction d’utilité de l’ensemble des personnes interrogées la plus classique suppose de construire la fonction d’utilité multiattribut de chaque individu enquêté à partir des préférences qu’il a révélées. La fonction d’utilité multiattribut « collective » est alors une fonction de ces fonctions individuelles (ou fonctionnelle). À l’exclusion d’une fonctionnelle dictatoriale, qui fait de la fonction d’utilité d’un individu celle de l’ensemble du groupe, les fonctionnelles les plus simples sont linéaires, un poids qui peut être le même (moyenne) étant attribué à chaque fonction individuelle. Une autre procédure consiste à construire un individu fictif. La fonction d’utilité « collective » est alors la fonction d’utilité multiattribut de l’individu fictif agrégé. Seule la seconde approche est présentée dans cet article. Nous avons retenu deux définitions de l’individu fictif : l’individu moyen et l’individu médian. Si le premier met l’accent sur l’intégration de l’intensité des préférences dans l’agrégation, le second donne un poids égal à chaque individu, quelles que soient ses préférences. Cette seconde agrégation correspond donc davantage à une logique de vote. Dans les deux cas, l’agrégation par construction d’un individu fictif est incompatible avec la construction d’intervalle de confiance sur les paramètres de la fonction d’utilité des individus moyen et médian. L’analyse de la variabilité des paramètres supposerait de définir d’autres individus agrégés fictifs.
 
L’enquête de révélation des préférences en population française
 
 
Protocole de révélation des préférences
L’enquête s’est déroulée sous la forme d’un entretien en face-à-face. Les méthodes de révélation ont été appliquées en fixant a priori à 1 la valeur du meilleur état possible du HUI3 et en laissant le choix entre deux états (pire état possible, décès) pour la valeur 0 (Patrick et alii, 1994). La méthode de l‘EVA [7] a été utilisée pour révéler chacune des valeurs uniattributs d u H UI 3 et les valeurs de 1 2 états multidimensionnels. Ces 12 états étaient les 8 états extrêmes nécessaires pour établir les paramètres c de la fonction de désutilité multiattribut, l’état qui n’avait pas été choisi comme valant 0 (pire état possible, décès) et 3 états multidimensionnels : MA (2,1,1,1,1,1,1,3), MB (2,1,1,3,1,2,1,3) et VI (5, 1,1,3,1,1,3,1). Ces 3 derniers états ont été retenus en supposant qu’ils seraient associés à des valeurs distinctes et réparties sur l’ensemble de l’échelle. De plus, MA et MB sont des états également sélectionnés dans les travaux canadiens (Furlong et alii, 1998) ; ils sont donc importants dans la perspective d’une comparaison ultérieure de nos résultats. Les utilités de 5 états multidimensionnels ont été révélées par la méthode de l’EP [8], ce dernier ensemble de données permettant l’établissement de la fonction de transformation des valeurs en utilités.
Afin de familiariser la personne enquêtée avec la classification HUI3, l’entretien débutait par une description de son propre état de santé selon cette classification. La notion de chronicité d’un état de santé était ensuite introduite, en lui demandant d’estimer le nombre d’années lui restant à vivre, en se référant, soit à l’espérance de vie des Français de même sexe et de même âge, soit à des informations personnelles ou familiales. Dans la suite de l’entretien, chaque fois qu’un état de santé était présenté, la personne enquêtée devait imaginer qu’il s’agissait de son propre état de santé et que celui-ci resterait inchangé pendant le nombre d’années ainsi défini, c’est-à-dire jusqu’à son décès. L’entretien s’achevait par le recu eil d’in formatio ns socio-démographiques.
En l’absence de travaux de recherche empiriques français mobilisant la théorie de l’utilité multiattribut dans le domaine de la santé, nous avons, dans un premier temps, réalisé une enquête-pilote auprès d’un échantillon de plus de 70 personnes recrutées sur la base du volontariat [9]. Nos objectifs étaient non seulement de tester l’acceptabilité et la faisabilité d’une enquête reposant exclusivement sur l’emploi de méthodes de révélation des préférences mais aussi d’obtenir des premiers résultats afin de pouvoir réviser, si nécessaire, le choix de la modélisation multiattribut pertinente lors de l’enquête en population. Prenant appui sur les conclusions positives de ce premier travail d’enquête (Le Galès et alii, 1997 ; Buron et alii, 1997b, 1999), l’enquête en population générale a été réalisée en juin 1999.
Population enquêtée
Un échantillon de 365 personnes issues de la population générale française, âgées de 20 à 65 ans et ne souffrant pas d’affection chronique ou invalidante a été constitué par la méthode des quotas selon cinq critères. Les répartitions par zone géo graphiqu e [10], par taille de commune d’habitation [11] et par CSP [12] sont représentatives de la population française. Les répartitions des effectifs par sexe et âge (4 classes : [20-30 ans], [31-40 ans], [41-50 ans], [51-65 ans]) sont, en revanche, homogènes.
La procédure de recrutement reposait sur une sélection aléatoire des individus dans chacune des grandes zones géographiques à partir de l’annuaire téléphonique. Les entretiens ont été réalisés au domicile des personnes interrogées par 30 enquêteurs formés au matériel spécifique de révélation des préférences. Ils utilisaient un cahier de consignes dans lequel figuraient à la fois les instructions les concernant pour la conduite de l’entretien et les instructions qu’ils devaient lire à la personne enquêtée. De manière à minimiser le biais imputable au discours de l’enquêteur, ce cahier devait être strictement respecté. De plus, chaque enquêteur ne réalisait qu’un nombre limité d’entretiens (15 au maximum).
Les caractéristiques socio-démographiques de l’échantillon sont décrites dans le tableau 1.

Tableau 1
caractéristiques socio-démographiques de l’échantillon
IMGIMGTableau 1 : caractéristiques socio-d...IMGIMF
Tableau 1 : caractéristiques socio-démographiques de l’échantillon Variable Modalités N (%) Femmes 184 (50,4%) Sexe Hommes 181 (49,6%) [20-30 ] 97 (26,6% ) [31-40 ] 89 (24,4%) Age [41-50 ] 94 (25,8%) [51-65 ] 85 (23,3%) M arié ou vivantmaritalement 246 (67,8%) 87 (24,0% ) Statut matrimonial Célibataire Divorcé (e ) 21 (5,8%) Veuf (ve ) 9 (2,5%) Actif 246 (67,4%) Inactif 63 (17,3% ) Emploi Congé maladie 5 (1,4 %) Chômage 14 (3,8%) Autre 37 (10,1%) Aucun ou CEP 41 (11,3%) CAP 73 (20,1%) BEPC 24 (6,6% ) Niveau de diplôme BEP 40 (11,0%) Bac 51 (14,0%) Bac et plus 134 (36,9 %) Aucune 213 (58,4%) Pratique religieuse Occasionnelle 111 (30,4%) Régulière 41 (11,2%) < 3 000 F 17 (4,7%) 3-6 000 F 45 (12,6%) Revenu 6-12 000 F 120 (33,5%) 12-20 000 F 112 (31,3%) > 20 000 F 64 (17,9%) 0 105 (28,8%) 1 57 (15,7%) Nombre d’enfants 2 124 (34,1%) 3 50 (13,7%) 4 et plus 28 (7,7%)

 
Résultats
 
 
Faisabilité du protocole de révélation des préférences
Après avoir donné leur accord pour participer à l’enquête, les personnes enquêtées, qui n’avaient aucune familiarité avec les méthodes mobilisées au cours de l’enquête, ont, toutes, mené à son terme cette interrogation complexe. Les entretiens ont duré une heure en moyenne. La concentration des enquêtés et leur facilité à comprendre les questions posées ont été év aluées gl obal ement et qualitativement par les enquêteurs, en fin d’entretien. Les difficultés rapportées, qui ont pu rendre nécessaire la relecture des consignes ou la fourniture d’explications supplémentaires par les enquêteurs, relèvent le plus souvent de difficultés d’arbitrage et non de l’incompréhension des méthodes.
État de santé de la population interrogée
L’enquête devait concerner des personnes plutôt en bonne santé. Ceci s’est vérifié, puisque l’état de santé le plus prévalent (15,9%) est l’état (11111111). Les niveaux de capacité médians des différents attributs sont tous égaux à l (pleine capacité), sauf pour la douleur (niveau 2). De plus, pour 4 attributs (ouïe, élocution, marche et dextérité manuelle), le troisième quartile est aussi égal à 1. Pour les autres, le troisième quartile est au niveau 2.
Chronicité des états de santé et choix de l’ancrage des préférences
L’enquête a effectivement concerné des états de santé chroniques puisque la durée moyenne sur laquelle les états ont été évalués est de 40,1 ans (médiane de 40).
Les consignes relatives à l’ancrage inférieur des préférences multiattributs n’ont pas été respectées par 10 individus qui ont valorisé à la fois l’état le pire possible et le décès à 0. Lorsque la borne inférieure est clairement identifiée, 93,2 % des personnes ont choisi le pire état de santé et les 6,8 % restantes le décès. Ce choix n’est pas lié aux variables socio-démographiques de l’individu interrogé, ni à son état de santé mesuré par le nombre d’attributs ayant au moins une dégradation (P > 0,10 pour toutes les variables). Toutefois, ces résultats statistiques doivent être mis en rapport avec le très faible nombre de personnes ayant choisi le décès (24 versus 341).
Agrégation des données individuelles et définition des individus moyen et médian
Les individus agrégés (moyen et médian) ont été calculés après exclusion des réponses jugées comme non acceptables et en considérant séparément les parties uniattribut et multiattribut.
Pour la partie uniattribut, les motifs d’exclusion sont de deux types : d’une part, la valorisation systématique à 0 ou à 100 de tous les niveaux intermédiaires d’un même attribut, et ce pour plusieurs attributs, d’autre part, le non-respect de l’ordre logique de certains niveaux sur plusieurs attributs puisque, pour la plupart, les niveaux sont logiquement ordonnés. Au final, le nombre d’individus exclus pour le calcul des individus agrégés est assez faible (8), ce qui permet d’estimer les valeurs moyennes et médianes sur 333 personnes (échelle "Pire état possible"-"Parfaite santé").
Pour les préférences multiattributs, les réponses de certains individus n’ont pu être conservées du fait d’une erreur au moment de la réalisation de l’entretien (changement d’ancrage selon les méthodes EVA et EP). D’autre part, les préférences pour les états MA et MB étant ordonnées, les individus ayant inversé MA et MB en valeur ou en utilité ont été exclus. Le calcul des individus moyen et médian intègre finalement les données de 275 individus (échelle "Pire état possible"-"Parfaite santé").
Les tableaux 2 et 3 présentent les valeurs et utilités directement observées dans l’échantillon pour les états uni et multiattributs ainsi que les valeurs et utilités pour les individus agrégés. Du fait du faible nombre d’individus ayant choisi le décès comme borne inférieure, les données présentées concernent uniquement les individus qui ont choisi comme borne inférieure le pire état possible, soit 341 personnes.
Les valeurs uniattributs
Pour chaque attribut, la valeur moyenne des différents niveaux est cohérente avec leur ordre logique. On observe une forte variabilité des valorisations (écarts-types compris entre 14,9 et 27,1), qui semble cependant plus faible pour le niveau de capacité adjacent à l’incapacité totale. L’attribut « élocution » est celui pour lequel les écarts-types sont les plus élevés, et ce, pour tous les niveaux.
Les valeurs multiattributs
Le décès immédiat est la conséquence la plus faiblement valorisée (10,4). Les états MA et MB sont ordonnés de façon cohérente. Dans la mesure où MB correspond à MA, avec un attribut supplémentaire fortement dégradé, l’état MB ne devait pas avoir une valorisation supérieure à celle de MA. En dehors du décès (écart-type = 15,6), on observe de très fortes variabilités (écarts-types entre 21,4 et 28,4), que ce soit pour les états extrêmes ou les états MA, MB et VI.
Les utilités multiattributs
Pour tous les états évalués (y compris le décès), l’utilité moyenne est supérieure à la valeur moyenne. L’ordre des préférences en valeur et en utilité est le même. La variabilité des utilités est encore plus importante que celle observée pour les valeurs (écarts-types compris entre 25,2 et 32,1).

Tableau 2
valeurs observées pour les niveaux de capacité des attributs et construction des valeurs pour les individus agrégés moyen et médian
IMGIMGTableau 2 : valeurs observées pour l...IMGIMF
Tableau 2 : valeurs observées pour les niveaux de capacité des attributs et construction des valeurs pour les individus agrégés moyen et médian Échantillon total Individus agrégés (Échantillon retenu après exclusion ) Effectif Moyenne Écart-type Médiane Effectif Individumoyen Écart-type Individumédian Vue 5 341 15,3 16,8 10 333 15,4 16,7 10 4 341 35,2 22,0 32 333 35,5 21,5 32 3 341 50,3 23,6 50 333 50,1 23,4 50 2 341 85,9 15,0 90 333 85,8 15,1 90 Ouïe 5 341 22,8 19,8 20 333 22,9 19,4 20 4 341 35,0 21,9 33 333 35,4 21,4 35 3 341 56,6 24,9 60 333 56,8 24,8 60 2 341 64,9 25,4 70 333 65,1 25,3 70 Elocution 4 341 29,2 23,1 22 333 29,4 22,8 22 3 340 47,8 27,1 50 332 48,0 26,8 50 2 341 65,5 25,2 70 333 65,6 25,0 70 Marche 5 341 12,1 14,9 10 333 12,0 14,2 10 4 341 23,9 18,7 20 333 23,8 18,1 20 3 341 45,2 23,4 50 333 45,5 23,2 50 2 341 68,3 23,9 75 333 68,8 23,5 75 Dextérité 5 341 14,4 15,8 10 333 14,2 14,8 10 4 341 27,2 19,5 25 333 27,4 18,9 25 3 341 42,2 23,4 45 333 42,5 23,1 45 2 341 63,4 25,1 70 333 64,0 24,8 70 État psychologique 4 341 12,0 15,1 10 333 11,9 14,4 10 3 341 30,9 22,2 30 333 31,1 21,8 30 2 341 75,7 22,6 82 333 76,3 21,8 85 Mémoire et capacité à réfléchir 5 341 17,8 17,2 10 333 17,7 16,4 12 4 341 37,1 22,0 37 333 37,3 21,5 38 3 341 56,8 24,1 60 333 57,3 23,5 60 2 341 71,6 23,0 80 333 72,2 22,2 80 Douleur 4 341 18,8 15,6 15 333 18,7 14,8 15 3 341 52,1 22,9 55 333 52,4 22,7 58 2 341 76,1 21,8 85 333 76,6 21,3 85

L’introduction dans l’analyse des variables socio-démographiques disponibles (âge, sexe, position professionnelle, niveau de revenu et pratique d’une religion), ne permet pas de déterminer de facteurs prédictifs des valeurs et utilités attribuées aux états multidimensionnels.
Fonction de transformation des valeurs en utilités
Pour disposer d’une fonction de transformation des valeurs en utilités, nous avons analysé, pour les individus moyen et médian, la forme relationnelle entre les valeurs et les utilités des états MA, MB, VI, CEL et décès, les préférences pour ces états ayant été révélées par EVA et par EP au cours de chaque entretien. Après avoir vérifié la cohérence de l’ordonnancement des préférences en certitude avec celui obtenu en univers risqué, les modèles d’ajustement suivants ont été testés (Buron, 1999) :
Ajustement A (linéaire) :
Ajustement B (exponentiel) :
Ajustement C (logarithmique) :
Ajustement D (puissance-log) :
avec α = k et β = w Ajustement E (puissance) :
Les quatre premiers modèles correspondent aux relations théoriques établies entre fonctions d’utilité et de valeur par Dyer et Sarin (1979), tandis que certains travaux relatifs aux préférences pour des états de santé ont montré la pertinence du cinquième (Llewellyn-Thomas et alii, 1984 ; Mehrez et Gafni, 1987 ; O’Connor et alii, 1987 ; Torrance, 1976, Torrance et alii, 1996; Read et alii, 1984; Wolfson et alii, 1982).

Tableau 3
valorisations observées des états de santé multidimensionnels (en valeur et en utilité) dans l’échantillon total et construction des valoraisations pour les individus agrégés moyen et médian
IMGIMGTableau 3 : valorisations observées ...IMGIMF
Tableau 3 : valorisations observées des états de santé multidimensionnels (en valeur et en utilité) dans l’échantillon total et construction des valoraisations pour les individus agrégés moyen et médian Échantillon total Individus agrégés (Échantillon retenu après exclusion ) Valeurs multiattribut Effectif Moyenne Ecart-type Médiane Effectif Individu moyen Ecart-type Individu médian Vue 341 23,1 22,8 15 275 22,0 21,9 15 Ouïe 341 42,6 26,0 40 275 41,5 25,8 40 Elocution 340 38,8 24,8 40 274 38,2 25,1 38,5 Marche 340 31,2 22,8 30 275 30,3 22,5 26 Dextérité 341 36,4 24,6 34 275 35,1 24,1 30 Etat psychologique 341 18,2 24,2 5 275 18,1 24,1 5 Mémoire et capacité à réfléchir 341 30,1 28,4 20 275 29,2 27,6 19 Douleur 341 24,2 24,2 15 275 23,6 24,2 12 MA 341 76,7 21,4 85 275 78,8 19,8 87 MB 339 56,3 25,8 64 274 55,3 26,2 65 VI 341 36,3 25,1 34 275 36,0 25,3 33 Décès 331 10,4 15,6 5 275 10,4 15,8 4 Utilités multiattribut Effectif Moyenne Écart-type Médiane Effectif Individu moyen Écart-type Individu médian CEL* 340 64,2 32,1 75 275 66,5 30,9 75 MA 341 80,0 25,2 92,5 275 83,9 21,4 92,5 MB 341 71,0 26,9 75 275 71,3 26,5 75 VI 341 56,3 31,8 60 275 57,6 31,2 65 Décès 340 37,8 31,7 35 275 39,1 31,5 35 CEL : état extrême de l’attribut élocution.

La démarche adoptée par Dyer et Sarin consiste à caractériser axiomatiquement une fonction de valeur « mesurant » les différences de préférence entre des conséquences certaines, puis à définir une fonction d’utilité de VNM sur l’ensemble des indices (associées aux conséquences) de la fonction de valeur en certitude, de sorte qu’une fonction d’utilité de VNM puisse être exprimée par la forme u v E[ ( ) ]. Dans ce cadre, toutes les propriétés d’une fonction d’utilité de VNM, définie traditionnellement sur des conséquences, s’appliquent alors à u v E[ ( ) ], supposée monotone croissante en v E( ) et deux fois continûment dérivable. Ainsi, u v E[ ( ) ] a pour propriété d’être une fonction d’utilité cardinale faible, c’est-à-dire unique à une transformation affine positive près (échelle d’intervalle [13] ). Cette propriété essentielle de l’échelle permet, non pas d’affirmer que l’utilité d’un état de santé est le multiple d’une autre utilité, mais de comparer les différences entre les entités mesurées. Dans le cadre des analyses coût-efficacité, une telle propriété, bien quenécessaire et suffisante pourcertaines situations, notamment quand on travaille sur une même fonction de production, devient insuffisante quand il s’agit de comparer en termes incrémentaux des stratégies ayant des échelles distinctes. En l’absence de mesures d’utilité qui possèdent à la fois un fondement axiomatique et des propriétés de cardinalité forte, la fonction d’utilité précédemment définie peut être utilisée à défaut. Bien que cette démarche soit discutable, il s’agit d’un problème non résolu, voire non évoqué dans la littérature.
La détermination, pour les individus moyen et médian, du meilleur modèle d’ajustement a été effectuée en deux temps. Dans un premier temps, le paramètre α (et β dans le cas de l’ajustement D) de chaque modèle a été estimé de telle sorte qu’il minimise le RMSE (Root Mean Square Error) du modèle (Dyer et alii, 1973 ; Fishburn et Kochenberger, 1979). Le critère du RMSE, qui correspond à la racine carrée de l’erreur carrée moy enn e (MSE), tel que MSE =
N=5états(MA, MB, CEL, VI et décès), permet de mesurer et juger la proximité de l’ajustement de chaque modèle estimé u v E e [ ( )]aux données observées u E( ).
Une fois le meilleur estimateur α (et β) obtenu pour chaque modèle d’ajustement, les modèles ont été comparés sur la base de leurs RMSE respectifs. Afin de juger de sa proximité à la réalité, et en suivant les travaux de Keller (1985), un modèle a été considéré comme acceptable quand son RMSE était inférieur ou égal à 0,055. Le modèle ayant le plus faible RMSE a alors été considéré comme le modèle ajustant le mieux la relation entre valeurs et utilités.
Au terme de cette procédure, nous avons donc retenu le modèle puissance pour l’individu moyen comme pour le médian (tableau 4). Ce résultat est cohérent avec les études, déjà citées, qui concernaient la santé. Le modèle linéaire est celui dont les valeurs des RMSE sont les plus élevées. Or la forme relationnelle linéaire exprime la neutralité vis-à-vis du risque « relatif » et signifie que les choix en univers risqué ne sont déterminés que par les différences de préférence sur les états de santé certains, le risque inhérent à la situation décisionnelle n’influençant pas le choix. Les individus de notre échantillon ne sont donc, ni en moyenne ni en médiane, neutres vis-à-vis du risque « relatif ». Ceci est confirmé par le signe de la mesure de l’attitude vis-à-vis du risque « relatif » dans le cas du meilleur modèle d’ajustemen t (modèle puissance) : v E r v E v ( ) [ ( )] = -1 α =1 - 0,47. L a valeur du paramètre α étant inférieure à 1, elle autorise à conclure que les individus enquêtés expriment, en moyenne, une aversion vis-à-vis du risque« relatif ».
Fonctions d’utilité multiattributs des individus moyen et médian
Le choix du meilleur modèle d’ajustement de la relation entre valeurs et utilités effectué, les valeurs uniattributs ont été converties en désutilités uniattributs ( $( ) ( ) )u x v x i i = -10 47. Les paramètres , c de l’équation (I) ont été calculés à partir des i valeurs (directement mesurées) des états extrêmes, d’abord converties, par la même relation que précédemment, en utilités puis transformées en désutilités ( [ ( c v x x x x i i i i = -- + 11 1 1 847. ,... , , ,..., ) * * * * , x0 o Enfin, le paramètre c a été obtenu en résolvant l’équation (I’) et les formules de calcul de la désutilité et de l’utilité de tout état de la classification HUI3 ont été établies (tableau 5) pour l’individu moyen.
La même procédure a été suivie pour construire la fonction d’utilité pour l’individu médian. Cette fonction étant très proche de la précédente, ses paramètres ne sont pas présentés ici. En particulier, les paramètres c des deux fonctions sont identiques, appuyant, pour les deux fonctions, la pertinence du modèle multiattribut multiplicatif.
Les utilités des états extrêmes, si elles ne peuvent être interprétées selon la théorie de l’utilité multiattribut comme les poids relatifs des attributs, permettent, cependant, de distinguer les attributs état psychologique et vue pour lesquels les utilités des états extrêmes sont les plus faibles : 0,46 et 0,49 respectivement. Globalement, les écarts entre attributs restent limités : l’utilité extrême la plus faible est de 0,46, la plus élevée de 0,66 pour l’attribut ouïe.
Il est possible de calculer l’utilité des états MA, MB, VI et CEL dont les utilités ont été mesurées directement. La comparaison de ces utilités calculées aux utilités observées constitue un premier indicateur de la validité des fonctions construites pour les individus moyen et médian (tableau 6). En effet, lors de la construction de la fonction d’utilité multiattribut de l’individu moyen ou du médian, ces utilités observées n’ont été utilisées, sous forme agrégée, que pour estimer la fonction de transformation des valeurs en utilités et non pour estimer les paramètres de la fonction d’utilité eux-mêmes. Les faibles différences absolues entre utilités observées et calculées pour un individu moyen ou médian (les différences absolues sont comprises entre 0,0003 et 0,0356 pour le premier et entre 0,0347 et 0,389 pour le second) ainsi que les petites valeurs du RMSE (0,0288 et 0,3643), orientent donc vers une conclusion favorable.
De même, comme le montrent les dernières colonnes du tableau 6, les résultats obtenus par une modélisation de la fonction multiattribut de type additif, en termes de différences entre utilités calculées et observées comme de valeurs des RMSE, ne remettent pas en cause le choix du modèle multiplicatif.

Tableau 4
meilleur modèle d’ajustement de la relation entre valeurs et utilités (N= 275)
IMGIMGTableau 4 : meilleur modèle d’ajuste...IMGIMF
Tableau 4 : meilleur modèle d’ajustement de la relation entre valeurs et utilités (N= 275) Linéaire (A) Puissance (E) Exponentiel (B) Logarithmique (C ) Puissance-log (D) rmse α rmse α rmse α rmse k w rmse Moyenne 0,218 0,47 0,044 2,16 0,091 9,68 0,067 Ne converge pas Médiane 0,262 0,36 0,055 3,02 0,127 42,92 0,081 Ne converge pas


Tableau 5
fonction d’utilité multiattribut pour l’individu moyen sur une échelle allant de 0 (6,6,5,6,6,5,6,5) à 1 (1,1,1,1,1,1,1,1)
IMGIMGTableau 5 : fonction d’utilité multi...IMGIMF
Tableau 5 : fonction d’utilité multiattribut pour l’individu moyen sur une échelle allant de 0 (6,6,5,6,6,5,6,5) à 1 (1,1,1,1,1,1,1,1) 1/ Fonction de désutilité multiattribut pour un individu moyen Fonction de désutilité multiattribut sur une échelle allant de 0 (pire état de santé possible) à 1 (meilleur état de santé possible) $ ( ) ( / ) [ ( $ ) ]u E c cc u i i = + - Õ 1 1 1 8 i =1 Vue Ouïe Élocution Capacité à marcher Mémoire et Dextérité État psychologique capacité à réfléchir Douleur x1 $u1 x2 $u2 x3 $u3 x4 $u4 x5 $u5 x6 $u6 x7 $u7 x8 $u8 1 0,00 1 0,00 1 0,00 1 0,00 1 0,00 1 0,00 1 0,00 1 0,00 2 0,07 2 0,18 2 0,18 2 0,16 2 0,19 2 0,12 2 0,14 2 0,12 3 0,28 3 0,23 3 0,29 3 0,31 3 0,33 3 0,42 3 0,23 3 0,26 4 0,39 4 0,39 4 0,44 4 0,49 4 0,46 4 0,63 4 0,37 4 0,55 5 0,59 5 0,50 5 1,00 5 0,63 5 0,60 5 1,00 5 0,56 5 1,00 6 1,00 6 1,00 6 1,00 6 1,00 6 1,00 Paramètres de la fonction de désutilité multiattribut : c = – 0,990 c1 = 0,5118 c2 = 0,3408 c3 = 0,3659 c4 = 0,4316 c5 = 0,3909 c6 = 0,5546. c7 0 4415=, c8 0 4952=, 2/ Fonction d’utilité multiattribut pour un individu moyen sur une échelle allant de 0 (6,6,5,6,6,5,6,5) à 1 (1,1,1,1,1,1,1,1) L’utilité de tout état de santé E est obtenue par la formule suivante : u E u E( ) $( )= -1 Forme simplifiée multiplicative : u E a a a a a a a a( ) , ( ) ,= × × × × × × × × -1 01 0 01 1 2 3 4 5 6 7 8 Vue Ouïe Elocution Capacité à marcher Dextérité Etatpsycholgique Mémoire etcapacité à réfléchir Douleur x1 a1 x2 a2 x3 a3 x4 a4 x5 a5 x6 a6 x7 a7 x8 a8 1 1,00 1 1,00 1 1,00 1 1,00 1 1,00 1 1,00 1 1,00 1 1,00 2 0,96 2 0,94 2 0,93 2 0,93 2 0,93 2 0,93 2 0,94 2 0,94 3 0,86 3 0,92 3 0,89 3 0,87 3 0,87 3 0,77 3 0,90 3 0,87 4 0,80 4 0,87 4 0,84 4 0,79 4 0,82 4 0,65 4 0,84 4 0,73 5 0,70 5 0,83 5 0,64 5 0,73 5 0,77 5 0,45 5 0,76 5 0,51 6 0,49 6 0,66 6 0,57 6 0,61 6 0,56


Tableau 6
utilités calculées et observées des états MA, MB, VI et CEL selon la modélisation retenue (additive, multiplicative) et l’individu agrégé (moyen, médian)
IMGIMGTableau 6 : utilités calculées et ob...IMGIMF
Tableau 6 : utilités calculées et observées des états MA, MB, VI et CEL selon la modélisation retenue (additive, multiplicative) et l’individu agrégé (moyen, médian) Modèle multiplicatiff Modèle additif Uobs Ucalc Diffce Uobs Ucalc Diffce MA 0,8387 0,8384 0,0003 MA 0,8387 0,8338 0,0049 MB 0,7127 0,6771 0,0356 MB 0,7127 0,6329 0,0798 Moyen VI 0,5758 0,5426 0,0332 VI 0,5758 0,4626 0,1132 CEL 0,6649 0,6340 0,0309 CEL 0,6649 0,6340 0,0309 RMSE = 0,0288 RMSE = 0,071 MA 0,9250 0,8896 0,0354 MA 0,9250 0,8879 0,0371 MB 0,7500 0,7847-0,0347 MB 0,7500 0,7671-0,0171 Médian VI 0,6500 0,6134 0,0366 VI 0,6500 0,5657 0,0843 CEL 0,7500 0,7111 0,0389 CEL 0,7500 0,7111 0,0389 RMSE = 0,0364 RMSE = 0,0507

 
Discussion
 
 
Le travail présenté ici constitue, à notre connaissance, la première tentative de révélation des préférences individuelles pour des états de santé menée en population générale française, à partir des méthodes d’échelle visuelle analogique et d’équivalent probabiliste.
Le nombre limité de questionnaires exclus aux différents phases de la construction de la fonction d’utilité multiattribut atteste que de telles démarches permettent le recueil d’informations de qualité sur les valeurs et les jugements que portent les individus, en France, quant à la santé.
À la différence d’autres travaux (Johnson et alii, 1998), les personnes enquêtées qui ont été exclues n’appartiennent pas à des groupes d’âge, de revenu ou de diplôme particuliers. Une enquête en face-à-face au domicile de la personne interrogée, dont le coût est certes plus élevé, permet sans doute de réduire les taux de refus ou d’abandon élevés, en particulier lorsqu’ils sont associés à une enquête par voie postale (Essink-Bot et alii, 1993 ; Johnson et alii, 1998 ; Nord, 1991).
De même, le travail préalable sur la classification (Costet et alii, 1998) a permis de disposer de descriptions d’états de santé dont la validité de contenu (Kirshner et Guyatt, 1985) avait clairement été établie. Ceci a vraisemblablement facilité les tâches d’évaluation et de jugement des personnes enquêtées et réduit les biais généralement associés à ce type d’évaluations contingentes (Kahneman et Tversky, 1982).
Notre expérience souligne donc la nécessité d’accorder un soin particulier, non seulement aux aspects méthodologiques (choix des méthodes de révélation, sélection des états à évaluer, … ), mais aussi à des éléments plus pratiques (cahier de consignes et d’instructions, supports visuels, formation des enquêteurs… ).
Nos résultats con firment la variabilité interindividuelle des préférences déjà rapportée dans des populations anglo-saxonnes. Ses variations ne peuvent être expliquées par les caractéristiques socio-démographiques documentées au cours des entretiens telles que l’âge, le sexe ou le niveau socio-économique des répondants (Rosser et Kind, 1978; Carter et alii, 1976; Kaplan et alii, 1978). Ceci n’est pas spécifique à notre travail : d’autres recherches menées sur les préférences d’états de santé échouent également à mettre en exergue des caractéristiques socio-démographiques (telles que l’âge, le sexe ou le niveau socio-économique) ou culturelles des personnes interrogées. La variabilité qui a pu être repérée jusqu’à présent ne peut être expliquée par des différences des répondants (Carter et alii, 1976 ; Kaplan et alii, 1978 ; Dolan et alii, 1996a). Deux études ont montré des relations statistiquement significatives avec l’âge (Dolan et alii, 1996b ; Johnson et alii, 1998). L’étude de Johnson et alii ( 1998) met également en évidence des relations statistiques avec le niveau d’éducation et le niveau de revenu du répondant, les personnes ayant un niveau de revenu plus faible ou un niveau d’éducation moins élevé donnant des valeurs plus élevées aux états de santé présentant des niveaux de détérioration modérés ou élevés. Toutefois, les conditions de construction de l’échantillon des personnes interrogées au cours de cette enquête étaient, de l’avis même de ses auteurs, une limite à la validité de leurs résultats.
Nous n’avons également pas mis en évidence l’influence de la catégorie socio-professionnelle, de la région d’habitation ou de la taille de la commune de résidence.
Le constat d'une forte variabilité, que l’analyse statistique ne permet ni d’expliquer ni de réduire, ouvre une interrogation quant au rôle qu’ont pu jouer les modalités de détermination des préférences elles-mêmes, qu’elles soient relatives au protocole d’interview, au choix des méthodes de révélation ou à l’entretien en face-à-face. Ainsi, le protocole suppose une représentation très précise par l’interviewé des différents niveaux de chacune des dimensions. Face à cette lourde tâche cognitive, il peut alors avoir adopté des règles de réponse empruntes d’arbitraire sans que l’enquêteur ne le perçoive. De plus, comme l’ont souvent indiqué les personnes interrogées, l’entretien était la première occasion pourelles « dese poser de telles questions ». Les préférences obtenues sont ainsi, pour partie au moins, des préférences construites dans l’interaction enquêteur-enquêté et par le prisme des questions que le premier pose au second. De façon optimale, seule l’observation de certaines régularités dans les réponses données par une même personne avec des protocoles d’interrogation différents conférera la robustesse suffisante aux informations collectées sur les préférences pour des états de santé.
Notre objectif étant de développer un index d’états de santé pondéré par les préférences pour l’utiliser comme mesure de résultats lors de travaux d’évaluation économique, la population enquêtée était issue de la population générale. Il est cohérent avec une logique d’allocation des ressources qui trouve son fondement théorique dans l’économie du Bien-Etre, de s’appuyer sur les préférences de citoyens qui ne sont pas personnellement concernés par les situations proposées et qui, en agissant « sous le voile d’ignorance », sont donc davantage susceptibles d’opter pour des règles de décision collective qui maximisent le bénéfice pour l’ensemble de la société (Harsanyi, 1953,1955). Ce choix, s’il est « très orthodoxe » pour un économiste, ne nie pas les critiques que d’autres courants de l’économie ou d’autres sciences sociales peuvent lui adresser. En conformité avec certaines règles de philosophie politique (Rawls, 1971), d es populations différentes auraient pu être enquêtées, au premier rang desquelles les personnes malades. Contrairement à d’autres travaux concernant aussi des échantillons issus de la population générale (Dolan et alii, 1996a, Dolan et Sutton, 1997; Kind et Dolan, 1995), le mode de sélection de notre échantillon et les informations recueillies ne nous ont pas permis de tester l’influence de l’expérience de la maladie pour comprendre la variabilité interindividuelle des préférences révélées pour des états de santé. De même, l’effet de la durée des états de santé sur les préférences n’a pas pu être documenté.
L’exclusion délibérée, dans l’échantillon, des personnes souffrant de maladies invalidantes ou chroniques au moment de l’enquête, ne constitue pourtant pas une limite explicite à la diversité des préférences exprimées. En effet, comme le montre une récente revue de la littérature (Ardine de Wit et alii, 2000). L’analyse de la relation établie statistiquement entre état de santé et préférence pour la santé met en lumière des jugements différentiels selon que la personne dont les préférences sont révélées, ait ou non connu personnellement la situation de santé qu’elle évalue. En règle générale, les personnes qui sont dans des états de santé très altérés accordent une valeur plus élevée à leur situation que ne le font leurs proches ou des professionnels de santé. L’explication la plus couramment avancée est que l’expérience vécue par la personne malade contribue à former ces préférences en modifiant son niveau d’information mais aussi en la conduisant à un ajustement de ses valeurs ou de ses références. Aussi, les travaux à visée descriptive ou explicative portent-ils sur de petits g roup es de malades « relativement homogènes » du point de vue de leur expérience de maladie. Mais les études des préférences pour des états hypothétiques et des états réels, selon que les personnes sont ou non malades, suggèrent que la relation entre expérience et préférence ne concerne que les états de santé effectivement vécus par les personnes, et même que les personnes issues de la population générale discriminent davantage les états de santé hypothétiques que ne font les personnes malades. L’approche explicitement décomposée retenue pour construire la fonction d’utilité multiattribut de la classification HUI3 suppose que trente-six états de santé soient présentés en cours d’enquête. Introduire la diversité des situations de santé réelles aurait supposé pouvoir, d’une part, repérer ces personnes dans la population générale dans chacun de ces états de façon valide et fiable et, d’autre part, constituer 36 échantillons de taille suffisante, chacun n’évaluant qu’une situation de santé. Ceci était à la fois irréalisable dans le cadre de ce travail et incompatible avec la construction d’une fonction d’utilité pour l’ensemble des personnes.
Comme cela a été souligné en introduction, l’utilisation opérationnelle des index d’états de santé pondérés par les préférences est le calcul d’un nombre d’années de vie ajustées par la qualité ou QALY (les scores pondérant les durées de vie passées dans un état) dans le cadre d’analyses coût-efficacité d’actions de santé. Cet objectif opérationnel justifie le choix de la population enquêtée. Il en résulte, cependant, que la fonction d’utilité multiattribut construite ne peut être utilisée, sans précaution, dans une analyse économique dont la perspective serait les seules personnes malades. De plus, la cohérence du QALY avec les fondements théoriques du calcul économique public suppose le respect d’hypothèses sur la relation entre utilité, durée de vie et état de santé qui sont très restrictives (Loomes et McKenzie, 1989) et invalidées par les travaux empiriques (Pliskin et alii, 1980, McNeil et alii, 1981, Sutherland et alii, 1982, Sackett et Torrance, 1978) [14]. L’objectif de l’enquête empêchait de procéder simultanément à la validation de ces hypothèses dans notre échantillon. Aussi avons-nous volontairement imposé aux personnes interrogées d’évaluer des états stables sur plusieurs années, limitant de fait l’utilisation ultérieure des scores pour des états de santé chroniques. De même, l’imprécision des préférences individuelles est une caractéristique que le protocole d’enquête ne permet pas de quantifier et qui devra faire l’objet de développements spécifiques.
 
Conclusion
 
 
Contrairement aux travaux d’adaptation nationale publiés jusqu’à présent, nous avons porté une attention particulière à l’adaptation culturelle et à l’établissement des propriétés métriques de la classification des états de santé qui est le premier élément constitutif de cet index. Comme l’ont récemment souligné Brazier et Deverill (1999), ce point constitue un élément important pour juger de la qualité de l’index développé.
Si les premiers éléments disponibles plaident en faveur de la qualité des fonctions de pondération moyenne et médiane construites, celle-ci ne sera établie qu’après la comparaison des utilités qu’elles permettent de calculer aux utilités révélées directement au cours d’une enquête auprès d’un nouvel échantillon de la population générale française et une intégration plus satisfaisante de la forte variabilité des préférences individuelles révélées. Ceci suppose de travailler sur des sous-groupes de l’échantillon mais il y a une difficulté puisque l’analyse statistique n’a pas permis de trouver des variables explicatives de la variabilité. La seule piste qui peut être explorée par les données collectées serait alors d’intégrer la variabilité observée en construisant la fonction d’utilité multiattribut de chacune des personnes enquêtées.
Par contre, les analogies de notre protocole avec celui retenu pour construire la fonction d’utilité multiattribut du HUI3 au Canada (Furlong et alii, 1998) justifie la comparaison internationale de nos résultats. Son esquisse laisse entrevoir une certaine ressemblance des résultats mais un travail d’analyse plus approfondi reste à effectuer.
Cette application de la théorie de l’utilité multiattribut aux états de santé doit aussi, nécessairement, se prolonger dans plusieurs directions qu’il s’agisse de l’intégration de la durée, du test de méthodes interactives de construction des préférences ou du dépassement d’un ancrage théorique controversé, par exemple. Elle constitue, enfin, une illustration exemplaire du fait que les économistes imp liqués dans l’évaluation économique des actions de santé, si leur finalité opérationnelle est d’être une aide à la décision publique, devront s’engager dans un renouvellement de leur réflexion sur les procédures d’articulation des choix collectifs aux préférences individuelles.
 
BIBLIOGRAPHIE
 
·  Anderson N. (1970). “Functionnal Measurement and Psychophysical Judgment”, Psychological Review, n° 7 7, pp. 153-70.
·  Ardine de Wits G., Busschbach J. et de Charro F. (2000). “Sensitivity and Perspective in the Valuation of Health Status : Whose Values Count ?”, Health Economics, n° 9, pp. 109-26.
·  Auray JP. Duru G., Carrère MO. (1990). « Le concept d’utilité dans l’évaluation médicale », IXème Séminaire des Économistes de la Santé, Université de Dijon, 8 juin, 70 pages.
·  Bleichrodt H. et Johannesson M. (1996). “The Validity of QALYs. An Experimental Test of Constant Porportional Tradeoff and Utility Independence”. Medical Decision Making, vol. 17, pp. 21-32.
·  Brazier J. et Deverill M. (1999). “A Checklist for Judging Preference-Based Measures of Health Related Quality of Life : Learning from Psychometrics”, Health Economics, vol. 8, pp. 41-51.
·  Buron C. (1999). Utilité et préférences en univers certain et en univers risqué : une application de la théorie de l’utilité multiattribut en économie de la santé. Thèse de doctorat en Science Économique, Université Panthéon-Assas (Paris II), soutenue le 18 janvier 1999.
·  Buron C., Le Galès C. et Fericelli A.M. (1997a). “L’indicateur QALYS à la lumière de la théorie de l’utilité espérée multiattribut explicitement décomposé”, Économie et Prévision, n° 129-130, pp. 55-71.
·  Buron C., Le Galès C. et Costet N. (1997b). “Développement d’un système de classification générique d’états de santé pondéré par les utilités : le Health Utility Index”, Communication présentée au XIXème Séminaire des économistes de la santé, Lyon, 16-17 octobre 1997.
·  Cadman D. et Goldsmith C. (1986). Construction of social Value or Utility-Based Health Indices : the Usefulness of Factorial Experimental Design Plans, Journal of Chronic Disease, vol. 39, n° 8, pp. 643-51.
·  Cadman D., Goldsmith C. Et Torrance G. (1986). Development of a Health Status Index for Ontario Children. Final Report to the Ontario Ministry of Health on Research Grant DM648(00633), McMaster University.
·  Carter WB., Bobitt RA., Bergner M. et Gibson BS.
·  (1976). “Validation of Interval Scaling : the Sickness Impact Profile”, Health Services Research, vol. 11, n° 4, pp. 516-528.
·  Costet N., Le Galès C., Buron C., Kinkor F., Mesbah M.,
·  Chwalow J., the Clinical and Economic Working
·  Groups and Gérard Slama (1998). “ French Cross-Cultural Adaptation of the Health Utilities Indexes Mark 2 (HUI2) and 3 (HUI3) Classification Systems”, Quality of Life Research, vol. 7, n° 3, pp. 245-256.
·  Dolan P. (1996). “The Effect of Experience of Illness on Health State Valuations”, Journal of Clinical Epidemiology, vol. 49, n° 5, pp. 551-564.
·  Dolan P., Gudex C., Kind P. and Williams A. (1996a). “Valuing Health States : a Comparison of Methods”, Journal of Health Economics, n° 15, pp. 209-23.
·  Dolan P., Gudex C., Kind P. et Williams A. (1996b). “The Time Trade-off Method : Results from a General Population Study”, Health Economics, vol. 5, pp. 141-154.
·  Dolan P. and Sutton M. (1997). “Mapping Visual Analogue Scale Health State Valuations Onto Standard Gamble and Time Trade-Off Values”, Social Science and Medicine, vol. 44, n° 10, pp. 1519-1530.
·  Dyer J.S., Farrell W. et Bradley P. (1973). “Utility Functions for Test Performance”, Management Sciences, vol. 20, pp. 507-519.
·  Dyer J.S. et Sarin R.A. (1979). “Measurable Multiattribute Value Functions”, Operations Research, n° 24, pp. 220-243.
·  Dyer J.S. et Sarin R.K. (1982). “Relative risk Aversion”, Management Sciences, vol. 28, n° 8, pp. 875-886.
·  Essink - Bot M.L., Stoudhard M.E. et Bonsel G.J. (1993). “Generalizability of Valuations on Health States Collected with the EuroQol Questionnaire”, Health Economics, vol. 2, pp. 237-246.
·  Fanshel S. and Bush J.W. (1970). “A Health-Status Index and its Application to Health-Services Outcomes”. Operations Research, pp. 1021-66, novembre-décembre.
·  Farquhar P.H. (1977). “A Survey of Multi-Attribute Utility Theory and Application”, TIMS Studies in the Management Sciences, vol. 6, pp. 59-89.
·  Feeny D., Furlong W., Boyle M. et Torrance G.W.
·  (1995). “Multi-Attribute Health Status Classification Systems : Health Utilities Index”, PharmacoEconomics, vol. 7, n° 6, pp. 490-502.
·  Fischer G.W. (1979). “Utility Models For Multiple Objective Decisions : do they Accurately Represent Human Preferences ? ”, Decision Sciences, vol. 10, n° 3, pp. 451-479.
·  Fishburn P.C. (1965). “Independence in Utility Theory with Whole Product sets”, Operations Research, vol. 13, pp. 28-45.
·  Fishburn P.C. et Kochenberger G. (1979). “Two-Piece Von Neumann-Morgenstern Utility Functions”, Decision Sciences, vol. 10, pp. 503-518.
·  Furlong W., Feeny D., Torrance G.W. Goldsmith C.H.,
·  DePauw D., Zhu Z., Denton M. and Boyle M. (1998). Multiplicative Multi-Attribute Utility Function for the Health Utilities Index Mark 3 (HUI3) System : A Technical Report, Working Paper Series n° 98-11, CHEPA, McMaster University.
·  Gold M.R., Siegel J.E., Russel L.B. et Weinstein M.C.
·  (eds) (1996). Cost-Effectiveness in Health and Medicine, New York, Oxford University Press.
·  Harsanyi J.C. (1953). “Cardinal Utility in Welfare Economics and in the Theory of Risk Taking”, Journal of Political Economy, vol. 61, pp. 434-5.
·  Harsanyi JC. (1955). “Cardinal Welfare, Individual ethics and Interpersonal Comparison of Utility”, Journal of Political Economy, vol. 63, pp. 309-21.
·  Health Utility Group/ Health Utilities Index, http :// www-fhs. mcmaster. ca/ hug/ index. htm.
·  Johnson J.A., Coons S.J., Ergo A. et Szava-Kovats G.
·  (1998). “Valuation of EuroQol (EQ-5D) Health States in an Adult US Sample”, PharmacoEconomics, vol. 13, n° 4, pp. 421-433.
·  Kahneman D. et Tversy A. (1982). “The Psychology of Preferences”, American Psychology, n° 246, pp. 160-173.
·  Kaplan R.M. et Bush J.W. (1982). “Health-related Quality of Life Measurement for Evaluation Research and Policy Analysis”, Health Psychology, vol. 1, pp. 61-80.
·  Kaplan R.M., Bush J.W. and Berry C.C. (1978). “The Reliability, Stability and Generalisability of a Health Status Index”, Social Statistics Section. American Statistical Association Proceedings, pp. 704-709.
·  Keeney R.L. (1971). “Utility Independence and Preferences for Multiattributed Consequences”, Operations Research, vol. 19, pp. 875-893.
·  Keeney R.L. (1974). “Multiplicative Utility Functions”, Operations Research, vol. 22, pp. 22-34.
·  Keeney R.L. et Raïffa H. (1976). Decision with Multiple Objectives, New York, John Wiley.
·  Keller L.R. (1985). “An empirical Investigation of Relative Risk Aversion”, IEEE Transactions On Systems, Man and Cybernetics, SMC, vol. 15, n° 4, pp. 475-482.
·  Kind P. et Dolan P. (1995). “The Effect of Past and Present Illness Experience on the Valuations of health States”, Medical Care, vol. 33, n° 4, pp. AS255-AS263.
·  Kirshner B. and Guyatt G. (1985). “A Methodological Framework for Assessing Health Indices“. Journal of Chronic Diseases, vol. 38, n° 1, pp. 27-36.
·  Le Galès C, Buron C., Costet C., Kinkor F., Feeny D.,
·  Furlong W., Chwalow J. et Slama G. (1997). “Assessment of the Multi-Attribute Preference Function for HUI 3 in France. Preliminary Results”, Poster Presented to the IV International Conference on Health-Related Quality of Life ISOQOL97,Vienne, 5-8 novembre.
·  Le Galès C., Costet N., Gentet J.C., Kalifa C., Frappaz
·  D., Edan C., Sariban E., Plantaz D. et Doz F. (1999). “ Cross-Cultural Adaptation of a Health Status Classification in Children with Cancer. First Results of the French Adaptation of the HUI 2 and 3”, International Journal of Cancer, Suppl. 12, pp. 112-118.
·  Llewellyn - Thomas H.A., Sutherland H.J., Tibshirani
·  R., Ciampi A., Till J.E. et Boyd N.F. (1984). “Methodological Issues in Obtaining Values for Health States”, Medical Care, vol. 22, pp. 543-552.
·  Loomes G. et McKenzie L. (1989). “The Use of QALYs in Health Care Decision Making”. Social Science and Medecine, vol. 28, n° 4, pp. 299-308.
·  McNeil B.J., Weichselbaum R. and Pauker S.G. (1981). “ Speech and Survival : Tradeoffs between Quality and Quantity of Life in Laryngeal Cancer”, New England Journal of Medicine, vol. 305, pp. 982-7.
·  Mehrez A. et Gafni A. (1987). “An Empirical Evaluation of two Assessment Methods for Utility Measurement for Life Years”, Socio-Economic Planification Science, vol. 21, n° 6, pp. 371-375.
·  Mehrez A. et Gafni A. (1987). “An Empirical Evaluation of two Assessment Methods for Utility Measurement for Life Years”, Socio-Economic Planification Science, vol. 21, n° 6, pp. 371-375.
·  Nord E. (1991). “EuroQol : Health-Related Quality of Life Measurement. Valuation of Health States by the General Public in Norway”, Health Policy, vol. 18, pp. 25-36.
·  O’Connor A.M., Boyd N.F., Warde P. et Stolbach
·  (1987). “Eliciting Preferences for Alternative Drug Therapies in Oncology : Influence of Treatment Outcome Description, Elicitation Technique and Treatment Experience on Preferences”, Journal of Chronic Diseases, vol. 40, pp. 811-818.
·  Patrick D.L., Starks H.E., Cain K.C., Ulhman R.F. et
·  Pearlman R.A. (1994). “Measuring Preferences for Health States Worse than Death”, Medical Decision Making, vol. 14, n° 1, pp. 9-18.
·  Pliskin J.S., Shepherd D.S. et Weinstein M.C. (1980). “Utility Functions for Life Years and Health Status”. Operations Research, vol. 28, pp. 206-224.
·  Pratt J.W. (1964). “Risk Aversion in the Small and in the Large”, Econometrica, vol. 32, pp. 122-136.
·  Rawls J. (1971). Théorie de la Justice, Paris, Le Seuil, (édition française 1987).
·  Read J.L., Quinn R.J., Berwick D.M., Fineberg H.V. et
·  Weinstein M.C. (1984). “Preferences for Health Outcomes. Comparison of Assessment Methods”, Medical Decision Making, vol. 4, n° 3, pp. 315-329.
·  Rosser R. et Kind P. (1978). “A Scale of Valuations of States of Illness : is there a Social Consensus ? ”International Journal Epidemiology, vol. 7, n° 4, pp. 347-58.
·  Sackett D.L et Torrance G.W. (1978). “The Utility of Different Health States as Perceived by the General Public”. Journal of Chronic Disease, vol. 31, n° 11, pp. 697-704.
·  Sutherland H.J., Llewellyn-Thomas H., Boyd N.F. et
·  Till J.E. (1982). “Attitudes toward Quality of Survival : the Concept of Maximal Endurable Time”, Medical Decision Making, vol. 2, pp. 229-309.
·  Torrance G.W. (1976). “Social Preferences for Health States : An Empirical Evaluation of three Measurement Techniques”, Socio-Economic Planification Science, vol. 10, pp. 129-136.
·  Torrance G.W., Furlong W., Feeny D. et Boyle M.
·  (1995). “Multi-Attribute Preference Functions : Health Utilities Index”, PharmacoEconomics, vol. 7, n° 6, pp. 503-520.
·  Torrance G.W., Feeny D., Furlong W. Barr R.D.,
·  Zhang Y. et Wang Q. (1996). “Multiattribute Utility Function for a Comprehensive Health Status Classification System. Health Utilities Index Mark 2”, Medical Care, vol. 34, n° 7, pp. 702-722.
·  Von Neumann J. et Morgenstern O. (1947). (2nde ed). Theory of Games and Economic Behaviour. Princeton, Princeton University Press (1944,1ère ed).
·  Wolfson A.D., Sinclair A.J., Bombardier C. et Mc Geer
·  A. (1982). “Preference Measurements for Functional Status in Stroke Patients : Interrater and Intertechnique Comparaisons”, in : Kane R.L. and Kane R.A. (eds), Values and Long Term Care, Lexington, Lexington Books.
 
NOTES
 
[(*)]CREGAS, INSERM U537, Le Kremlin-Bicêtre.
[(**)]Service de Diabétologie, Hôtel-Dieu, Paris. Centre de Recherche en Economie et Gestion Appliquée à la Santé (CREGAS). E-mail : llegales@ kb. inserm. fr
[(1)]La classification originale, développée en langue anglaise, a fait l’objet d’une adaptation et de la validation de ses propriétés psychométriques dans différentes populations de personnes malades en France (Costet et alii, 1998; Le Galès et alii, 1999).
[(2)]Dans la suite du texte, l’expression « états extrêmes » * * fera référence aux états de type ( ,..., , , ,..., ) * * x x x x x i i i1 1 1 8- +o.
[(3)]La connaissance de ces paramètres permet également de construire, la fonction de désutilité additive :
[(4)]En effet, chacune des personnes interrogées aurait dû traiter 36 EP : 28 EP pour l’obtention des 8 fonctions d’utilité uniattribut (3 EP pour l’attribut vue, 4 EP pour l’attribut ouïe, … ) et 8 EP pour les utilités des 8 états extrêmes. De plus, sachant qu’il faut 5 minutes en moyenne pour qu’un individu réponde à un EP, le protocole de révélation des préférences aurait duré 3 heures.
[(5)]Keeney et Raiffa (1976) qualifient toute fonction de préférence inscrite dans un contexte décisionnel de certitude (respectivement risqué ou incertain) de fonction de valeur (resp. d’utilité).
[(6)]Ce concept, qui se distingue des concepts de risque absolu et proportionnel (également qualifié de risque relatif) de Pratt (1964), est qualifié de risque « relatif » car il est défini « relativement » à une fonction de valeur mesurant les différences de préférences pour des états de santé certains. Ainsi, la mesure de l’attitude à l’égard du risque « relatif » s’écrit : r v E u v E u v E v [ ( )] [ ( )]/ [ ( )]= - '' '.
[(7)]Dans notre protocole, la personne interrogée utilisait un support appelé « thermomètre des préférences » et plaçait, le long de l’échelle graduée de 0 à 100, des états de santé décrits sur des cartes. Plus elle était satisfaite de l’état, plus la graduation qu’elle choisissait devait être proche du haut de l’échelle. La différence de graduation entre deux états devait refléter la différence de satisfaction éprouvée afin d’obtenir une échelle ayant des propriétés d’intervalle en plus de ses propriétés d’ordinalité (cardinalité faible).