Le travail humain
P.U.F.

I.S.B.N.2130536042
96 pages

p. 347 à 376
doi: 10.3917/th.664.0347

Veille sur la revue
Veille sur l'auteur
Vous consultez

Volume 66 2003/4

2003 Le travail humain

L’erreur de diagnostic en médecine d’urgence : application de l’analyse rationnelle des situations de travail

L. Marquié Université Toulouse-Le Mirail, Laboratoire Travail & Cognition, UMR 5551 du CNRS, MDR, 5, allée Antonio-Machado, 31058 Toulouse Cedex 9. E-mail : lmarquie@ univ-tlse2. fr É. Raufaste Université Toulouse-Le Mirail, Laboratoire Travail & Cognition, UMR 5551 du CNRS, MDR, 5, allée Antonio-Machado, 31058 Toulouse Cedex 9. E-mail : lmarquie@ univ-tlse2. fr C. Mariné Université Toulouse-Le Mirail, Laboratoire Travail & Cognition, UMR 5551 du CNRS, MDR, 5, allée Antonio-Machado, 31058 Toulouse Cedex 9. E-mail : lmarquie@ univ-tlse2. fr M. Ecoiffier Centre Hospitalier Universitaire, Service d’Accueil des Urgences Purpan TSA 40031, 31059 Toulouse Cedex 9. E-mail : ECOIFFIER. M@ chu-toulouse. fr
This study aims to empirically examine the existence of several cognitive dimensions of the optimisation of medical diagnosis in Raufaste’s model (2001). Three levels of analysis were distinguished : the “ situational ” level (situational factors), the “ task structure ” level (main steps of the diagnosis task), and the “ performative ” level (cognitive mechanisms underlying process optimisation, and related types of failures). At the performative level, the method called “ Rational Analysis of Work Situations ” (Raufaste, 2001) was applied. Raufaste identified three values : “ Richness ”, which represents the maximisation of the number of pieces of information that can be mobilised to handle the case as accurately as possible ; “ Pertinence ”, which takes into account the limited capacity of the human cognitive system : and the necessity, therefore, to limit processing to relevant facts and hypotheses ; and “ Flexibility ”, which is required when the automatic mechanisms that implement richness and pertinence fail. Two other dimensions are also relevant in seeking to explain optimisation in emergency medicine : synchronisation and coordination. Synchronisation represents the necessity to handle dynamic aspects of the situation, whereas coordination represents the need to handle interpersonal aspects.
We analysed thirty patients’ case files with recorded medical errors that occurred in the emergency care unit of a large University hospital. We gathered all the relevant information for each case. The coding of failures that occurred within each file was made by means of discussions among three psychologists.
The study’s main findings were as follows : (i) All five types of rationality errors were observed. However, their relative frequencies of occurrence were significantly different. (ii) The relationships that could be predicted a priori between rational values were reflected in the numbers of rationality errors within each file that were actually observed. Thus, there was also a significant negative correlation between richness and pertinence. There was a significant negative correlation between flexibility and pertinence. (iii) Richness, relevance and flexibility errors were not similarly distributed over the different phases of diagnosis. Keywords : Human Error, Diagnosis, Optimisation, Emergency Medicine.
Cette étude visait à contribuer à la compréhension des mécanismes cognitifs du diagnostic en médecine d’urgence, sous l’angle de l’erreur, et à tester la valeur heuristique d’un cadre théorique (Raufaste, 2001) qui prévoit que l’activité diagnostique est optimisée sur trois dimensions : la richesse, la pertinence et la flexibilité. Afin de traduire les spécificités de la médecine d’urgence, le modèle initial a été enrichi de deux dimensions, la synchronisation et la coordination et cinq types d’erreurs spécifiques ont été définis, un par dimension. Trente-trois dossiers d’erreurs médicales avérées ont été utilisés pour le test. Les cinq types d’erreurs sont apparus avec des fréquences, des temporalités et des éléments qui leur sont propres. L’interaction prévue par le cadre théorique entre deux des dimensions a été retrouvée dans les erreurs. Mots-clés : Erreur humaine, Diagnostic, Optimisation, Médecine d’urgence.
L’activité dans un service médico-chirurgical vise à élaborer un diagnostic et une décision d’action (décision de transfert du patient dans un autre service ou retour au domicile), accompagnés d’enjeux vitaux. Les informations disponibles sont la plupart du temps transmises par le patient lui-même. En outre, souvent le médecin urgentiste ne connaît pas les antécédents du patient. La médecine d’urgence se caractérise par une pression temporelle souvent forte, variable au cours de la journée et de la semaine (par exemple, dans le service considéré dans cet article, on enregistre le week-end un surcroît d’entrées de 5 %). La fréquentation est en rapide augmentation depuis dix ans, à moyens matériels et personnels quasi constants. Les difficultés sont accrues par le caractère dynamique de la situation : le diagnostic doit être réalisé plus rapidement que dans d’autres services, à cause de contraintes matérielles comme le nombre limité de lits, mais aussi à cause de la gravité présumée et de la possible évolution de la pathologie.
Toutes ces contraintes en interaction avec les limites du système cognitif peuvent induire des erreurs non récupérées, dont l’analyse sera réalisée ici à partir du cadre théorique développé par Raufaste (2001). Cette étude vise d’abord à vérifier empiriquement l’existence des dimensions cognitives de l’optimisation du diagnostic médical décrites par ce modèle. Le cadre d’analyse développé ci-après se base sur une analyse conjointe des exigences de la tâche de diagnostic médical et des caractéristiques du fonctionnement expert face à ces exigences. Sur cette base, il est possible de dégager des dimensions cognitives cruciales pour l’optimisation du diagnostic médical. Testé initialement dans le domaine radiologique, le modèle a permis de valider que la « richesse », la « pertinence » et la « flexibilité » de la représentation constituent trois dimensions cruciales pour la qualité du diagnostic. L’erreur diagnostique peut alors être vue comme une défaillance dans l’une et/ou l’autre de ces dimensions. L’objet de la présente recherche, reposant sur l’analyse de dossiers d’erreurs avérées, est de vérifier l’existence de ces défaillances et de leurs relations, fournissant ainsi une grille d’analyse psychologique des erreurs diagnostiques. Si cet article fournit une classification des erreurs, il ne prétend en reconstituer la genèse, ni du point de vue des processus psychologiques ayant conduit à tel ou tel type de défaillance, ni du point de vue des facteurs contextuels ayant affecté les processus sous-jacents.
 
I. LE MODÈLE THÉORIQUE GÉNÉRAL
 
 
Au cours des dernières décennies, de nombreuses recherches ont porté sur le savoir expert (e.g., Chase & Simon, 1973 a, 1973 b ; Chi, Feltovich, & Glaser, 1981 ; Glaser, 1985 ; Zeitz, 1994). Néanmoins, les mécanismes cognitifs qui sous-tendent une performance optimisée dans le diagnostic médical en situation dynamique restent en partie méconnus. Les différents modèles et études empiriques du diagnostic (Simon & Lea, 1974 ; Klahr & Dunbar, 1988) témoignent de l’existence d’une diversité de processus. Par exemple, dans une étude de suivi de grossesse à risque (situation dynamique comme la médecine d’urgence), Sébillotte (1984) insiste particulièrement sur deux aspects : (i) l’incertitude attachée aux données ne permet pas au médecin de les analyser d’emblée avec précision, et le conduit à élaborer un diagnostic en plusieurs phases qui s’échelonnent dans le temps ; (ii) les variables évolutives sont prises en compte par les médecins de manière plus importante que des données de départ telles que les symptômes. Outre les processus cognitifs, des facteurs contextuels peuvent influencer cette activité. En effet (i) le critère d’arrêt du diagnostic est influencé par les possibilités d’action, lesquelles dépendent du contexte ; (ii) aux conséquences de toute action s’attache une certaine incertitude liée au contexte ; (iii) la décision entre dans une stratégie de gestion des risques et des coûts (Hoc, 1996), lesquels s’évaluent nécessairement en fonction du contexte. Notamment, l’activité de diagnostic s’insère dans des objectifs plus larges, où la décision d’intervention peut prendre le pas sur la décision de diagnostic. Du fait de cette complexité et de l’importance des enjeux, l’activité médicale pose la question de la définition de l’erreur et des critères de performance.
I . 1. L’ERREUR COMME ECART A UNE PERFORMANCE
Il existe aujourd’hui un relatif consensus sur la définition de l’erreur (Amalberti, 1996 ; de Keyser, 1993 ; Hollnagel, 1993 ; Leplat, 1985 ; Norman, 1981 ; Reason, 1993 ; Woods, 1988). L’erreur est un écart par rapport à une norme, alors qu’il existe des degrés de liberté, c’est-à-dire des possibilités d’agir différemment, et une intentionnalité, c’est-à-dire l’intention préalable d’atteindre cette norme. Ici, se pose alors la question de la norme à laquelle se rapporte la définition de l’erreur (s’agit-il d’une norme par rapport à une utilité espérée, d’une norme thérapeutique... ?). Ainsi, pour notre étude, nous adoptons une définition de travail qui considère l’ « erreur de diagnostic » comme : un défaut ou une succession de défauts qui sont apparus dans le raisonnement ou le jugement du médecin (que les causes soient internes ou externes au raisonnement) et qui ont eu pour effet l’élaboration d’un diagnostic et/ou d’une décision thérapeutique inappropriées. Dans une situation donnée, le diagnostic ou la décision optimale ne peuvent pas toujours être déduits formellement, d’où la nécessité de déterminer les critères d’une performance adéquate.
I . 2. DEFINITION DES CRITÈRES DE PERFORMANCE
Raufaste (2001) propose une méthode, l’Analyse Rationnelle des Situations de Travail (AR-ST), qui adapte aux situations de travail l’analyse rationnelle de l’activité mentale (Anderson, 1990). L’AR-ST a pour objet la compréhension de l’optimisation de la performance, compréhension qui est construite à l’articulation d’une identification des exigences cognitives de la tâche étudiée et des caractéristiques de la conduite experte satisfaisant ces exigences. Plutôt que sur une modélisation formelle de l’environnement et de la tâche, souvent impossible en situation de travail, l’AR-ST s’appuie sur le repérage de dimensions de l’activité cognitive selon lesquelles s’opère l’optimisation. Ces dimensions sont nommées « valeurs de rationalité » car elles se rapportent à l’espérance d’utilité sociale de l’activité cognitive, et par opposition à d’autres points de vue sur l’activité cognitive où les dimensions considérées seraient sans rapport avec la valeur sociale de la performance produite. Ce caractère social est surtout sensible au regard de la valeur pertinence (car l’utilité sociale entre dans l’évaluation de la pertinence). En s’appuyant sur les travaux réalisés dans le domaine de l’expertise, l’application de l’AR-ST au cas du diagnostic médical a conduit l’auteur à définir un cadre théorique d’optimisation du diagnostic que nous nommerons ici « OD3 ». Le modèle OD3 articule trois valeurs de rationalité : « richesse », « pertinence » et « flexibilité ».
La valeur « richesse » représente la plus grande diversité qualitative et quantitative des connaissances mises en œuvre par le sujet expert (Caillot, 1984 ; Glaser, 1985 ; Reason, 1993 ; Zeitz, 1994). Pour faire face à l’extrême complexité de son environnement, le médecin doit posséder un répertoire de conduites dont la richesse est en rapport avec cette complexité [1]. La richesse est mobilisée dans toutes les phases du diagnostic, puisque chacune de ces phases requiert des connaissances adaptées. Par exemple, pour le recueil des données et pour la génération des hypothèses, le médecin doit disposer de connaissances en lien avec les maladies susceptibles de déclencher les symptômes. Au niveau de la décision thérapeutique, il doit posséder des connaissances sur les moyens de guérir la pathologie envisagée.
Le choix d’une valeur « pertinence » résulte de la limitation des ressources cognitives, notamment de la capacité limitée de la mémoire de travail. Face à la richesse des connaissances et informations disponibles, il est nécessaire de limiter le traitement aux seuls éléments (faits, hypothèses et procédures) pertinents (Simon, 1955 ; Shanteau, 1992). Plusieurs études montrent en effet que les experts intègrent une proportion plus forte d’informations pertinentes dans leurs représentations (Lesgold et al., 1988 ; Patel, Groen, & Arocha, 1990 ; Raufaste, Eyrolle, & Mariné, 1998). La valeur de pertinence peut être mobilisée dans différentes phases du diagnostic médical. Par exemple, au niveau du recueil des données, le médecin doit savoir sélectionner les informations importantes à intégrer dans son raisonnement. Dans la phase de génération des hypothèses, il doit sélectionner un jeu d’hypothèses en rapport avec les symptômes recueillis.
Enfin, la valeur « flexibilité » renvoie à la remise en question de la représentation élaborée initialement par la mise en œuvre des mécanismes produisant la richesse et la pertinence. Elle est rendue nécessaire lorsqu’un cas est trop atypique pour que les automatismes [2] à la base de la richesse et de la pertinence [3] soient suffisants pour résoudre le cas. Elle suppose donc une inhibition de la représentation préalablement construite par les processus automatiques. Dans un sens plus général, la flexibilité est parfois considérée comme une caractéristique fondamentale de l’expertise (Frensch & Sternberg, 1989 ; Lesgold et al., 1988 ; Olsen & Rasmussen, 1989). On pourrait avec raison objecter que la flexibilité cognitive peut être implémentée et/ou facilitée par des traitements parallèles (Lesgold et al., 1988). Cependant, nous réservons ici le terme de flexibilité pour des processus qui prennent place une fois la représentation initiale du cas terminée.
Ces trois valeurs ne doivent pas être considérées séparément, mais en interaction. En particulier, un antagonisme entre richesse et pertinence semble inévitable. Si le médecin envisageait toutes les hypothèses possibles (privilégiant la richesse), cela se ferait au détriment de la pertinence puisqu’il sélectionnerait des hypothèses sans importance (à la fois très peu probables et sans conséquence). De ce fait, généralement, plus on augmente la richesse, plus on diminue la pertinence. Prédire la nature des interactions entre richesse et flexibilité est moins clair. En effet, augmenter la flexibilité requiert dans un premier temps d’inhiber une interprétation déjà active en mémoire de travail (antagonisme richesse-flexibilité). Mais, secondairement, cette inhibition ouvre le champ à d’autres interprétations et à d’autres prises d’informations. La relation entre richesse et flexibilité ne se prête pas à des prévisions simples. L’antagonisme initial entre richesse et flexibilité pouvant être compensé par un enrichissement ultérieur, la relation entre ces deux valeurs est difficilement prévisible. De même, la relation entre flexibilité et pertinence est aussi difficilement prévisible.
 
II. ADAPTATION DU MODÈLE À LA SITUATION DE MÉDECINE D’URGENCE
 
 
II . 1. PRESENTATION DE LA GRILLE D’ANALYSE
Nous avons défini trois niveaux d’analyse de l’erreur : le niveau situationnel, le niveau logique et le niveau performatif. Le « niveau situationnel » fait référence aux facteurs situationnels ou aux éléments qui peuvent peser sur l’activité du médecin et qui favorisent l’erreur (longue durée de travail, contexte d’affluence, etc.). Le « niveau de la logique de la tâche » fait référence à l’étape du raisonnement dans laquelle survient l’erreur. À cet égard, nous reprendrons la séquence d’étapes proposée par Hoc (1996) : recueil des données, génération des hypothèses, commande des examens, interprétation des résultats, diagnostic et décision. Cette série d’étapes peut s’analyser selon deux dimensions non indépendantes l’une de l’autre, la profondeur du traitement et le décours temporel de l’activité. Analyser l’activité en termes de profondeur du traitement peut servir à mettre en relation les erreurs et les processus cognitifs engagés dans leur production. Du moins au plus profond, l’activité inclut : la prise d’information (recueil des données et commande des examens), l’interprétation des résultats (génération des hypothèses et interprétation des résultats), et la décision (diagnostic et décision). L’erreur peut être située par rapport à l’ordonnancement temporel des étapes du traitement. Pour coder le décours temporel de l’activité, les six étapes de Hoc (1996) ont été agrégées en trois blocs, le début (recueil des données et génération des hypothèses), le milieu (commande des examens et interprétation des résultats), et la fin (diagnostic et décision). Le « niveau performatif », enfin, repose sur le modèle AR-ST. Une idée centrale de ce modèle est que la performance est maximisée selon diverses dimensions unipolaires, les valeurs de rationalité, par l’intermédiaire de processus cognitifs particuliers (qui, rappelons-le, ne sont pas étudiés ici). Sous cette hypothèse, on peut s’attendre à ce que les erreurs commises soient liées aux processus cognitifs sous-jacents à la maximisation de la performance et donc nous pouvons définir une classification d’erreurs qui corresponde à la classification en valeurs de rationalité.
La présente étude s’appuie sur le cadre théorique (OD3) qui comprend trois valeurs de rationalité à partir desquelles nous définirons trois types d’erreurs. « L’erreur de richesse » est un défaut de prise en compte des informations présentes dans l’environnement et/ou de mobilisation de connaissances nécessaires et disponibles compte tenu de l’état de l’art. Par exemple, le médecin fait une erreur de richesse quand il n’a pas pris en compte certains symptômes. « L’erreur de pertinence » est une sélection inappropriée, compte tenu du contexte, de faits ou d’hypothèses. Par exemple, quand le médecin commande un test qui n’a pas de valeur diagnostique par rapport aux hypothèses qu’il veut tester, il fait une erreur de pertinence. Il faut remarquer ici qu’une représentation ne peut pas être « trop riche ». En revanche, elle peut contenir des informations inutiles, ce qui renvoie à un problème de pertinence et non de richesse. On définit l’ « erreur de flexibilité » comme une défaillance, en présence d’incohérences de la représentation, dans la transformation qualitative (non-changement d’hypothèses) ou quantitative (révision des pondérations relatives des hypothèses généralement non suffisante) de cette représentation. Malgré la présence d’incohérence dans sa représentation, le sujet n’a pas mobilisé ses ressources cognitives pour remettre en cause le cadre interprétatif issu des automatismes. Par exemple, le médecin qui ne remet pas en cause l’hypothèse diagnostique générée au départ, alors que certains faits ou examens réalisés sont dissonants par rapport à cette hypothèse, commet une erreur de flexibilité.
Une étape cruciale de la méthode AR-ST consiste à définir un jeu de valeurs de rationalité pertinentes pour la tâche à analyser. L’analyse de l’activité du médecin urgentiste ainsi qu’une littérature abondante dans le domaine des situations dynamiques (Amalberti, 1996 ; Cellier, de Keyser, & Valot, 1996 ; Hoc, 1996) et de la coopération au travail (Rogalski, 1994 ; Navarro, 1991 ; Barthe & Quéinnec, 1999) justifient d’enrichir OD3 de deux nouvelles valeurs de rationalité, que nous appellerons respectivement « synchronisation » et « coopération ». La « synchronisation » traduit l’optimisation de la gestion du caractère dynamique de la situation. La « coordination » traduit l’optimisation de la gestion des aspects interpersonnels entre les différents opérateurs (entre médecins urgentistes, autres médecins, infirmières...). Le cadre théorique enrichi des deux nouvelles valeurs sera nommé « OD5 ».
Conformément à ce que nous avons fait pour les trois premières valeurs de rationalité, ces deux nouvelles valeurs de rationalité permettent de définir deux autres types d’erreurs. « L’erreur de synchronisation » est une insuffisance de richesse, de pertinence ou de flexibilité qui n’aurait pas été considérée comme erreur sans le caractère dynamique de la situation (incapacité à gérer des aspects évolutifs de la situation). Par exemple, le médecin commet une erreur de synchronisation quand il commande un examen dont les résultats seraient adéquats à un moment t, mais qui seront inutiles au moment où ils seront effectivement disponibles. Il s’agit donc d’une erreur de synchronisation car sans le caractère dynamique de la situation, il n’y aurait pas eu d’erreur. « L’erreur de coordination » est une insuffisance de richesse, de pertinence ou de flexibilité qui n’aurait pas été considérée comme erreur sans prise en considération de l’aspect interpersonnel de la situation. L’erreur de coordination apparaît quand le système a échoué dans la gestion des aspects interpersonnels que nécessitait la situation (par exemple, lorsque s’est produite une mauvaise transmission d’informations entre deux médecins). Nous allons maintenant présenter les principales hypothèses dérivées du modèle.
II . 2. HYPOTHESES
Les hypothèses testées sont centrées sur le niveau performatif et sur les interactions entre le niveau performatif et le niveau de la logique de la tâche.
II . 2 . A. Niveau performatif
Une hypothèse minimale dérivée d’OD5 est l’occurrence effective des cinq types d’erreurs que nous avons définis. Au plan qualitatif, notre attention se portera particulièrement sur la vérification de l’existence des erreurs de synchronisation et de coordination. Au plan quantitatif, notre attention se portera sur les quantités relatives des différents types d’erreurs. Raufaste (2001) postule l’existence d’interactions entre les différentes valeurs de rationalité, et, en particulier, l’existence d’un antagonisme entre la pertinence et la richesse. Ainsi, sur la base de ce modèle, on s’attend à ce que, si l’activité mentale s’optimise dans le sens de la richesse (moins d’erreurs de richesse), elle se dégrade au niveau de la pertinence (plus d’erreurs de pertinence). Conformément au modèle, une corrélation négative significative est donc attendue entre le nombre d’erreurs de richesse et le nombre d’erreurs de pertinence. Relier moins d’erreurs de richesse à plus d’erreurs de pertinence revient à relier moins d’ignorance des données disponibles à plus de traitements sur des objets non pertinents. Autrement dit, plus on prend en compte de données (réduisant le risque d’erreur de richesse), plus on risque de traiter des données non pertinentes.
II . 2 . B. Interaction entre niveau performatif et logique de la tâche
Il s’agit ici de repérer comment se distribuent les différents types d’erreurs dans les étapes du diagnostic, étapes analysées selon le décours temporel et selon la profondeur des traitements. On recherchera s’il existe des relations entre le type d’erreurs et le moment où interviennent ces types d’erreurs dans la démarche du médecin, et s’il existe une relation entre le type d’erreurs et la profondeur du traitement. Nous ne tiendrons pas compte ici des erreurs de synchronisation et de coordination, puisqu’elles peuvent difficilement être localisées dans la logique de la tâche.
II . 2 . C. Interactions entre les niveaux performatif et situationnel
On s’attend à une corrélation positive entre le nombre d’éléments situationnels aggravants et le nombre d’erreurs contenues dans un dossier. Nous n’avons pas d’hypothèse a priori sur la relation entre le nombre d’éléments situationnels et le type d’erreurs au niveau performatif. D’un point de vue exploratoire, il nous a semblé intéressant de classer les dossiers relativement à la gravité potentielle des conséquences de la combinaison d’erreurs commises. On peut ainsi repérer trois types de dossiers, soit par ordre de gravité décroissante : 1 / les cas dont la gravité a été sous-estimée et pour lesquels le patient est sorti du milieu hospitalier (par exemple, le patient ressort du service alors qu’il avait effectivement une pathologie grave) ; 2 / les cas où le patient était porteur d’une pathologie dont la gravité a été sous-estimée et est resté dans le milieu hospitalier mais a été aiguillé vers un mauvais service ; 3 / les cas où les conséquences d’un faux diagnostic ont été minimisées par le maintien du patient sous surveillance médicale. Il est important de noter ici que ce sont les dossiers (contenant éventuellement plusieurs erreurs) et non les erreurs individuelles qui seront ainsi catégorisés. Nous étudierons les relations entre le « niveau de gravité », tel que défini plus haut, et les autres paramètres du dossier. En effet, la gravité d’un dossier ne résulte généralement pas d’une seule erreur mais d’une succession d’erreurs. Nous n’avons donc pas le moyen de prédire une relation entre des erreurs locales de rationalité et l’appréciation globale de la gravité des dossiers. Ensuite, et, plus important, ce sont en fait les dossiers et non les erreurs qui sont ainsi catégorisés. Or, nous n’avons pas le moyen de prédire a priori une relation entre des valeurs de rationalité (qui s’appliquent au cas par cas à chaque erreur) et l’appréciation a posteriori de la gravité des dossiers (gravité qui résulte d’une succession d’erreurs). Cette information a été introduite à titre exploratoire, du fait de l’importance intrinsèque de cette catégorisation, mais elle ne doit pas être confondue avec les estimations a priori faites par les médecins ayant géré le patient.
Du point de vue des objectifs du service où les erreurs ont été colligées, il est probable que les dossiers du premier niveau fassent l’objet d’un relevé plus systématique que les autres. Ainsi, dans la très grande majorité des cas, l’échantillon d’erreurs dont nous disposons est composé de dossiers « graves », c’est-à-dire que les patients sont sortis de l’hôpital alors que la pathologie dont ils souffraient nécessitait impérativement un suivi en milieu hospitalier.
 
III. MÉTHODE
 
 
III . 1. MATERIEL
Le matériel était constitué de 33 dossiers complets d’erreurs considérées a priori comme suffisamment graves pour avoir été enregistrées et archivées dans le service médico-chirurgical du service des urgences. Ces dossiers correspondaient à des patients entrés au service des urgences au cours des quarante-huit mois précédant l’étude. Sur les 33 dossiers, nous en avons éliminé trois. Le premier cas comportait une erreur qui avait été détectée avant une décision (l’erreur récupérée sortant du champ de la présente étude). Dans les deux autres cas, il n’y avait pas eu de défaut dans le jugement du médecin, au moment des faits et compte tenu du contexte. Une analyse comparative entre les caractéristiques de nos dossiers (âge du patient, motif d’entrée, pathologies...) et celles de l’ensemble des « dossiers » de patients entrés au service des admissions médicales a montré que les dossiers d’erreurs sont représentatifs de la population parente. Notamment, toutes les pathologies issues de notre échantillon appartiennent aux pathologies les plus fréquemment rencontrées au service des urgences. Les erreurs ne portent donc pas sur des cas de maladies rares. Les dossiers ont été répertoriés à différentes occasions : détection interne par les experts au cours de vérifications après la sortie du patient (N = 9) ; détection et signalement a posteriori par d’autres services de l’hôpital ou d’autres hôpitaux (N = 12) ; dépôt de plaintes ou réclamations de la part des familles suite à des erreurs détectées par d’autres médecins (N = 9). Chaque dossier inclut différents types de fiches relatives notamment à l’orientation du patient, au relevé des constantes, aux observations et aux transmissions, aux prescriptions médicales, aux prescriptions d’examens et aux comptes rendus de ces examens (voir Annexe).
III . 2. CODAGE DES DONNÉES ET ANALYSE
Nous avons d’abord constitué une classification complète comprenant trois niveaux : (i) Le niveau situationnel a été constitué sur la base d’observations préalables. L’ensemble des éléments situationnels retenus se trouve dans le tableau 1 ; (ii) Le niveau logique comprenait les différentes étapes du raisonnement médical (voir plus haut) ; (iii) Le niveau performatif comprenait une typologie des erreurs selon les cinq valeurs de rationalité.


TABLEAU 1 :
Aspects situationnels aggravants identifiés dans l’ensemble des dossiers. Différents éléments du contexte ont été utilisés pour déterminer si une variable était présente ou non
Worsening situational aspects that were identified within the whole sample of patient’s case files. Various contextual elements were used as criteria to state whether a worsening context variable was present or not : Long work duration, overcrowding, patient characteristics, rare events, characteristics of diseases
IMGIMGIMGIMF

Les dossiers, ainsi que les informations complémentaires, ont été colligés par le quatrième auteur, chef du service médico-chirurgical des urgences, juste après les faits. Les informations complémentaires comprennent notamment les éléments contextuels et les explications médicales. Chaque dossier contient toutes les données sur le patient (heure d’entrée et de sortie, évolution, prescriptions, résultats des examens, lettre du médecin traitant, etc.). Il est à noter qu’aucune des erreurs retenues ne trouve de cause directe et immédiate dans les facteurs contextuels. À partir de ces informations, nous avons constitué un « arbre des causes » pour chaque dossier, avec tous les éléments qui ont pu contribuer à l’erreur diagnostique. La nature des erreurs et leur localisation dans le processus de diagnostic ont été déterminées selon la méthode des juges, c’est-à-dire par délibérations entre les trois premiers auteurs qui ont une très bonne connaissance du modèle théorique. Un entraînement a été réalisé avant les premiers codages des erreurs, avec l’aide de la grille des erreurs (tableau 2). Pour un même dossier, ont été comptées autant d’erreurs de richesse que d’informations nécessaires au traitement du cas ont été omises. Il faut rappeler que les erreurs de synchronisation et de coordination n’ont pu être localisées avec certitude dans une des étapes particulières de la démarche diagnostique. Ainsi, ces deux types d’erreurs n’ont pas été codés au niveau de la logique de la tâche.


TABLEAU 2 :
Exemples d’erreurs de rationalité en fonction de la logique de la tâche
Examples of rationality errors depending on the steps taken with the task
IMGIMGIMGIMF

 
IV. RÉSULTATS
 
 
IV . 1. RESULTATS CONCERNANT LE NIVEAU PERFORMATIF
Au niveau performatif, les résultats quantitatifs relatifs aux hypothèses sont complétés par des résultats qualitatifs relatifs à chacun des types d’erreurs.
IV . 1 . A. Résultats quantitatifs
Conformément à notre hypothèse minimale, les cinq types d’erreurs attendues ont effectivement été observés. Sur un total de 73 erreurs répertoriées dans les différentes étapes du diagnostic et pour les 30 dossiers analysés, les erreurs sont distribuées de façon raisonnablement normale avec 2,4 erreurs par dossier en moyenne (écart type = 0,86 ; asymétrie = 0,51 ; Kurtosis = – 0,24). Cela étant, les cinq types d’erreurs ne sont pas représentés de manière identique, χ2(4, N = 73) = 20,63 ; p < .001. Les erreurs de richesse (N = 25, soit 34,2 %) et les erreurs de pertinence (N = 22, soit 30,1 %) sont plus fréquentes que les erreurs de flexibilité (N = 13, soit 17,8 %), de synchronisation (N = 8, soit 11 %) et de coordination (N = 5, soit 6,8 %).
IMGIMGIMGIMFFig. 1.Nombre d’erreurs en fonction des valeurs de rationalitéNumber of errors depending on rationality values
Le cadre théorique OD3 prévoit un antagonisme entre la richesse et la pertinence. Conformément à cette hypothèse, nous trouvons une corrélation inverse entre le nombre d’erreurs de richesse et de pertinence, ρ(29) = – 0,404, p = .014 en unilatéral. Si, de plus, on élimine du calcul les dossiers ne présentant ni erreur de richesse, ni erreur de pertinence (ceux-ci n’étant pas positivement concernés par l’hypothèse), la corrélation est encore meilleure, ρ(27) = – 0,574, p = .001 en unilatéral. Ainsi, plus le nombre d’erreurs de richesse commises par le médecin est important, plus le nombre d’erreurs de pertinence est faible. Bien que le cadre théorique OD3 ne prévoie rien à ce sujet, nous observons une corrélation inverse entre les nombres d’erreurs de pertinence et de flexibilité, ρ(29) = – 0,436, p = .016. Ainsi, plus le nombre d’erreurs de flexibilité est important, plus le nombre d’erreurs de pertinence est faible.
IV . 1 . B. Résultats qualitatifs
Outre les résultats quantitatifs liés aux hypothèses dérivées du cadre théorique OD3, l’analyse qualitative des dossiers met en évidence certains faits intéressants.
Les erreurs de richesse constatées dans la plupart des dossiers ne sont pas dues à un défaut de connaissance. La plupart des maladies rencontrées aux services des urgences sont largement connues des médecins. Le plus souvent, les erreurs de richesse relèvent d’un défaut de prise en compte des informations présentes dans l’environnement. En effet, dans 14 dossiers, nous avons pu relever des erreurs causées par la recherche d’un nombre insuffisant d’informations au cours du recueil des données.
Au plan des erreurs de pertinence, l’analyse a fait apparaître dans sept dossiers une confiance excessive accordée à la fiabilité de résultats d’examens. En effet, l’absence de résultat positif à un examen amène parfois le médecin à conclure faussement à l’absence de la maladie. Or, un examen non concluant peut bien sûr signifier l’absence de la maladie recherchée, mais il peut également indiquer au moins trois types d’erreurs de la mesure : un problème de fiabilité de l’instrument ; un problème lié au moment d’application de l’instrument (le signe recherché n’est pas encore perceptible étant donné l’évolution de la maladie) ; ou enfin un problème de détection du signe recherché par celui qui interprète le résultat de l’examen. Par exemple, dans l’un des dossiers, un examen négatif ne signifiait pas l’absence de la maladie mais le caractère non diagnostique de l’examen. Dans ce dossier, tous les symptômes suggéraient une embolie pulmonaire, pathologie généralement causée par une thrombose. L’examen radiologique n’a rapporté aucun signe de thrombose mais le compte rendu stipulait que la région cible n’avait pas été regardée (pour des raisons techniques). Le médecin responsable du dossier a interprété l’absence de visibilité de la thrombose comme une absence de thrombose et donc d’embolie pulmonaire. En fait, il y avait bien une thrombose et il s’agissait bien d’une embolie pulmonaire.
Au plan des erreurs de flexibilité, deux facteurs semblent favoriser une remise en question insuffisante du diagnostic le plus évident. Le premier concerne la confirmation par le spécialiste de l’hypothèse erronée du médecin urgentiste. Le second facteur semble être la confiance excessive accordée à la fiabilité des résultats d’examens.
Nous avons pu dégager deux types d’erreurs de synchronisation. Le premier découle d’une durée d’hospitalisation insuffisante pour assurer un suivi médical satisfaisant (deux dossiers). Il traduit une difficulté pour le médecin, majeure en termes de gravité pour le patient, à évaluer correctement le temps qui va lui être nécessaire pour diagnostiquer puis pour agir, étant donné l’état initial du patient lors de son arrivée aux urgences et la vitesse présumée d’évolution de la maladie. L’évaluation du temps nécessaire à la maturation des symptômes dans l’hypothèse la plus grave a donc une incidence directe sur la durée du suivi médical aux urgences. La deuxième source d’erreurs de synchronisation résulte du non passage d’une logique de diagnostic à une logique d’action (6 dossiers). Généralement, sous pression temporelle forte, la priorité est donnée à l’action au détriment d’une analyse exhaustive de la situation. Or, certaines erreurs de synchronisation sont liées au fait que le médecin est resté trop longtemps sur une logique de diagnostic, c’est-à-dire qu’il a multiplié ainsi les examens au lieu d’envisager un traitement et de passer à l’action. Par exemple dans un dossier, un bilan biologique d’infarctus est réalisé à 0 h 30, un électrocardiogramme à 1 h 23 et le patient décède à 1 h 45 sans avoir reçu de traitement.
Plusieurs facteurs liés aux aspects interindividuels ont nui à l’élaboration du diagnostic, du fait de l’intervention de plusieurs équipes au cours de la journée et de la nuit (chacune devant repartir à zéro). Le plus souvent, les erreurs de coordination issues de notre échantillon (5 dossiers) ont été la conséquence d’une mauvaise transmission d’information (4 dossiers). Face à une incertitude, le partage de la responsabilité de la décision entre les acteurs du système a parfois induit un retard et conduit à l’erreur.
IV . 2. RESULTATS CONCERNANT LA LOGIQUE DE LA TÂCHE ET SON INTERACTION AVEC LE NIVEAU PERFORMATIF
Si l’on n’effectue aucun regroupement entre les différentes étapes, les erreurs se répartissent de manière significativement différente selon les différents moments de la logique de la tâche, χ2(5, N = 60) = 19,4 ; p = 0.002. Trois des six phases sont plus sensibles aux erreurs dans la démarche diagnostique : la phase du recueil des données (N = 16, soit 26,7 %), la phase de la commande des examens (N = 10, soit 16,7 %) et la phase d’interprétation des résultats (N = 19, soit 31,7 %). L’agrégation des six étapes du diagnostic en trois grandes étapes chronologiques (début : recueil des données et génération des hypothèses ; milieu : commande des examens et interprétation des résultats ; fin : diagnostic et décision) confirme une répartition significativement inégale des erreurs selon le moment du processus de diagnostic, χ2(2, N = 60) = 9,1 ; p = .011, avec une prépondérance des erreurs au milieu (commande des examens et interprétation des résultats) (N = 29, soit 48,3 % des erreurs), puis au début du processus (recueil des données et génération des hypothèses) (N = 21, soit 35 %). Plus on avance chronologiquement dans le diagnostic et moins on observe d’erreurs. Nous avons également découpé les étapes du processus de diagnostic en fonction du critère de la « profondeur du traitement ». L’analyse du χ2montre également une répartition différente des erreurs selon la profondeur du traitement, χ2(2, N = 60) = 7,6 ; p = .022, avec un nombre plus important d’erreurs au niveau de la prise d’information (recueil des données, commande des examens) (N = 26, soit 43,3 %), puis au niveau de l’interprétation des résultats (génération des hypothèses et interprétations des résultats) (N = 24, soit 40 %), et enfin au niveau de la décision (diagnostic et décision) (N = 10, soit 16,7 %). Ces résultats montrent qu’il existe dans le diagnostic des moments plus sensibles que d’autres, et/ou que les mécanismes mis en jeu dans les différentes phases ou niveaux de traitement donnent lieu à des quantités d’erreurs différentes. Ils seront repris en discussion.
Il existe une interaction entre la logique de la tâche et les types d’erreurs (richesse, pertinence, flexibilité) [4] Si on utilise les six niveaux de la logique de la tâche, les conditions d’utilisation du χ2 ne sont pas respectées car plus de la moitié des cellules ont un effectif théorique inférieur à cinq. En revanche, les regroupements correspondant aux deux dimensions que nous avons repérées pour la logique de la tâche respectent ces conditions. Les différents types d’erreurs se répartissent de manière différente selon la chronologie de la tâche, χ2(4, N = 60) = 18,22 ; p = .001, et selon la profondeur du traitement, χ2(4, N = 60) = 29,15 ; p <.001. Il ressort de nos analyses que : (i) 56 % des erreurs de richesse sont concentrées au début et milieu de l’étape diagnostique (plus précisément de l’étape du recueil des données jusqu’à la génération des hypothèses) ; (ii) que les erreurs de pertinence sont concentrées au niveau du recueil des données et au niveau de l’interprétation des résultats (soit 54,54 %) ; (iii) que les erreurs de flexibilité sont massivement représentées au niveau de l’interprétation des résultats (soit 76,9 %). Au total, les erreurs de richesse de pertinence et de flexibilité n’apparaissent pas au même moment durant le diagnostic.
IV . 3. RESULTATS CONCERNANT LE NIVEAU SITUATIONNEL ET SON INTERACTION AVEC LE NIVEAU PERFORMATIF
Le nombre d’éléments situationnels aggravants identifiés par le médecin expert est de 1,77 en moyenne par dossier (erreur standard : 0,26). Cependant, il n’y a pas de corrélation significative entre ce nombre et le nombre d’erreurs dans le dossier. Nous ne trouvons pas de corrélation significative entre le nombre de caractéristiques de la maladie et le nombre d’erreurs, ρ(29) = – 0,025 ; NS, ni de corrélation significative entre le nombre d’éléments situationnels et le nombre d’erreurs, ρ(29) = 0,239 ; NS.
Nous trouvons une corrélation positive, ρ(29) = 0,50 ; p = .010, entre le nombre d’éléments situationnels et l’indice de gravité. Ainsi, plus il y a de facteurs situationnels dans un dossier, plus l’indice de gravité est élevé. On peut alors s’interroger sur l’origine de cette corrélation. À cet effet, nous avons calculé le modèle de régression bilinéaire du nombre de caractéristiques de la maladie et du nombre de caractéristiques situationnelles autres que liées à la maladie sur l’indice de gravité. Bien que ce modèle n’explique que 29,3 % de la variance ( ajusté), il montre néanmoins que la corrélation entre le nombre de facteurs liés à la maladie et l’indice de gravité est significative (p = .002), alors que la contribution des autres facteurs situationnels ne l’est pas (p > .30).
 
V. DISCUSSION
 
 
Le présent travail visait à rechercher les traces de l’existence de plusieurs dimensions cognitives de l’optimisation du diagnostic médical dynamique, au moyen de l’analyse des défaillances non récupérées. Nous avons repris les trois valeurs de rationalité proposées par Raufaste (2001), richesse, pertinence et flexibilité, ce que nous avons appelé ici cadre théorique « OD3 ». Eu égard aux spécificités de la médecine d’urgence, nous avons ajouté deux nouvelles valeurs : la synchronisation et la coordination, obtenant ainsi un nouveau cadre, « OD5 ». Après avoir discuté les résultats relatifs au test de ce modèle, nous revenons sur celui-ci et concluons après avoir évoqué les limites de cette étude.
V . 1. RESUME DES RÉSULTATS
Au plan empirique, l’échantillon de dossiers dont nous disposions, contenait bien les cinq types d’erreurs prévus par « OD3 » avec, par ordre décroissant de fréquence la richesse, la pertinence, la flexibilité, la synchronisation et la coordination. L’analyse qualitative que nous avons menée a permis de montrer que de nombreuses erreurs de richesse relèvent d’un défaut de prise en compte des informations présentes dans l’environnement. Nous avons montré que certaines erreurs de pertinence étaient liées à la confiance excessive accordée à la fiabilité des examens. Certaines erreurs de flexibilité sont liées à la confiance excessive accordée au jugement d’un confrère. Le faible nombre d’occurrences des erreurs de synchronisation et de coordination ne nous permet pas beaucoup d’autres conclusions que le constat de leur existence. Toutefois, les erreurs de synchronisation sont apparues sous deux formes : mauvaise estimation du temps nécessaire à l’établissement du diagnostic ou retard dans le passage d’une logique de diagnostic à une logique d’action.
Au niveau de la logique de la tâche, un résultat très intéressant montre que les trois valeurs de rationalité sont mobilisées de manière différente, selon le moment de la démarche diagnostique. Les erreurs de richesse apparaissent principalement au début de la démarche diagnostique et les erreurs de flexibilité à la fin. Pour ce qui concerne les erreurs de richesse concentrées au début, plusieurs explications sont possibles. Tout d’abord, le diagnostic commence nécessairement par un recueil de données brutes, surtout en l’absence d’hypothèse. La probabilité de faire une erreur de richesse est donc naturellement accrue dans cette phase puisque l’essentiel de l’activité y est dévolu à la recherche d’indices.
Plusieurs dossiers suggèrent des explications possibles au fait que les erreurs de flexibilité surviennent en fin de démarche diagnostique. La première de ces explications vient de ce que, par définition, l’erreur de flexibilité requiert qu’il y ait une représentation susceptible d’être remise en cause. Plus la tâche avance, et plus il est probable qu’une représentation, suffisamment précise pour être questionnable, ait été construite. Il serait donc normal que les erreurs de flexibilité soient plus fréquentes vers la fin de la tâche qu’au début. Cet effet pourrait aussi résulter d’une stratégie consistant à attendre que toutes les informations disponibles soient réunies pour rechercher, éventuellement, les incohérences de la représentation. Cette hypothèse, qui reste à vérifier, est en accord avec les recherches réalisées dans le domaine de la flexibilité et qui montrent que cette dernière s’exprime surtout au moment de la décision (e.g., Robbins et al., 1996). Elle est également en accord avec les travaux réalisés dans le contrôle aérien qui montrent que les contrôleurs ne déclenchent généralement le traitement d’un conflit que lorsque tous les éléments de ce dernier sont présents à l’écran, et que tous les moyens d’action sont disponibles (Hoc, Morineau, & Denecker, 2000).
L’introduction d’un niveau situationnel dans l’analyse des erreurs médicales a permis de montrer que ce sont essentiellement les caractéristiques de la maladie qui sont impliquées dans la gravité de l’erreur. Les autres facteurs situationnels envisagés (contexte d’affluence, longue durée de travail, caractéristiques du patient, autres) ne semblent pas contribuer significativement à la gravité des erreurs commises. Toutefois le modèle de régression n’expliquant « que » 29,3 % de la variance, nous ne pouvons pas exclure l’existence d’autres facteurs situationnels que nous n’aurions pas pris en compte. Il est aussi possible que l’effet des facteurs situationnels existe mais soit trop petit pour être mis en évidence statistiquement avec le nombre de dossiers d’erreurs dont nous disposions. Eu égard aux problèmes de moyens rencontrés par les services de médecine d’urgence dans les pays occidentaux, les conclusions que l’on peut tirer de ce résultat doivent rester modérées. En effet, il est plausible qu’une augmentation des contraintes situationnelles externes à la pathologie soit compensée par des processus divers dont la performance pourrait s’effondrer au-delà d’un certain seuil. On ne saurait donc conclure de ce résultat qu’il est possible de négliger les problèmes situationnels comme la durée des gardes, l’affluence des patients, etc. En particulier, il faut garder à l’esprit que, même si les facteurs contextuels n’ont pas d’effet significatif sur la gravité des erreurs non récupérées, il est très plausible qu’ils en aient sur l’incidence des erreurs (ce que la présente étude ne permet pas de tester).
V . 2. DISCUSSION DU MODÈLE GÉNÉRAL
Il est à noter que l’on pourrait évoquer d’autres cadres théoriques de l’analyse de l’activité, comme le modèle de Rasmussen (1986), ou celui de Hoc et Amalberti (1994). Toutefois, si ces modèles décrivent des mécanismes cognitifs essentiels pour le diagnostic, ils ne précisent pas directement l’interaction qui existe entre ces processus et l’optimisation (niveau normatif). Au contraire, le modèle OD3, étant dérivé de l’AR-ST, se situe d’emblée à la croisée des niveaux descriptifs et normatifs. C’est pourquoi nous le pensons adapté à l’analyse de l’erreur humaine dans le diagnostic médical. On pourrait certes objecter qu’une telle approche néglige les aspects situationnels (diversité des cas traités, rythmes de travail, etc.), aspects indéniablement pertinents pour la compréhension de l’erreur. L’approche que nous proposons ne néglige pas ces facteurs mais les traite comme des paramètres de la situation à laquelle le système cognitif du médecin doit s’ajuster. La perspective est ici délibérément centrée sur le sujet plutôt que sur l’environnement de travail. Cette étude constitue une première étape visant uniquement à fournir un outil pour identifier les erreurs. Pour aborder la genèse de l’erreur et identifier des facteurs situationnels susceptibles d’y contribuer, il sera nécessaire d’approfondir l’analyse des processus cognitifs sous-jacents et des facteurs susceptibles d’affecter leur efficience.
Au plan conceptuel, la question se pose du statut de la conduite experte, en particulier en Centre Hospitalier Universitaire où les médecins les plus experts enseignent aux moins experts. Doit-on en faire une norme ? Nous pensons que non car les nombreux acteurs d’une profession ne sont pas experts au même degré et peuvent développer des stratégies adaptées à leur propre niveau d’expertise [5]. L’approche par valeurs de rationalité permet d’éviter cet écueil car celles-ci sont initialement définies par la mise en relation des exigences cognitives de la tâche et des caractéristiques du système cognitif humain. À partir de là, si l’étude de la performance experte constitue une validation du système de valeurs retenu sous l’hypothèse que des experts devraient optimiser leur performance selon ces dimensions, elle ne préjuge rien des conduites des sujets moins experts. D’une part, parce que moins un sujet est expert, moins il est probable qu’il se conforme aux valeurs de rationalité et, d’autre part, parce que les valeurs de rationalité sont précisément conçues pour permettre la vicariance fonctionnelle : des conduites très différentes peuvent optimiser, partiellement ou non, la performance sur une valeur de rationalité donnée. Le seul invariant requis dans notre approche est justement la présence de cette valeur de rationalité sous-jacente. En revanche, ces considérations révèlent un autre problème qui a pour l’instant été laissé de côté par notre approche, à savoir la question des changements de conduite au fur et à mesure de l’acquisition d’expertise, éventuellement accompagnés de non-monotonies transitoires dans la qualité de la performance (cf. Raufaste et al., 1998). Cette question reste entièrement ouverte et devra faire l’objet d’études ultérieures.
V . 3. LIMITES DE L’ÉTUDE
Au plan méthodologique, tous les dossiers ont été répertoriés par des médecins urgentistes experts. Un système de codage des erreurs (tableau 2) a été défini au départ, permettant de limiter la part interprétative. Néanmoins, une limite à considérer dans cette étude est que l’analyse des dossiers d’erreurs s’est faite a posteriori. Cela peut avoir induit un biais, en favorisant dans certains cas le classement comme erreur d’incidents qui en fait auraient été inévitables. Néanmoins, nous n’avons aucune raison de suspecter que ce biais potentiel ait affecté différemment les diverses catégories d’erreurs attendues. Il aurait pu affecter le résultat d’existence d’erreurs. Mais même la catégorie la moins représentée, l’erreur de coordination, contient cinq cas. Puisqu’un énoncé d’existence est validé à partir d’un seul cas, il paraît peu vraisemblable que ce biais soit véritablement gênant dans la présente étude.
Le lecteur pourrait être surpris de ce que nous ne rentrions pas dans la dynamique interne des processus du diagnostic pour définir les interactions entre valeurs. Cela s’explique par le fait que ces interactions sont posées a priori d’après les caractéristiques des différentes valeurs envisagées et non pas dérivées d’une observation des situations. L’étude de l’implémentation effective de ces valeurs, et des conséquences de cette implémentation, est à un niveau d’analyse (niveau algorithmique selon la classification d’Anderson, 1990) inférieur à celui où nous nous situons (niveau rationnel toujours selon la classification d’Anderson). Autrement dit, l’investigation de ces mécanismes n’est pas directement pertinente dans le présent article même si des investigations ultérieures, visant à élucider les mécanismes implémentant les valeurs, devraient nécessairement en tenir compte. De ce fait, une limite inhérente au modèle présenté ici est donc qu’il ne permet pas d’accéder directement aux modalités et contraintes de la performance. Il vise seulement à dire vers quoi la performance doit tendre, ou plus précisément ici, quelles sont les dimensions de ce vers quoi la performance doit tendre (les valeurs de rationalité). L’intérêt d’un tel modèle est alors de permettre un diagnostic des dimensions sur lesquelles s’opèrent les écarts à la norme. C’est secondairement que prendra place une démarche de niveau algorithmique capable d’expliquer les processus par lesquels s’effectue l’optimisation sur chaque dimension (cependant, voir Raufaste, 2001 pour une investigation de ces processus). Par ailleurs, sous l’hypothèse que l’acquisition d’expertise tend à optimiser la performance, un tel modèle permet de spécifier vers quoi doivent tendre des modèles de niveau algorithmique psychologiquement plausibles. On pourra aussi questionner le choix de nous limiter aux erreurs non récupérées. De façon plus générale, il faut garder à l’esprit que les erreurs étudiées ici ne sont pas représentatives de la totalité des erreurs commises, au sens où tous les dossiers sélectionnés concernent des erreurs qui n’ont pas été récupérées. Or, il est clair qu’un certain nombre d’erreurs sont détectées et récupérées avant que leurs conséquences négatives ne surviennent. Etudier la récupération de l’erreur est une question clairement importante et une approche plus complète prendrait en compte simultanément les erreurs récupérées et non récupérées, ce qui permettrait de produire des informations sur les causes de non-récupération. Du point de vue du modèle proposé, une prise en compte des erreurs récupérées fournirait en soi des informations puisque l’on peut supposer que les mécanismes de récupération devraient eux-mêmes fonctionner de manière à minimiser les erreurs de rationalité. Il y a donc incontestablement une voie qui devra être explorée à l’avenir.
Enfin, l’étude de l’erreur n’est qu’un outil, outil qui sous-évalue le poids des nombreux cas où la prise en charge du patient est satisfaisante. Si l’on considère la fréquence relative de chaque type d’erreurs, on remarque que, dans notre échantillon, les erreurs de synchronisation et de coordination sont moins représentées que les autres. En médecine d’urgence, il semble pourtant raisonnable d’attribuer un rôle important à la valeur de synchronisation. Ce paradoxe apparent se résout si l’on remarque que l’importance d’une valeur de rationalité n’est pas directement reflétée par le nombre d’erreurs constatées. En effet, si une valeur est importante à optimiser, alors on peut raisonnablement supposer que divers mécanismes de récupération seront susceptibles d’intervenir pour réduire le nombre d’erreurs sur cette valeur. L’importance d’une valeur est donc traduite autant par la présence de mécanismes de récupération que par le nombre d’erreurs observables.
 
VI. CONCLUSION
 
 
Depuis quelques années, d’importants enjeux humains, juridiques, et financiers suscitent un regain d’intérêt pour l’étude de l’erreur humaine en médecine et l’investigation des processus cognitifs optimisant la performance en ce domaine. Par sa centration sur un niveau normatif non formalisé, la présente étude représente une approche nouvelle de la question. Par la définition d’un jeu de dimensions de l’optimisation, des compromis sous-jacents peuvent être explicités, en dehors même de toute considération sur les processus qui implémentent les valeurs de rationalité. À terme, cela devrait permettre d’anticiper des obstacles potentiels à une remédiation : toute tentative de remédiation relativement à une dimension particulière devrait aussi prendre en compte les effets collatéraux sur l’optimisation de la performance relativement aux autres dimensions. Pour ne prendre qu’un exemple, nous avons observé que les erreurs de richesse étaient les plus nombreuses. On pourrait donc être tenté de produire simplement des recommandations visant à améliorer la richesse. Mais nous avons rapporté ici un antagonisme entre les valeurs de richesse et pertinence. De ce fait, l’application d’une recommandation pourrait certes augmenter la richesse, mais au détriment de la pertinence. Ainsi l’optimisation est à envisager au sein d’un système de valeurs et il devient difficile d’adopter une démarche qui chercherait à réduire l’erreur de richesse sans considération des conséquences sur l’optimisation des autres valeurs.
 
ANNEXE
 
 
Les éléments d’information contenus dans les dossiers
Chaque dossier inclut différents types de fiches relatives :
(i) La fiche d’accueil et d’orientation : Fiche relative à l’orientation du patient, remplie par l’infirmière à l’accueil du service des urgences quand le patient arrive. L’infirmière note principalement : (i) le motif d’hospitalisation (ce qui va lui permettre de l’orienter dans les différents services ultérieurement) ; (ii) quelques caractéristiques sur le patient (si le patient a des problèmes de communication, son environnement et son milieu de vie, s’il a une couverture sociale...) ; (iii) différentes descriptions de son état (son comportement, son niveau de conscience, sa respiration (iv) son niveau de douleur (échelle analogique « EVA »).
IMGIMGIMGIMF
(ii) La fiche de transmission et d’observation : L’infirmière note les observations faites sur le patient (si le patient est algique, s’il a vomi, ce qu’il a vomi, les changements brutaux concernant son état ...).
IMGIMGIMGIMF
(iii) La fiche d’observation à l’entrée : Un examen approfondi est réalisé à l’entrée par l’infirmière et les informations sont notées dans cette fiche.
IMGIMGIMGIMF
(iv) La fiche de relevé des constantes : À chaque visite, l’infirmière relève la température, la tension et les battements cardiaques, et précise la date et l’horaire auxquels elle est passée.
IMGIMGIMGIMF
(v) La fiche de prescriptions médicales : Le médecin y note tout ce qui a été prescrit au patient durant la durée de son hospitalisation.
(vi) La fiche de suivi médical : Le médecin y note : (i) les caractéristiques du patient ; (ii) le motif d’hospitalisation (céphalées et vomissements) ; (iii) l’histoire de la maladie avec le début et circonstance de survenue (les douleurs ont commencé à 4 heures du matin, puis il a vomi vers 6 heures du matin, les douleurs ont persisté malgré la prise de médicaments...), les examens réalisés et leur résultat (neurologique, ostéo-articulatoire, cardio-vasculaire, respiratoire, digestif...) ; (iv) les traitements administrés avant l’entrée ; (v) les traitements en cours ; (vi) description à l’arrivée (signes paracliniques particuliers) ; (vii) les antécédents familiaux (rapport éventuel avec le diagnostic probable du patient), personnels chirurgicaux et médicaux ; (viii) le contexte pathologique connu ; (ix) les intoxications (alcoolisme, tabagisme, toxicomanie) ; (x) l’évolution dans le service ; (xi) le diagnostic (ici sont généralement notées les hypothèses diagnostiques).
IMGIMGIMGIMF
IMGIMGIMGIMF
(vii) La fiche de planification hebdomadaire : récapitule toutes les interventions qui ont été réalisées sur le patient : les examens radiologiques, les rendez-vous en consultations, les traitements administrés au patient, surveillance et les soins spécifiques.
IMGIMGIMGIMF
(viii) La fiche de sortie : le médecin y note toutes les informations pertinentes relevées par les médecins au cours de l’hospitalisation du patient, avec notamment, le motif d’entrée, les traitements administrés, les examens et les résultats des examens, l’évolution dans le service ainsi que les prescriptions.
(ix) Les résultats des examens effectués au cours de l’hospitalisation.
Éventuellement, la lettre du médecin traitant, voire les lettres de plaintes ou de réclamations des patients.
Manuscrit reçu : mars 2002,
Accepté par R. Amalberti après révision : janvier 2003.
 
BIBLIOGRAPHIE
 
·  Amalberti, R. (1996). La conduite des systèmes à risques. Paris : PUF.
·  Anderson, J. R. (1990). The Adaptive Character of Thought. Hillsdale, NJ : LEA.
·  Barthe, B., & Quéinnec, Y. (1999). Terminologie et perspectives d’analyse du travail collectif en ergonomie. L’Année Psychologique, 99, 663-686.
·  Caillot, M. (1984). La résolution de problèmes en physique : représentation et stratégies. Psychologie Française, 29, 257-262.
·  Cellier, J. M., de Keyser, V., & Valot, C. (1996). La gestion du temps dans les environnements dynamiques. Paris : PUF.
·  Chase, W. G., & Simon, H. A. (1973 a). Perception in Chess. Cognitive Psychology, 4, 55-81.
·  Chase, W. G., & Simon, H. A. (1973 b). The mind’s eye in chess. In W. G. Chase (Ed.), Visual Information Processing (pp. 215-281). New York : Academic Press.
·  Chi, M. T. H., Feltovich, P. J., & Glaser, R. (1981). Categorization and representation of physics problems by experts and novices. Cognitive Science, 5, 121-152.
·  De Keyser, V., & Nyssen, A. S. (1993). Les erreurs humaines en anesthésie. Le Travail Humain, 56, 243-266.
·  Frensch, P. A., & Sternberg, R. J. (1989). Expertise and intelligent thinking : When is it worse to know better ? In R. J. Sternberg (Ed.), Advances in the Psychology of Human Intelligence, vol. 5 (pp. 163-188). Hillsdale, NJ : LEA.
·  Glaser, R. (1985). The Nature of Expertise. (Occasional paper no 107.) Colombus : National Center for Research in Vocational Education.
·  Hoc, J.-M. (1996). Supervision et contrôle de processus : la cognition en situation dynamique. Grenoble : Presses Universitaires de Grenoble.
·  Hoc, J.-M., Amalberti, R. (1994). Diagnostic et prise de décision dans les situations dynamiques. Psychologie Française, 39, 177-192.
·  Hoc, J.-M., Morineau, T., & Denecker, P. (2000). Gestion de l’espace problème et organisation temporelle de l’activité de contrôleurs aériens professionnels sur simulateur. (Rapport de recherche). Athis-Mons, F : CENA, Projet AMANDA.
·  Hollnagel, E. (1993). The phenotype of erroneous actions. Journal Man-Machine Studies, 39, 1-32.
·  Klahr, D., & Dunbar, K. (1988). Dual space search during scientific reasoning. Cognitive Science, 12, 1-48.
·  Leplat, J. (1985). Erreur humaine, fiabilité humaine dans le travail. Paris : Colin.
·  Lesgold, A. M., Rubinson, H., Feltovich P., Glaser, R., Klopfer, D., & Wang, Y. (1988). Expertise in a complex skill : Diagnosing X-Ray Pictures. In M. T. H. Chi, R. Glaser, & M. J. Farr (Eds.), The Nature of Expertise (pp. 311-341). Hillsdale, NJ : LEA.
·  Navarro, C. (1991) Une analyse cognitive de l’interaction dans les activités de travail. Le Travail Humain, 54, 113-128.
·  Norman, D. A. (1981). Categorization of action slips. Psychological Review, 88, 1-15.
·  Olsen, S. E., & Rasmussen, J. (1989). The reflective expert and the prenovice : notes on skill-, rule- and knowledge-base performance in the setting of instruction and training. In L. Bainbridge & S. A. Ruiz-Quintanilla (Eds.), Developing skills with information technology (pp. 9-33). Chichester : Wiley.
·  Patel, V. L., Groen, G. J., & Arocha, J. F. (1990). Medical expertise as a function of task difficulty. Memory & Cognition, 18, 394-406.
·  Raufaste, É. (2001). Les mécanismes cognitifs du diagnostic médical. Paris : PUF.
·  Raufaste, É., Eyrolle, H., & Mariné, C. (1998). Pertinence generation in radiological diagnosis : Spreading activation and the nature of expertise. Cognitive Science, 22, 517-546.
·  Rasmussen, J. (1986). Information Processing and Human-machine Interaction. Amsterdam : North-Holland.
·  Reason, J. (1993). L’erreur humaine. Paris : PUF.
·  Robbins, T. W., Anderson, E. J., Barker, D. R., Bradley, A. C., Fearnyhough, C., Henson, R., & Hudson, S. R. (1996). Working memory in chess. Memory & Cognition, 24, 83-93.
·  Rogalski, J. (1994). Formation aux activités collectives. Le Travail Humain, 57, 367-386.
·  Sébillotte, S. (1984). La résolution de problème en situation de diagnostic : Un exemple : le diagnostic médical. Psychologie Française, 29, 273-277.
·  Shanteau, J. (1992). How much information does an expert use ? Is it relevant ? Acta Psychologica, 81, 75-86.
·  Simon, H. A. (1955). A behavioral model of rational choice. Quarterly Journal of Economics, 69, 99-118.
·  Simon, H. A., & Lea, G. (1974). Problem solving and rule induction. In L. Gregg (Ed.), Knowledge and Cognition (pp. 105-128). Hillsdale, NJ : Lawrence Erlbaum Associates.
·  Woods, D. D. (1988). Coping with complexity : the psychology of human behavior in complex systems. In L. P. Goodstein, H. B. Andersen, S. E. Olsen (Eds.), Tasks, Errors and Mental Models (pp. 128-148). London : Taylor and Francis.
·  Zeitz, C. M. (1994). Expert-Novice differences in memory, abstraction, and reasoning in the domain of literature. Cognition and Instruction, 12, 277-312.
 
NOTES
 
[1] Par exemple, dans de nombreux modèles (Anderson, 1983), on crée de nouvelles connaissances lorsque la réalité ne se laisse pas prédire par les connaissances existantes.
[2] Ce terme ne doit pas être confondu avec l’emploi qu’en fait Rasmussen (1986). Dans notre esprit, des automatismes peuvent présider à la sélection de règles, conformément aux architectures cognitives modernes.
[3] La description des mécanismes mentionnés est complexe et sort du champ de cet article. Le lecteur intéressé en trouvera une description détaillée dans Raufaste (2001).
[4] Rappelons que ces résultats ne tiennent pas compte des erreurs de synchronisation et de coordination.
[5] Nous remercions Claude Valot pour avoir soulevé cette question importante.
© Cairn.info 2009 Vie privée | Conditions d’utilisation | Conditions générales de vente
Cairn.info | Éditeurs | Bibliothèques | Aide à la navigation | Plan du site | Raccourcis
[1]
Par exemple, dans de nombreux modèles (Anderson, 1983), on...
[suite] Suite de la note...
[2]
Ce terme ne doit pas être confondu avec l’emploi qu’en fai...
[suite] Suite de la note...
[3]
La description des mécanismes mentionnés est complexe et s...
[suite] Suite de la note...
[4]
Rappelons que ces résultats ne tiennent pas compte des err...
[suite] Suite de la note...
[5]
Nous remercions Claude Valot pour avoir soulevé cette ques...
[suite] Suite de la note...