Archives de Philosophie
Centre Sèvres

I.S.B.N.sans
240 pages

p. 335 à 355
doi: en cours

Veille sur la revue
Veille sur l'auteur
Vous consultez

Tome 65 2002/2

2002 Archives de Philosophie

Calculer, percevoir et classer

Jacques Dubucs IHPST (CNRS/Paris I)
Essentiellement consacré à la signification et à l’interprétation des phénomènes de perception « catégorielle », l’article vise à introduire le public philosophique aux problèmes et aux méthodes des sciences cognitives contemporaines. Un exemple simple établit l’inadéquation de la méthodologie behavioriste et la nécessité de distinguer entre « observable » et « objectivable ». L’hypothèse de la modularité des systèmes périphériques est illustrée par le cas de la perception des sons parlés, et la signification de cette hypothèse relativement à la question de la dépendance des percepts par rapport aux croyances est discutée.Mots-clés : Cognitives (sciences), Catégorielle (perception), Modularité. Mainly devoted to the interpretation of the ‘‘ categorical’’perception phenomena, the paper intends to provide a philosophical introduction to the problems and methods of contemporary cognitive science. A simple example establishes the inadequacy of the behavioristic methodology as well as the necessity of distinguishing between ‘‘ observable ’’and ‘‘ objectivable ’’. The hypothesis of the modularity of peripheric systems is illustrated by the case of the perception of speech, and the significance of this hypothesis with respect to the question of the influence of beliefs on perception is discussed.Keywords : Cognitive (science), Categorical (perception), Modularity.
Les sciences cognitives poursuivent un objectif fort ancien, qui consiste, sommairement dit, à décrire et à expliquer les comportements intelligents. Elles appliquent à cet effet des principes méthodologiques moins traditionnels, dont l’adoption définit ce qu’il est convenu d’appeler le « tournant cognitif ». Je me propose ici d’exposer brièvement ces principes, de les illustrer par des exemples appropriés et d’en discuter la signification philosophique. Pour l’essentiel, j’ai mis en avant un domaine qui me semble particulièrement pertinent pour les philosophes : l’analyse de la catégorisation, c’est-à-dire du processus par lequel un ensemble d’entités (stimuli sonores ou visuels, objets concrets ou abstraits) en vient à être classifié en catégories séparées, qui peuvent être de type perceptif (phonèmes, couleurs) ou conceptuel (espèces naturelles, types d’événements, catégories esthétiques et morales).
1. L’étude objective de la « boîte noire ». On chercherait vainement à définir les sciences cognitives en énumérant les disciplines académiques concernées par la description, l’explication ou la simulation du comportement intelligent (psychologie, linguistique, neurosciences, logique, théorie de la décision, informatique, intelligence artificielle, robotique, anthropologie, épistémologie, philosophie de l’esprit, etc.). D’une part, une telle liste peut toujours omettre une discipline potentiellement concernée par cette étude, mais dont la contribution explicite serait restée jusqu’à présent discrète. D’autre part, les recherches menées dans les disciplines que l’on évoque le plus spontanément ne relèvent pas toutes, loin s’en faut, du domaine des sciences cognitives, soit qu’elles n’aient pas de rapport direct à la théorisation du comportement intelligent (philologie historique, neuro-anatomie descriptive), soit qu’elles ne satisfassent pas aux exigences de testabilité ou de rigueur sur lequel l’accord a fini par se faire en ce domaine (psychanalyse, philosophie « littéraire »). Aussi est-il probablement préférable de caractériser les sciences cognitives par les traditions intellectuelles contre lesquelles elles se sont définies, c’est-à-dire au premier chef l’introspectionnisme et le behaviorisme.
En qualifiant d’intelligent le comportement d’un agent, on veut dire que ce comportement est, d’une certaine manière, approprié, mais aussi qu’il ne résulte pas d’une pure et simple réaction d’ajustement dont on pourrait fournir une explication mécanique ou physiologique immédiate. A cet égard, les réflexes de constriction ou de dilatation pupillaires sous l’effet des variations de l’intensité lumineuse ne sont pas des comportements « intelligents » : on réservera cette dénomination aux comportements qu’un individu adopte en vertu du fait qu’il possède une représentation de son environnement et des objectifs qu’il poursuit. Dans des cas de ce genre, la corrélation entre les stimuli sensoriels qui affectent les individus et les réponses, motrices ou verbales, qu’ils dirigent en retour vers leur environnement, est une corrélation qui ne possède aucune explication physique ou physiologique accessible, bien qu’elle s’effectue évidemment sans enfreindre aucune loi de physique ou de physiologie. On songera, par exemple, à l’impossibilité manifeste, pour qui aurait connu la description précise des traces encrées contenues dans la lettre qui m’avait été adressée par les Archives de Philosophie, ainsi que la situation neuro-physiologique détaillée de mon cerveau à l’instant de la réception de cette lettre, de prédire les mouvements digitaux que je suis en train d’effectuer au-dessus du clavier de mon ordinateur, et cela en suivant les seuls liens de la causalité physique et physiologique, c’est-à-dire sans du tout invoquer la signification des signes écrits ou lus, ni les représentations mentales ou les opérations intellectuelles mobilisées par la rédaction de ce texte.
Selon la psychologie introspective traditionnelle, l’explication d’un tel processus ne devrait en tout cas pas constituer une énigme pour le sujet lui-même. Cette psychologie suppose en effet que la clef du comportement intelligent est donnée par l’existence de processus mentaux auxquels chaque individu possède un accès privilégié, et donc que la vie mentale est transparente pour le regard introspectif. Mais la « méthode » de l’introspection est incapable de fonder une psychologie scientifique, car elle ne révèle aucune donnée accessible à tous les observateurs, et elle encourage des entreprises « empathiques » vouées à l’échec et à la confusion (on cherche à expliquer le comportement d’autrui en tâchant d’imaginer ce que l’on pourrait soi-même apercevoir à l’aide du « regard intérieur » si l’on était dans la situation où il se trouve, ce que l’on ressentirait si l’on était soumis aux mêmes stimuli, et ce qui présiderait pour soi-même à la production des mêmes gestes et des mêmes paroles).
Aussi la tradition introspectiviste a-t-elle été l’objet de critiques insistantes, lesquelles culminent avec la psychologie behavioriste qui a dominé la scène au milieu du XXe siècle. Cette psychologie se propose de limiter ses investigations aux données publiquement objectivables (les stimulations sensorielles et les réponses comportementales qui leur sont associées), d’adopter les méthodes expérimentales en usage dans les sciences de la nature, et donc d’écarter toute référence aux états intérieurs appréhendés par le seul sujet. Le behaviorisme considère la totalité de ces états comme une « boîte noire » inscrutable dont le contenu n’a pas à figurer dans une explication psychologique digne de ce nom. Le gain en objectivité ainsi obtenu est toutefois cher payé : des vastes questions abordées par la psycho-logie traditionnelle (la nature de la mémoire, de l’imagination, de la perception, de l’activité de langage, etc.), aucune ne se laisse véritablement traiter en termes de chaînes associatives entre stimuli et réponses. Le discrédit croissant, et aujourd’hui définitif, qui a affecté le behaviorisme à partir des années 1950 n’a pas d’autre origine : capable d’expliquer les aspects les plus simples de l’apprentissage animal, la méthodologie behavioriste n’était en mesure d’éclairer aucun des traits décisifs du comportement humain intelligent.
Une explication psychologique satisfaisante ne saurait se dispenser de considérer l’architecture interne de la « boîte noire ». Le problème crucial est seulement d’en rendre compte de manière objectivable, sans s’en remettre aux prétendues données de l’introspection. Un agent, par exemple, se montre capable d’effectuer la tâche suivante : ouvrir un récipient opaque, y insérer un objet, refermer le récipient, et le sceller. Voilà un comportement qui ne saurait en tout cas s’expliquer en termes behavioristes, comme disposition constante, habituelle ou « renforcée », à répondre de telle et telle manière à un stimulus donné : une fois l’objet mis dans la boîte et la boîte refermée, l’environnement perçu est identique à l’environnement initial, alors que l’action effectuée (sceller) n’est plus l’action initiale (ouvrir) [1]. Puisque les réponses diffèrent pour des stimuli qui ne varient pas, c’est qu’elles ne sont pas sous la seule dépendance de l’environnement, mais sont également déterminées par la valeur de certaines variables « internes ». Ces valeurs, les « états internes », contribuent, au même titre que les entrées sensorielles et, si l’on ose dire, en coopération avec elles, à causer les sorties comportementales. Et c’est même cette contribution causale qui les définit, comme on dit, fonctionnellement. Notre agent possède un certain mécanisme capable d’être dans (au moins) deux états distincts, disons E et F. Si l’agent voit que la boîte est fermée, et si le mécanisme est dans l’état E, alors il ouvre la boîte. Mais il la scelle si le mécanisme est dans l’état F à l’instant où il la perçoit fermée. D’une certaine manière, on peut en rester là. Les états E et F sont objectivables, puisqu’il est démontré que, s’ils n’étaient pas distincts, l’agent ne pourrait faire ce que manifestement il fait. L’objectivité d’un état interne ne serait en cause que si l’on pouvait le supprimer sans dommage de l’explication, c’est-à-dire s’il n’avait aucun rôle causal distinctif, autrement dit encore si l’ensemble des réponses manifestes à tous les stimuli possibles était le même, que l’agent soit ou ne soit pas dans l’état considéré. Les états E et F, qui ne sont pas dans ce cas, sont donc objectivables, bien qu’ils ne soient pas observables au sens strict. Dans ces conditions, on pourra proposer du comportement une explication « fonctionnelle » qui spécifiera, en termes de ces états internes dont la nature physique ou physiologique exacte est laissée provisoirement indéterminée, un ensemble de règles analogues aux instructions d’un programme informatique. Dans l’exemple rudimentaire qui nous occupe interviendra par exemple la règle de bifurcation suivante :
(*) Si l’on perçoit que la boîte est fermée, alors 1) si l’on est dans l’état E, l’ouvrir et passer à l’état F, et 2) si l’on est dans l’état F, la sceller [2].
Un exemple de ce genre illustre assez bien l’une des caractéristiques essentielles de la psychologie cognitive contemporaine. Au lieu de répondre directement à la question de savoir comment notre cerveau s’y prend, dans les faits, pour accomplir une tâche intelligente comme le jeu d’échecs, la reconnaissance des visages ou la planification du mouvement, on examine comment un système quelconque (éventuellement doté de certaines propriétés caractéristiques plus ou moins semblables à celles du cerveau humain) pourrait s’y prendre pour effectuer la même tâche. D’une certaine manière, la méthode a été appliquée pour la première fois par Chomsky en linguistique dans les années 1950, lorsqu’il s’est proposé de déterminer l’état interne (« initial ») qui doit nécessairement être attribué à tout système capable de produire ou de comprendre un nombre indéfini de phrases d’une langue L donnée (sortie), connaissant la dimension du corpus de phrases correctes de L auquel ce système a été effectivement exposé (entrée). A cet égard, le cas du langage est, lui aussi, assez représentatif d’une règle générale selon laquelle, à complexité de comportement donnée, la richesse des mécanismes internes que l’on doit invoquer dans l’explication varie en raison inverse de la richesse du stimulus : l’architecture interne du système étudié doit être supposée suffisamment riche pour produire le comportement observé en suppléant lorsqu’il le faut aux données fragmentaires en provenance de l’environnement. Pour qu’une telle démarche puisse mettre à jour des structures internes « objectives », il importe de déterminer d’abord de manière rigoureuse la tâche effectuée par l’agent (la nature des ‘entrées’et des ‘sorties’) et les contraintes auxquelles doit satisfaire son accomplissement (pour l’essentiel, le temps qui lui est alloué) : le « problème » de la vision, pour donner encore un autre exemple, consiste à obtenir « en temps réel » une représentation tri-dimensionnelle du monde à partir de l’ensemble des stimulations rétiniennes. Ayant ainsi défini, pour ainsi dire, la « fonction » calculée par le système, on cherche alors à spécifier un algorithme de calcul de cette fonction dont on ait des raisons substantielles de penser (par exemple parce que la machine informatique sur laquelle il a été implémenté donne les mêmes résultats en des temps comparables) qu’il coïncide avec celui qui est employé par le système étudié. Ce niveau « fonctionnel » d’explication est indépendant du troisième, « physique », auquel il incombe pour finir de déterminer comment les procédures algorithmiques qui ont été mises en évidence sont « réalisées » dans la structure physique ou neurophysiologique de l’agent étudié (à ce dernier niveau, les états et processus internes ne sont plus seulement « objectivables », mais, si l’on veut, « observables », c’est-à-dire désignés intrinsèquement et non plus par leur rôle fonctionnel [3] ).
L’explication « algorithmique » d’un comportement intelligent, dont on ne trouverait aucune contrepartie dans la psychologie behavioriste, doit donc mettre à jour un ensemble d’états internes qui doivent être spécifiés fonctionnellement, c’est-à-dire sans faire aucune référence à la nature matérielle du système étudié. Une explication de ce genre doit être effective, c’est-à-dire (idéalement) pouvoir être rédigée sous la forme d’un programme informatique qui ait les mêmes « sorties », pour des « entrées » analogues, que le processus mental étudié [4]. Cette exigence d’élémentarité et de testabilité vise à écarter les « explications » qui recourraient à des capacités complexes inanalysées (la « sociabilité », la « capacité à appréhender les formes prégnantes », etc.) ou à des notions dont la compréhension réclamerait des dons herméneutiques étendus. Ainsi, une théorie psychologique qui expliquerait certains phénomènes en attribuant à l’esprit un « mouvement centrifuge » ou des « tendances appétitives bouillonnantes » [5] serait-elle sommée d’indiquer la manière dont ce « mouvement » ou ces « tendances » pourraient être construites sur la base des seuls processus élémentaires à l’Å“uvre dans les automates logiques...
2. L’analyse de la perception. Dans l’usage courant, les verbes de perception sont ambigus, et peuvent être employés de deux façons distinctes au moins. Dire qu’un individu a vu une maison signifie tantôt qu’il a eu la représentation visuelle d’une maison (il a perçu une chose comme maison), tantôt qu’une maison était la cause environnementale des excitations sensorielles qui lui parvenaient à l’instant où il regardait [6]. La perception au premier sens, suppose évidemment de la part de l’agent la possession de la catégorie ou du type (maison) auquel est rapporté ce qui est vu. La perception au second sens, qui est l’expérience purement sensorielle des qualités phénoménales de la scène ou de l’objet perçus, ne suppose, quant à elle, rien de tel. En pratique, les deux variétés d’expérience, disons la perception « neutre » et la perception « conceptualisée », sont le plus souvent corrélées : bien des catégories au travers desquelles nous appréhendons les stimulations en provenance de l’environnement (serpent, arme, visage ami) embrayent, si l’on ose dire, sur des schémas d’action déterminés (évitement, fuite, approche), en sorte, par exemple, qu’une espèce animale dont les membres seraient incapables, dans les conditions « normales », de percevoir comme tels les objets tombant sous des catégories de ce genre aurait tôt fait de disparaître. Il n’en demeure pas moins que les deux expériences sont logiquement indépendantes. D’une part, je peux évidemment percevoir un objet d’un certain type sans percevoir cet objet comme cas particulier du type en question, notamment si je ne possède pas le concept de ce type. D’autre part je puis être placé, par exemple, dans de mauvaises conditions d’éclairage, et voir comme objet d’un certain type quelque chose qui stimule ma rétine, mais qui s’avèrera être un objet d’un autre type.
2.1. Les inférences perceptives. La perception comme X possède toutes les caractéristiques d’un jugement (ce que je vois est un X ) reposant sur l’interprétation des données ou des indices contenus dans l’expérience sensorielle de l’objet. Aussi est-il tentant, compte-tenu de la distinction de rigueur entre d’une part la réceptivité sensorielle, faculté essentiellement passive dont la fonction est d’accueillir et d’enregistrer les signaux en provenance de l’environnement, et d’autre part l’intelligence, faculté active auxquelles les données sensorielles fournissent un matériau brut, de considérer que nous devons sur ce point résister aux suggestions de la langue naturelle, en admettant que des expressions comme je vois une maison (entendue au premier des deux sens que nous avons distingués plus haut) et, a fortiori, je vois que la maison est entre la fontaine et la statue sont de simples abus de langage, dont la contrepartie rigoureuse serait respectivement je juge que ce que je vois [au sens « neutre »] est une maison et je juge, d’après ce que je vois [toujours au sens « neutre »] que la maison est entre la fontaine et la statue. Telle est la conception « classique », dont on trouverait sans doute chez Descartes l’expression la plus nette [7] : la taille, la forme, la distance et l’identité des objets ne sont pas des qualités perçues, mais des propriétés que nous attribuons aux objets sur la base de notre expérience sensorielle, et ce en vertu d’un acte intellectuel de jugement qui repose sur des règles explicites faisant appel à la comparaison, à la mémoire et au raisonnement.
Qu’un processus d’interprétation et, d’une certaine manière, de raisonnement, s’interpose entre la réception de l’impact des objets sur les récepteurs sensoriels et le moment où les objets sont perçus comme tels et tels, c’est un point sur lequel la psychologie cognitive contemporaine se trouve en parfait accord avec cette conception cartésienne. L’argument commun, et à vrai dire décisif, est ici que la perception de l’objet comme X peut certainement être erronée, alors qu’il n’y a aucune place pour l’erreur (ni d’ailleurs pour la vérité) dans la simple expérience des impressions sensibles, laquelle est le pur résultat de l’action causale des objets sur notre appareil sensoriel : ce résultat est ce qu’il est, et l’erreur ne saurait se situer que dans les jugements prononcés sur la base de cette expérience, et notamment dans les jugements relatifs à la nature, à la position réciproque et à la taille des objets qui en sont la source. La perspective cognitiviste, qui s’accorde avec la tradition cartésienne pour voir la source des illusions perceptives dans une erreur de raisonnement et de jugement relative à l’interprétation des données sensorielles brutes, s’en sépare en revanche en postulant que les raisonnements et jugements en question interviennent beaucoup plus tôt que ne le concevait Descartes, et plus précisément qu’ils interviennent « en amont » de la pensée consciente proprement dite, au cours du processus perceptif lui-même.
Bien que les raisonnements de « géométrie naturelle » qui conduisent, par exemple, à juger de la distance relative des objets à partir de la comparaison des impressions rétiniennes reçues par les deux yeux soient tout à fait semblables à ceux que tiennent les arpenteurs pour mesurer les lieux inaccessibles à partir de deux points d’observation distincts [8], ces raisonnements et les jugements auxquels ils conduisent s’en distinguent néanmoins par leur automaticité et par leur caractère à la fois involontaire et incorrigible. Comme l’écrivait déjà Malebranche, une caractéristique essentielle de « ces jugements naturels de la vue » est qu’« ils se font en nous, sans nous, et même malgré nous » [9]. C’est en effet de la chose jugée, et non du jugement lui-même ou, a fortiori, de ses attendus, que nous avons conscience. Dès que nous ouvrons les yeux, nous voyons des objets indépendants de nous (arbres, automobiles, maisons) dans des relations déterminées de position et de mouvement, alors que ces percepts conscients sont des produits dérivés, et que ce qui nous est véritablement donné n’est pas cela, mais un input égocentré et parcellaire consistant en lignes, en sommets, en angles ombrés, en gradients de textures ou en vitesses angulaires dans le champ visuel. La perception comme tel et tel, qui s’apparente aux activités intelligentes « supérieures » par le caractère indirect, inférentiel et faillible des verdicts qu’elle délivre, est donc néanmoins une perception, et même la forme pour ainsi dire obligée de l’expérience perceptive consciente elle-même : nous ne pouvons nous contenter de purement et simplement éprouver l’impact du monde sur notre appareil sensoriel, ni prendre conscience de nos sensations visuelles et auditives sans les rapporter aux objets dont elles signalent, fut-ce illusoirement, la présence (on réservera, comme atypique et difficile, pour le moins, à analyser, le cas des tentatives systématiques pour régresser en amont du processus de structuration des données sensorielles, qu’il s’agisse, par exemple, du projet impressionniste visant en quelque sorte à saisir le champ visuel lui-même en écartant tout ce qui excède la sensation optique, ou de la démarche du phonéticien pour entendre les phrases de sa langue comme purs objets acoustiques [10] ).
Reste à expliquer comment la perception consciente peut nous apparaître comme une expérience aussi directe et immédiate, alors qu’elle repose sur l’effectuation d’opérations complexes (formulation et évaluation d’hypothèses, inférences et résolution de problèmes) tout à fait similaires à celles que nous effectuons de façon si laborieuse et si lente lorsque nous calculons et raisonnons consciemment. C’est précisément le problème que la tradition pré-cognitiviste a échoué à résoudre autrement qu’en invoquant une sorte de miracle dans « l’Institution de la Nature ». Puisqu’il est nécessaire d’attribuer la structuration des données perceptives à quelque entité qui aurait les pouvoirs organisateurs de l’esprit, mais qu’il est, en même temps, manifestement impossible de supposer que c’est le nôtre qui effectue cette tâche – il est beaucoup trop lent pour cela, et, en tout état de cause, ses opérations sont conscientes, alors que la tâche en question ne l’est pas –, on s’est résigné à conclure que cette structuration s’effectuait par la grâce du concours divin : à en croire Malebranche, « nous voyons toute chose en Dieu », car lui seul, parce qu’il est capable de raisonner, si l’on peut dire, instantanément, peut nous donner avec l’apparence de l’immédiateté ces conclusions perceptives auxquelles nous ne pourrions nous-mêmes jamais parvenir aussi rapidement [11].
L’explication que retient la psychologie cognitive contemporaine, évidemment fort différente, tient à l’hypothèse d’une organisation modulaire des systèmes perceptuels : les opérations de calcul qui interviennent entre la réception des impressions sensorielles et la perception consciente elle-même sont bien notre fait, mais les mécanismes spécifiques qui, en nous, les effectuent sont « encapsulés », c’est-à-dire à la fois automatiques et insensibles aux informations possédées par l’intelligence centrale. De même que les calculs opérés par un ordinateur s’exécutent sans être aucunement influencés par l’interprétation sémantique pouvant être attribuée aux variables qui figurent dans le programme, les processus de traitement et de transformation des représentations visuelles ou auditives ne peuvent être affectés par aucune information extérieure relative aux événements physiques exogènes auxquels se réfèrent ces représentations. Ce cloisonnement informationnel est clairement attesté par un phénomène comme la persistance des illusions visuelles : même en possession de l’information selon laquelle les segments de droite de la figure 1a sont de longueur identique, ou selon laquelle ils sont parallèles dans la figure 1b, nous continuons irrépressiblement à les percevoir respectivement comme de longueur ou de direction différentes, parce que les processus inférentiels spécifiques utilisés par le système visuel pour déterminer la longueur ou le parallélisme des objets perçus en fonction des indices de perspective (convergence ou divergence) présents dans l’image rétinienne sont computationnellement autonomes, et que leur déroulement ne peut être modifié par les informations à la disposition du système central [12].
Figure 1a
Illusion de Müller-Lyer
Agrandir l'image Illusion de Müller-Lyer
Figure 1b
Illusion de Zöllner
Agrandir l'image  Illusion de Zöllner
Ces illusions ne proviennent pas d’un fonctionnement défectueux de notre appareil visuel lui-même – à ce titre il ne convient pas du tout de les qualifier d’illusions « sensorielles » –, mais résultent plutôt de la manière dont les données sensorielles sont traitées par les mécanismes inconscients de calcul et d’inférence qui « construisent » la perception consciente sur la base de ces données. Les « jugements » de la perception consciente ne peuvent être corrigés ou influencés par ce que nous pouvons savoir par ailleurs des objets qui sont la cause distale des sensations, et nous devons simplement considérer cette incorrigibilité comme la rançon naturelle de la célérité avec laquelle les mécanismes computationnels en jeu délivrent leurs verdicts : compte tenu de la rapidité avec laquelle nous devons généralement prendre les décisions qui dépendent de ce que le système perceptif nous dit du monde, il est hors de question que ces mécanismes « périphériques » puissent consulter la totalité des informations pertinentes que l’intelligence centrale détient éventuellement à son sujet.
Cette autonomie computationnelle rend compte de la récalcitrance de la perception à la modification par les connaissances d’arrière-plan, mais elle n’est encore que la moitié de l’explication. Les systèmes périphériques, qui ressemblent à certains égards à l’intelligence consciente par les opérations qu’ils effectuent (inférences, jugements) et les capacités qu’ils sollicitent (mémoire « à court terme », anticipation et planification), s’en distinguent en revanche toto caelo par la manière dont ils appliquent les règles qui définissent ces opérations.
D’un côté, un comportement peut se conformer à une règle parce que celle-ci est explicitement représentée, et que l’agent la consulte pour déterminer les actions qu’il s’apprête à entreprendre. C’est le cas, si l’on veut, pour les règles du rugby, de la conduite automobile, de l’arithmétique ou de la versification : lors même que, souvent, nous nous y conformons sans nous y référer consciemment, en vertu de la grande habitude que nous avons peut-être de pratiquer les activités qu’elles régissent, nous restons capables d’expliquer pourquoi nous les suivons, de dire à quelle occasion nous les avons rencontrées pour la première fois ou comment nous les avons apprises, et, le cas échéant, de les critiquer et de les remplacer par d’autres. En somme, les règles de ce premier type, disons les règles explicites, sont conscientes (ou peuvent le devenir sans trop d’effort), peuvent ne pas être appliquées, peuvent être modifiées, et doivent être apprises. D’un autre côté, certaines règles, dites tacites, sont d’un type très différent : leur application est inconsciente, obligatoire et rigide, et elles ne font pas l’objet d’un apprentissage (elles sont, si l’on veut, « câblées » en nous, et font partie de notre équipement natif). Les opérations qui se conforment à de telles règles ne sont pas explicitement « guidées » par elles, mais purement et simplement exécutées conformément à elles par le substrat physique ou anatomique qu’elles concernent, et ce d’une manière qui ne requiert en lui aucune représentation interne (bien que l’on puisse aisément énoncer la règle selon laquelle il fonctionne, le tachymètre digital, par exemple, qui affiche tel ou tel nombre en fonction de la vitesse du véhicule, ne peut pas être dit « obéir » à une instruction expresse). Des règles de ce genre peuvent être attribuées à autre chose qu’à des personnes, et notamment elles peuvent être imputées à des parties ou des sous-systèmes, isolés par analyse, d’êtres intelligents. Bien qu’elles puissent être modifiées ou rendues inopérantes par des lésions ou des altérations de l’organisme considéré (l’absorption de drogues étant à cet égard un exemple typique), elles sont en tout cas, selon l’expression consacrée, « cognitivement impénétrables », c’est-à-dire à la fois inscrutables par l’introspection directe et insensibles à tout changement dans les croyances du sujet. Il n’est guère difficile de comprendre pourquoi les règles qui « équipent » les mécanismes de la perception [13] doivent être, pour l’essentiel, de ce type. Si les règles qui régissent les systèmes perceptuels étaient non pas « encapsulées », mais au contraire re-programmables à l’envie, si le contact de l’organisme avec l’environnement était lui-même sous l’emprise et le contrôle de l’intelligence centrale, en bref si tout était « cognitif », l’organisme n’aurait avec le monde aucune interaction causale stable, l’agent serait un despote dont le seul contact avec l’environnement se ferait par l’intermédiaire d’auxiliaires dociles à ses vues, qui lui diraient obséquieusement les choses qu’il désire entendre, en sorte qu’il vivrait à tous égards confiné dans le monde de ses souhaits. L’absurdité – et, en tout cas, l’absence de viabilité – de cette situation est le plus sûr argument en faveur de la modularité des systèmes périphériques : dire que l’Å“il (ou l’oreille) sont en eux-mêmes « intelligents » constitue, jusqu’à un certain point, une image acceptable de la situation réelle, mais cette image ne devrait en aucun cas nous entraîner à supposer, comme il est communément fait aujourd’hui [14], que l’on voit (ou que l’on entend) très exactement ce que l’on croit. Bien que cette mise en garde soit probablement essentielle pour une compréhension correcte des processus cognitifs (au sens large), nous allons voir qu’il peut être néanmoins difficile de savoir comment s’y conformer en pratique, dès que l’on en vient au détail des phénomènes.
2.2. La perception catégorielle. Les systèmes « périphériques » (visuel, auditif...), on l’a vu, peuvent être conçus comme des « modules » de résolution de problèmes, dont la fonction essentielle consiste, à partir des stimulations reçues par les organes sensoriels, à « calculer » une représentation cohérente de la source distale de ces stimulations. On pourrait, de cela, retirer l’impression que les processus computationnels qui assurent le passage de la sensation à la perception consciente comme tel et tel ont pour tâche principale de suppléer intelligemment à la pauvreté informationnelle du stimulus proximal (dans le cas paradigmatique de la vision, des procédures de calcul interviennent, par exemple, pour reconstituer l’orientation des surfaces visibles à partir de quelques indices comme la texture lumineuse ou la nature des contours [15] ). Mais ce n’est évidemment pas le cas, puisqu’il serait absurde que l’information relative au stimulus distal puisse être en quoi que ce soit enrichie au cours de processus qui se déroulent après qu’aient été enregistrées les impressions sensorielles causées par lui, c’est-à-dire à un moment où tout contact « réel » avec l’objet a, éventuellement, cessé. Bien au contraire, le passage au percept conscient doit être conçu comme un appauvrissement de la masse des informations contenue dans les impressions sensorielles : l’important, après tout, est plutôt de décroître la quantité d’informations qu’il s’agira de percevoir consciemment, d’apprendre et de mémoriser, et sur la base de laquelle il faudra ensuite raisonner et décider. Cette diminution peut être aussi massive que l’on voudra, dans la limite toutefois où elle reste compatible avec la manière dont l’agent catégorise son environnement. Soient par exemple O et O’deux objets, S(O) et S(O’) les impressions respectivement produites par ces deux objets dans l’appareil sensoriel d’un sujet donné, et P(O) et P(O’) les deux percepts conscients auxquels ces impressions aboutissent après avoir été « traitées » par les mécanismes périphériques pertinents. La situation dans laquelle ces mécanismes « appauvriraient » l’information contenue dans les deux stimuli (supposés distincts) S(O) et S(O’) au point que les percepts résultants P(O) et P(O’) en viendraient à être identiques, cette situation est à tous égards naturelle et même souhaitable, à la condition toutefois que O et O’n’appartiennent pas à deux catégories elles-mêmes distinctes dans le contexte des actions où l’agent est habituellement engagé. Le comportement intelligent réagit identiquement à des situations distinctes, pour autant que les différences qui séparent ces situations ne soient pas cruciales pour l’objectif qu’il vise. Sa détermination ne requiert donc pas tout le stimulus, mais seulement l’appartenance catégorielle du stimulus. Or traiter comme identiques des choses différentes revient à négliger l’information relative à ce qui les distingue, et il est à cet égard plus approprié de ne jamais acquérir cette information superfétatoire (« intra-catégorielle ») que de l’enregistrer pour l’écarter ensuite par une décision expresse. Pour autant, par exemple, que notre comportement d’évitement et de survie – l’un de ceux, donc, qui demandent à être engagés avec le plus de célérité – soit concerné, un essaim de 164 abeilles est, si l’on ose dire, convenablement similaire à un essaim qui n’en compte que 163, en sorte qu’une ergonomie optimale voudrait que nous les percevions simplement comme une assemblée de nombreuses abeilles, donc à fuir, plutôt que de les percevoir selon leur quantité exacte et d’« appliquer » ensuite la règle pertinente parmi une infinité de règles mémorisées (..., « essaim de 163 abeilles : à éviter », « essaim de 164 abeilles : à éviter », ...) [16]. On doit donc s’attendre à ce que les systèmes périphériques procèdent d’eux-mêmes aux appauvrissements appropriés dans la richesse informationnelle du stimulus. Ce qui est étonnant n’est pas qu’ils le fassent, mais que dans nombre de cas ils le fassent si massivement et si tôt, au point même d’altérer et de rendre radicalement inaccessibles les informations que l’on pourrait s’attendre à voir enregistrées par les organes sensoriels, compte tenu de la nature de la scène perçue et des capacités objectives (physiologiquement déterminées) de discrimination de ces organes.
Lors même que la transition de l’objet perçu (stimulus distal) au percept conscient est généralement conçue comme un processus en deux étapes, dont la première, de nature purement psycho-physique, conduit à la production des effets sensoriels de l’objet sur les capteurs (stimulus proximal), et dont la seconde, de nature proprement interprétative, conduit de ces données sensorielles brutes à la perception de l’objet comme tel et tel, l’analyse de certains types de perception, au premier rang desquels la perception des sons parlés, montre qu’une distinction aussi tranchée entre le psycho-physique et le « mental » est insoutenable, et que nous devons probablement renoncer, au moins dans ce domaine, à l’idée même de données sensorielles pures de toute interprétation. Ainsi qu’on l’a constaté dès les années 1950, l’audition même du discours parlé est en effet « catégorielle », c’est-à-dire que ce stimulus sonore continu est d’emblée appréhendé en fonction des catégories phonétiques de la langue. Le phénomène a été particulièrement bien mis en évidence à propos de la perception des consonnes occlusives. La différence acoustique entre les sons /ba/ et /pa/ tient pour l’essentiel à l’instant où interviennent les vibrations laryngiennes après le relâchement de l’occlusion : d’emblée dans le premier cas, de façon différée dans le second. Ne retenant pour seule dimension de variation du stimulus que cet instant de début de voisement (VOT, pour Voice Onset Time), on peut synthésiser un continuum de sons dans lequel ce paramètre varie, par exemple, de 10 à 80 millisecondes, c’est-à-dire d’une réalisation canonique de /ba/ à une réalisation canonique de /pa/. L’auditeur est alors placé devant deux tâches. La tâche d’identification consiste à catégoriser comme /ba/ ou comme /pa/ un ensemble de sons successifs extraits de ce continuum. La tâche de discrimination est la suivante : étant donnés des triplets (A, B, X) de sons successifs extraits du continuum, triplets dans lesquels A et B sont distants, par exemple, de 10 µs, et où X est ou bien A ou bien B, on demande à l’auditeur d’indiquer si X est A ou B. En l’absence du phénomène de perception catégorielle, les résultats de ces épreuves devraient être du type suivant :
Figure 2a
Taux attendu d’identification comme /ba/
Agrandir l'image Taux attendu d’identification comme /ba/
Figure 2b
Taux attendu de discrimination entre paires de stimuli équidistants
Agrandir l'image Taux attendu de discrimination entre paires de sti...
D’une part (Fig. 2a) l’identification du stimulus comme /ba/ devrait linéairement décroître avec l’augmentation du VOT, d’autre part (Fig. 2b) la réussite au test ABX, qui met en jeu la capacité de discriminer des paires de stimuli équidistants, devrait demeurer constante, au titre de fonction d’une capacité de discernement « purement auditive », ne mettant en jeu que le fonctionnement psycho-physique de l’appareil sensoriel (loi de Weber). Or tel n’est nullement le cas, et les données massivement attestées depuis l’article séminal de Liberman & alii [17] montrent que la situation réelle est au contraire la suivante :
Figure 3a
Taux effectif d’identification comme/ba/
Agrandir l'image Taux effectif d’identification comme/ba/
Figure 3b
Taux effectif de discrimination de stimuli équidistants
Agrandir l'image Taux effectif de discrimination de stimuli équidis...
D’une part (Fig. 3a) les stimuli sont massivement perçus comme /ba/ ou /pa/ selon qu’ils sont d’un côté ou de l’autre de la frontière qui sépare les deux catégories. D’autre part et surtout (Fig. 3b), les capacités de discrimination s’exercent différemment selon que les deux stimuli comparés appartiennent ou non à la même catégorie : des différences acoustiques de même ampleur sont sensibles au voisinage de la frontière inter-catégorielle, lorsqu’elles mettent en jeu des stimuli de catégories distinctes, alors qu’elles demeurent imperceptibles lorsqu’elles impliquent des stimuli de même catégorie, et notamment au voisinage des réalisations canoniques de /ba/ et de /pa/. En d’autres termes, la connaissance des propriétés physiques du signal sonore (stimulus distal), jointe à la connaissance des capacités discriminatives de l’appareil auditif, ne suffit pas pour prédire la nature du son perçu. Même au niveau le moins « traité », celui de la sensation sonore, il n’y a rien qui soit le simple enregistrement de l’impact de l’environnement sur le système perceptif, et rien à propos de quoi l’on pourrait parler de donnée pure de toute activité d’interprétation ou de catégorisation.
S’agissant du discours parlé, la perception catégorielle est une solution éminemment économique aux difficultés qui peuvent résulter du contraste entre le caractère continu du signal sonore et le caractère discret des oppositions linguistiques pertinentes (la possibilité de déformer continûment /bier/ en /pier/ n’a évidemment aucune contrepartie sémantique du côté du référent des mots « bière » et « pierre »). L’impossibilité de discriminer auditivement les stimuli situés dans le continuum intra-catégoriel maximise la stabilité acoustique par rapport à la variabilité du signal, puisque le seul paramètre perçu est celui de l’appartenance catégorielle, et que les autres sont purement et simplement ignorés dès le stade de la sensation. Réciproquement, puisque les stimuli sont, avec une très haute probabilité, identifiés par l’auditeur comme /b/ ou comme /p/ selon qu’ils se situent d’un côté ou de l’autre de la frontière inter-catégorielle, le locuteur a l’assurance d’être compris même si son émission sonore est objectivement assez éloignée du /b/ ou du /p/ canonique. Cette économie considérable, à la fois dans la reconnaissance et dans la production du signal, est le résultat d’une catégorisation qui reflète l’articulation phonématique de la langue, et qui est donc susceptible de varier d’une langue à l’autre : ce qui est entendu (et non pas seulement, donc, la manière dont ce qui est entendu est interprété) dépend largement de la langue maternelle des sujets [18].
Libermann et ses collaborateurs expliquent ce phénomène de perception catégorielle en postulant que les sons continus du discours parlé sont rapportés par l’auditeur à l’ensemble discret des configurations articulatoires (position de la langue, des lèvres, etc.) qui en régissent la production : les sujets tendent à oblitérer la différence entre sons dont ils se représentent l’articulation comme semblable, et à creuser la différence entre sons qu’ils se représentent comme le résultat de gestes articulatoires distincts. Ceci expliquerait très bien, par exemple, que la discrimination auditive des stimuli du continuum /ra/-/la/ ne présente chez les locuteurs japonais aucun « pic » caractéristique : ces locuteurs entendent « également » le continuum en question, car ils n’ont jamais à produire la distinction entre /ra/ et /la/, puisque cette opposition n’est pas pertinente dans leur langue.
Compte non tenu d’un certain nombre d’objections techniques dans le détail desquelles nous ne pouvons pas entrer ici, cette théorie « motrice » est aujourd’hui en passe de succomber sous un ensemble impressionnant de contre-arguments généraux. D’une part, cette théorie avait été expressément construite pour rendre compte de la perception du discours parlé, que l’on croyait à l’époque être le seul cas de perception catégorielle, et elle semble incapable d’expliquer les autres cas de perception de ce type, comme la perception des sons musicaux. Ainsi, les musiciens entraînés perçoivent les hauteurs catégoriquement (un la est entendu directement, « absolument », comme la), et nombre de travaux plus récents, comme ceux de Burns et Ward [19], montrent que leurs performances en matière de discrimination présentent les irrégularités caractéristiques de la perception catégorielle [20] : les sons sont mieux différenciés au voisinage des bornes entre intervalles bien tempérés qu’à l’intérieur de ces intervalles. On pourrait évidemment essayer d’étendre la théorie motrice à ces phénomènes, en expliquant en général les phénomènes de perception catégorielle par une sorte de congruence entre perception et production. Dans une telle hypothèse, nous appréhenderions les sons musicaux, les gestes de l’autre ou les expressions de son visage, etc., en nous référant à la manière dont nous les produirions pour notre propre compte. Mais cette hypothèse semble empiriquement réfutée, au moins sous sa forme la plus générale, par les données relatives aux créatures (enfants pré-verbaux, primates) dont la perception possède tous les traits caractéristiques de la catégorialité alors même qu’elles sont évidemment incapables de produire eux-mêmes les stimuli pertinents. Comme l’écrit par exemple St. Walker [21] après avoir passé en revue les études consacrées à la perception du discours parlé chez les primates, le fait que les singes rhésus se montrent aptes à détecter la différence entre consonnes voisées et non voisées suggère bien que « l’expérience consistant à produire soi-même des sons, bien qu’elle soit indubitablement de quelque aide, n’est en aucune façon nécessaire pour parvenir aux discriminations phonétiques de base ». La perception catégorielle, en d’autres termes, ne semble pas reposer sur la représentation interne ou sur la maîtrise pratique des facteurs physiologiques capables de produire des événéments semblables aux événements ainsi perçus.
Ces considérations invitent à se rabattre sur une théorie d’allure « conventionnaliste », dans laquelle les phénomènes de perception catégorielle ne seraient plus expliqués par l’existence d’une relation naturelle – comme la contrainte articulatoire – entre les stimuli et les catégories dans lesquelles ils sont distribués. Dans une variante défendue en particulier par Lane [22], les catégories en question auraient simplement leur origine dans le fait que l’on a appris aux sujets à classifier les stimuli ainsi, hypothèse qui semble largement confirmée par les expériences de Burns et Ward : pour autant que la perception des intervalles soit concernée, l’apprentissage serait capable d’induire une « catégorification » de la perception (on passe progressivement de courbes du type de la figure 2 pour les novices à des courbes du type de la figure 3 pour les musiciens entraînés). Ceci semble suggérer que la plasticité de l’organisation perceptive serait en quelque sorte sans limites, c’est-à-dire pourrait conduire à une catégorisation quelconque, à la seule condition que le sujet soit exposé à des stimuli appropriés en quantité suffisante. L’hypothèse semble pouvoir s’autoriser d’une loi d’« adaptation sélective », selon laquelle les frontières inter-catégorielles se rapprochent des valeurs représentées par le stimulus répété (dans le cas du continuum /ba/-/pa/, par exemple, on constate qu’un sujet auquel a été présenté répétitivement l’un des stimuli extrémaux, disons le /pa/ canonique, fait preuve ensuite des performances d’identification et de discrimination caractéristiques d’une perception catégorielle dans laquelle la frontière s’est déplacée vers la droite du spectre [23] ).
Mais une telle conclusion est évidemment hâtive : une chose est de dire (ce qui semble aujourd’hui à peu près acquis) que les catégories n’ont pas de fondement naturel dans l’activité motrice, autre chose est de dire que les processus de catégorisation perceptive reposent seulement sur des mécanismes généraux d’apprentissage opérant sur une structure initiale amorphe et arbitrairement malléable. Car la perception catégorielle suppose non seulement des capacités générales de discrimination sensorielle suffisamment fines, mais également des récepteurs neuro-sensoriels répondant très sélectivement à des domaines bien délimités de valeurs acoustiques. En d’autres termes, le fait que le tracé des frontières catégorielles puisse évoluer sous l’influence de l’environnement et de l’apprentissage est pour le moins compatible avec l’existence de dispositifs innés spécialisés dans le traitement des stimuli ainsi catégorisés. Du reste, la réalité de tels mécanismes modulaires innés peut être attestée, dans certains cas, par l’existence d’une catégorisation initiale universelle. Un exemple classique (Fig. 4) est celui du VOT, qui est identiquement catégorisé de la façon suivante par les enfants préverbaux issus de collectivités linguistiques diverses : une première frontière correspondant à un VOT négatif (-30µs), et l’autre vers 30µs [24].
Figure 4
La catégorisation universelle du VOT chez les enfants préverbaux
Agrandir l'image La catégorisation universelle du VOT chez les enfa...
La question de savoir quel est, en général, le type d’argument qui devrait nous conduire à postuler l’existence de tels mécanismes modulaires dans les cas de perception catégorielle est actuellement disputée [25] : il est clair que la prolifération inattendue de ces cas doit rendre circonspect, si l’on veut éviter de supposer que nous naissons équipés d’une jungle de mécanismes spécialisés. Une discussion de ce genre serait sans nul doute mieux assurée si l’on possédait, à propos de la perception des sons non parlés, une variété de données et d’analyses comparable à celle dont on dispose aujourd’hui à propos de la perception des signaux auditifs linguistiques.
2.3. De la perception à l’interprétation. H. von Helmholtz, qui fut au XIXe siècle le premier théoricien systématique des « inférences perceptives » et qui est souvent tenu pour l’un des précurseurs de tout premier plan des sciences cognitives [26], considérait en romantique convaincu que la psycho-logie devait essentiellement mettre l’accent sur l’activité créative de l’esprit, et il concevait, par exemple, la perception comme une Å“uvre d’interprétation plutôt que comme la réception passive d’un donné. D’une certaine manière, on pourrait donc soutenir que la théorie cognitiviste de la perception dont on vient d’indiquer quelques caractéristiques prend sa source dans l’alliance improbable de l’informatique contemporaine et du romantisme allemand. Mais Helmholtz considérait aussi que les « perceptions artistiques » n’étaient pas elles-mêmes fondamentalement distinctes des perceptions sensorielles : à l’en croire, les deux, parce qu’elles « viennent sans peine » et qu’elles « apparaissent soudainement, sans que leur possesseur sache d’où elles leur viennent », sont des produits typiques de l’activité inconsciente de l’esprit [27]. Or il est plus malaisé de discerner dans le « champ cognitif » contemporain un écho de cette affirmation, selon laquelle, par exemple, la perception sensorielle de l’Å“uvre (comme matériau) et sa perception comme structure artistique sont issues du même travail mental inconscient. C’est par une remarque très générale touchant cette thèse que je voudrais néanmoins terminer cet article.
On pourrait, me semble-t-il, distinguer entre deux conceptions opposées des rapports entre la perception sensorielle et la perception symbolique, conceptions que je qualifierai, faute de meilleurs mots, l’une de « relativiste » et l’autre de « modulariste ». Le relativisme insiste sur l’idée que c’est la même chose qui est à la fois éprouvée et interprétée, alors que le modularisme voit la perception symbolique comme une activité qui commence là où la perception sensorielle s’achève (les conceptions effectivement défendues par tel ou tel théoricien sont probablement des amalgames diversement dosés entre ces deux thèses « idéales », mais on voit sans peine, s’il faut des noms, que N. Goodman [28] et R. Jackendoff [29] pourraient respectivement convenir). Bien que la discussion soit sans doute rarement conduite en des termes aussi nets et, encore une fois, que tout ceci doive plutôt être pris comme une simple « reconstruction rationnelle », le point de désaccord est le suivant. Le relativisme prend toujours à la lettre les expressions du type « voir (ou entendre) telle ou telle chose comme X », c’est-à-dire qu’il admet sans limite la possibilité d’influences « descendantes » (top-down) du « cadre conceptuel » sur l’expérience sensorielle elle-même : à l’en croire, ce qui est vu ou entendu est, en vertu de mécanismes généraux, littéralement sous la dépendance des croyances et de la manière de catégoriser. Le modularisme, à l’opposé, soutient que la pénétration de ces influences est limitée, que des phénomènes comme celui de la perception catégorielle des sons parlés, dans lesquels la sensation sonore est partiellement sous l’emprise de la catégorisation phonématique particulière à l’auditeur, sont des expériences exceptionnelles qui mettent en jeu des mécanismes spécifiques, et qu’au total la perception sensorielle se montre au contraire remarquablement « objective », c’est-à-dire en définitive très récalcitrante à l’altération par les croyances et l’organisation conceptuelle du sujet particulier qui perçoit : comme l’écrit Jackendoff, l’expérience musicale, par exemple, est « informationnellement encapsulée », ce qui signifie, entre autres, que les informations extérieures qui concernent l’Å“uvre écoutée n’ont aucun effet sur l’écoute elle-même (le fait de savoir que la Symphonie Héroïque a été, à l’origine, dédiée à Napoléon, peut être pertinent pour l’analyse de l’Å“uvre, mais n’a aucune incidence sur ce qui est perçu lors de l’une de ses exécutions) [30].
La controverse ainsi définie concerne l’une des questions ouvertes des sciences cognitives contemporaines, celle de l’étanchéité de la distinction entre perception et « cognition ». La manière dont cette question est aujourd’hui posée est indiscutablement de nature à renouveler la réflexion philosophique traditionnelle sur la nature et l’immédiateté des sense data, en lui conférant la précision et la testabilité qui lui manquent trop souvent.
 
NOTES
 
[1]J’emprunte l’exemple à la thèse de O. SIGAUD, Apprentissage : de la commande au comportement, (Université de Paris-XI, 1996).
[2]Naturellement, cette règle se situe, pour ainsi dire, en amont de la distinction traditionnelle entre les diverses « facultés » constitutives de l’intelligence, puisque les états internes auxquels elle fait référence peuvent être indifféremment interprétés en termes de mémoire (on est dans l’état F si l’on se rappelle avoir ouvert la boîte), de jugement (on est dans l’état F si l’on juge que l’objet est déjà dans la boîte) ou de planification (on est dans l’état F si le scellement de la boîte est la prochaine action dans l’agenda).
[3]Cette distinction de niveaux explicatifs est développée par D. Marr dans son ouvrage Vision, Freeman & Co, 1982, p. 22 sq.
[4]Un tel programme ne doit être considéré comme une explication adéquate que si, en outre, sa durée d’exécution est comparable au temps mis par les individus à élaborer leurs réponses à partir des entrées considérées, et s’il existe par ailleurs des indices montrant que l’algorithme utilisé par le programme est le même que celui auquel se conforme l’activité mentale étudiée.
[5]« Le mouvement centrifuge [du champ de conscience] le porte à son « ex-centricité » en l’opposant au milieu où foisonnent et bouillonnent ses tendances appétitives. » (H. EY, La conscience, P.U.F., 1968, p. 333).
[6]Une distinction analogue est celle que trace N. GOODMAN (Languages of Art, Hackett Publ., 2e éd., 1976, p. 27 sq.) entre l’image d’un cheval noir et l’« image-d’un-cheval-noir » (black-horse picture), qui représente identifiablement son objet comme un cheval noir.
[7]Cf. par exemple Dioptrique, A.T., 140, Oeuvres Philosophiques I, Garnier, 1963, p. 709-710.
[8]Loc. cit., A.T. 137-138, Garnier, p. 707.
[9]De la Recherche de la Vérité, I, VII, V, in Oeuvres I, Bibliothèque de la Pléiade, 1979, p. 70.
[10]Cf. sur ce point J. FODOR, The Modularity of Mind, M.I.T. Press, 1983, trad. française La modularité de l’esprit, éditions de Minuit, 1986, p. 75-77.
[11]Op. cit., Dernier éclaircissement, § 26, p. 1087.
[12]Pour une discussion détaillée de cette question, cf J. FODOR, op. cit., notamment p. 87 sq.
[13]A en croire les linguistes de la tradition chomskyenne, les règles sous-jacentes à l’activité linguistique sont, elles aussi, du même ordre (la référence sur ce point est : J. FODOR, op. cit. p. 63 sq.).
[14]Cf. par exemple N. Goodman : « L’Å“il ne fonctionne pas comme un instrument autonome et indépendant, mais comme un membre obéissant d’un organisme complexe et capricieux. C’est ce que l’on voit, et non pas seulement comment l’on voit, qui est réglé par le besoin et le préjugé » (op. cit., p. 7).
[15]La théorie computationnelle de la vision proposée par D. Marr (op. cit.) constitue à maints égards la meilleure illustration de ce point.
[16]Naturellement, nous nous plaçons ici dans le cas où chaque abeille est « disponible à la perception visuelle », c’est-à-dire où l’angle de vision est tel que chacune est isolément visible (aucune, par exemple, ne masque l’autre) : il est bien question de l’appauvrissement de l’information effectivement enregistrée par les organes sensoriels, et non de l’incapacité « objective » éventuelle de ces organes à être « impressionnés » par la totalité du stimulus distal.
[17]A.M. LIBERMAN, F.S. COOPER, D.P. SHANKWEILER & M. STUDDERT-K ENNEDY, « Perception of the Speech Code », Psychological Review, 74,1967, p. 431-461.
[18]On ne peut ici que renvoyer à la littérature comparativiste (et en particulier à L. LISKER & A.S. ABRAMSON, « The Voicing Dimension : Some Experiments in Comparative Phonetics », in Word, 20,1964, p. 384-422) : les frontières de voisement diffèrent pour les anglophones (30 µs) et pour les francophones (0 µs), et plus encore pour les locuteurs thaï, qui tracent quant à eux deux frontières dans le continuum, dont l’une correspondant à un VOT négatif (- 20 µs). Cette dernière répartition du voisement, qui répond à une autre organisation phonologique de la langue (cf N. CHOMSKY & M. HALLE, Principes de phonologie générative, Seuil, 1973, p. 167, Tableau VIII) semble en outre assez voisine de la catégorisation universelle « initiale » décrite par J. MEHLER & J. BERTONCINI, « Infant’s Perception of Speech and Other Acoustic Stimuli », Infant Behavior and Development, 2,1980.
[19]Par exemple E.M. BURNS & W.D. W ARD, « Categorical Perception – Phenomenon or Epiphenomenon : Evidence from Experiments in the Perception of Melodic Musical Intervals », Journal of the Acoustical Society of America, 63,1978, p. 456-468. Cf. aussi, à propos de la perception du rythme, l’étude citée de J. Mehler & J. Bertoncini : dans un continuum de 600 µs borné par deux battements à chaque extrémité et contenant un battement intermédiaire variable, la perception est catégorielle avec deux frontières (les trois classes invariantes dans lesquelles sont rangées le battement variable sont : « même que 1 », « entre 1 et 2 », « même que 2 »).
[20]L’élargissement de la gamme de stimuli entraîne par ailleurs une baisse dans la capacité d’identification, qui est donc naturellement moins élevée que dans les cas « purs » de perception catégorielle.
[21]Animal Learning, Routledge & Kegan Paul, 1987, p. 289.
[22]H. LANE, « Motor Theory of Speech Perception : A Critical Review », in Psychological Review, LXXII, 1965, p. 275-309.
[23]P.D. E IMAS & J.D. CORBITT, « Selective Adaptation of Linguistic Feature Detectors », Cognitive Psychology, IV, 1973, p. 99-109.
[24]Cf J. MEHLER & J. BERTONCINI, loc. cit. Ce tracé initial est radicalement modifié par l’apprentissage, puisque l’existence de deux frontières de voisement répond à une organisation phonologique de la langue qui n’est que rarement attestée (la langue thaï est un exemple, cf. N. CHOMSKY & M. HALLE, Principes de phonologie générative, Seuil, 1973, p. 167, Tableau VIII), et la plupart du temps le tracé final n’en contient qu’une (par exemple à 30 µs pour les anglophones, et 0µs pour les francophones).
[25]Pour une discussion pénétrante, cf. encore J. FODOR, op. cit., p. 69 sq.
[26]Cf. notamment R.L. G REGORY, The Intelligent Eye, Weidenfeld & Nicholson, Londres, 1970. Sur Helmholtz, cf. aussi J. BOUVERESSE, Langage, perception et réalité I. La perception et le jugement (éd. J. Chambon, 1995, p. 35-231) et Theo. C. MEYERING, Historical Roots of Cognitive Science, Kluwer Academic Press, 1989, p. 109 sq.
[27]H. VON HELMHOLTZ, Vorträge und Reden II, Friedrich Vieweg & Sohn, Braunschweig, 5° édit., 1903, p. 344.
[28]Op. cit., cf. la citation de la note 14 ci-dessus.
[29]Consciousness and the Computational Mind, M.I.T. Press, 1987, en particulier le chap. XII, ainsi que (avec F. Lerdahl), A Generative Theory of Tonal Music, M.I.T. Press, 1983.
[30]Op. cit., p. 262.
© Cairn.info 2009 Vie privée | Conditions d’utilisation | Conditions générales de vente
Cairn.info | Éditeurs | Bibliothèques | Aide à la navigation | Plan du site | Raccourcis
[1]
J’emprunte l’exemple à la thèse de O. SIGAUD, Apprentissage...
[suite] Suite de la note...
[2]
Naturellement, cette règle se situe, pour ainsi dire, en am...
[suite] Suite de la note...
[3]
Cette distinction de niveaux explicatifs est développée par...
[suite] Suite de la note...
[4]
Un tel programme ne doit être considéré comme une explicati...
[suite] Suite de la note...
[5]
« Le mouvement centrifuge [du champ de conscience] le porte...
[suite] Suite de la note...
[6]
Une distinction analogue est celle que trace N. GOODMAN (La...
[suite] Suite de la note...
[7]
Cf. par exemple Dioptrique, A.T., 140, Oeuvres Philosophiqu...
[suite] Suite de la note...
[8]
Loc. cit., A.T. 137-138, Garnier, p. 707. Suite de la note...
[9]
De la Recherche de la Vérité, I, VII, V, in Oeuvres I, Bibl...
[suite] Suite de la note...
[10]
Cf. sur ce point J. FODOR, The Modularity of Mind, M.I.T. P...
[suite] Suite de la note...
[11]
Op. cit., Dernier éclaircissement, § 26, p. 1087. Suite de la note...
[12]
Pour une discussion détaillée de cette question, cf J. FODO...
[suite] Suite de la note...
[13]
A en croire les linguistes de la tradition chomskyenne, les...
[suite] Suite de la note...
[14]
Cf. par exemple N. Goodman : « L’Å“il ne fonctionne pas comm...
[suite] Suite de la note...
[15]
La théorie computationnelle de la vision proposée par D. Ma...
[suite] Suite de la note...
[16]
Naturellement, nous nous plaçons ici dans le cas où chaque ...
[suite] Suite de la note...
[17]
A.M. LIBERMAN, F.S. COOPER, D.P. SHANKWEILER & M. STUDDERT-...
[suite] Suite de la note...
[18]
On ne peut ici que renvoyer à la littérature comparativiste...
[suite] Suite de la note...
[19]
Par exemple E.M. BURNS & W.D. W ARD, « Categorical Percepti...
[suite] Suite de la note...
[20]
L’élargissement de la gamme de stimuli entraîne par ailleur...
[suite] Suite de la note...
[21]
Animal Learning, Routledge & Kegan Paul, 1987, p. 289. Suite de la note...
[22]
H. LANE, « Motor Theory of Speech Perception : A Critical R...
[suite] Suite de la note...
[23]
P.D. E IMAS & J.D. CORBITT, « Selective Adaptation of Lingu...
[suite] Suite de la note...
[24]
Cf J. MEHLER & J. BERTONCINI, loc. cit. Ce tracé initial es...
[suite] Suite de la note...
[25]
Pour une discussion pénétrante, cf. encore J. FODOR, op. ci...
[suite] Suite de la note...
[26]
Cf. notamment R.L. G REGORY, The Intelligent Eye, Weidenfel...
[suite] Suite de la note...
[27]
H. VON HELMHOLTZ, Vorträge und Reden II, Friedrich Vieweg &...
[suite] Suite de la note...
[28]
Op. cit., cf. la citation de la note 14 ci-dessus. Suite de la note...
[29]
Consciousness and the Computational Mind, M.I.T. Press, 198...
[suite] Suite de la note...
[30]
Op. cit., p. 262. Suite de la note...
Illusion de Müller-Lyer
Illusion de Zöllner
Taux attendu d’identification comme /ba/
Taux attendu de discrimination entre paires de stimuli équidistants
Taux effectif d’identification comme/ba/
Taux effectif de discrimination de stimuli équidistants
La catégorisation universelle du VOT chez les enfants préverbaux