2002
Archives de Philosophie
Calculer, percevoir et classer
Jacques Dubucs
IHPST (CNRS/Paris I)
Essentiellement consacré à la signification et à l’interprétation des phénomènes de
perception « catégorielle », l’article vise à introduire le public philosophique aux problèmes et aux méthodes des sciences cognitives contemporaines. Un exemple simple établit
l’inadéquation de la méthodologie behavioriste et la nécessité de distinguer entre « observable » et « objectivable ». L’hypothèse de la modularité des systèmes périphériques est
illustrée par le cas de la perception des sons parlés, et la signification de cette hypothèse
relativement à la question de la dépendance des percepts par rapport aux croyances est
discutée.Mots-clés :
Cognitives (sciences), Catégorielle (perception), Modularité.
Mainly devoted to the interpretation of the ‘‘ categorical’’perception phenomena,
the paper intends to provide a philosophical introduction to the problems and methods of
contemporary cognitive science. A simple example establishes the inadequacy of the
behavioristic methodology as well as the necessity of distinguishing between ‘‘ observable ’’and ‘‘ objectivable ’’. The hypothesis of the modularity of peripheric systems is
illustrated by the case of the perception of speech, and the significance of this hypothesis
with respect to the question of the influence of beliefs on perception is discussed.Keywords :
Cognitive (science), Categorical (perception), Modularity.
Les sciences cognitives poursuivent un objectif fort ancien, qui consiste,
sommairement dit, à décrire et à expliquer les comportements intelligents.
Elles appliquent à cet effet des principes méthodologiques moins traditionnels, dont l’adoption définit ce qu’il est convenu d’appeler le « tournant
cognitif ». Je me propose ici d’exposer brièvement ces principes, de les
illustrer par des exemples appropriés et d’en discuter la signification philosophique. Pour l’essentiel, j’ai mis en avant un domaine qui me semble
particulièrement pertinent pour les philosophes : l’analyse de la catégorisation, c’est-à-dire du processus par lequel un ensemble d’entités (stimuli
sonores ou visuels, objets concrets ou abstraits) en vient à être classifié en
catégories séparées, qui peuvent être de type perceptif (phonèmes, couleurs)
ou conceptuel (espèces naturelles, types d’événements, catégories esthétiques et morales).
1. L’étude objective de la « boîte noire ». On chercherait vainement à définir
les sciences cognitives en énumérant les disciplines académiques concernées
par la description, l’explication ou la simulation du comportement intelligent (psychologie, linguistique, neurosciences, logique, théorie de la décision, informatique, intelligence artificielle, robotique, anthropologie, épistémologie, philosophie de l’esprit, etc.). D’une part, une telle liste peut
toujours omettre une discipline potentiellement concernée par cette étude,
mais dont la contribution explicite serait restée jusqu’à présent discrète.
D’autre part, les recherches menées dans les disciplines que l’on évoque le
plus spontanément ne relèvent pas toutes, loin s’en faut, du domaine des
sciences cognitives, soit qu’elles n’aient pas de rapport direct à la théorisation du comportement intelligent (philologie historique, neuro-anatomie
descriptive), soit qu’elles ne satisfassent pas aux exigences de testabilité ou
de rigueur sur lequel l’accord a fini par se faire en ce domaine (psychanalyse,
philosophie « littéraire »). Aussi est-il probablement préférable de caractériser les sciences cognitives par les traditions intellectuelles contre lesquelles
elles se sont définies, c’est-à-dire au premier chef l’introspectionnisme et le
behaviorisme.
En qualifiant d’intelligent le comportement d’un agent, on veut dire que
ce comportement est, d’une certaine manière, approprié, mais aussi qu’il ne
résulte pas d’une pure et simple réaction d’ajustement dont on pourrait
fournir une explication mécanique ou physiologique immédiate. A cet
égard, les réflexes de constriction ou de dilatation pupillaires sous l’effet des
variations de l’intensité lumineuse ne sont pas des comportements « intelligents » : on réservera cette dénomination aux comportements qu’un individu adopte en vertu du fait qu’il possède une représentation de son environnement et des objectifs qu’il poursuit. Dans des cas de ce genre, la
corrélation entre les stimuli sensoriels qui affectent les individus et les
réponses, motrices ou verbales, qu’ils dirigent en retour vers leur environnement, est une corrélation qui ne possède aucune explication physique ou
physiologique accessible, bien qu’elle s’effectue évidemment sans enfreindre aucune loi de physique ou de physiologie. On songera, par exemple, à
l’impossibilité manifeste, pour qui aurait connu la description précise des
traces encrées contenues dans la lettre qui m’avait été adressée par les
Archives de Philosophie, ainsi que la situation neuro-physiologique
détaillée de mon cerveau à l’instant de la réception de cette lettre, de prédire
les mouvements digitaux que je suis en train d’effectuer au-dessus du clavier
de mon ordinateur, et cela en suivant les seuls liens de la causalité physique
et physiologique, c’est-à-dire sans du tout invoquer la signification des signes
écrits ou lus, ni les représentations mentales ou les opérations intellectuelles
mobilisées par la rédaction de ce texte.
Selon la psychologie introspective traditionnelle, l’explication d’un tel
processus ne devrait en tout cas pas constituer une énigme pour le sujet
lui-même. Cette psychologie suppose en effet que la clef du comportement
intelligent est donnée par l’existence de processus mentaux auxquels chaque
individu possède un accès privilégié, et donc que la vie mentale est transparente pour le regard introspectif. Mais la « méthode » de l’introspection est
incapable de fonder une psychologie scientifique, car elle ne révèle aucune
donnée accessible à tous les observateurs, et elle encourage des entreprises
« empathiques » vouées à l’échec et à la confusion (on cherche à expliquer le
comportement d’autrui en tâchant d’imaginer ce que l’on pourrait soi-même
apercevoir à l’aide du « regard intérieur » si l’on était dans la situation où il se
trouve, ce que l’on ressentirait si l’on était soumis aux mêmes stimuli, et ce
qui présiderait pour soi-même à la production des mêmes gestes et des
mêmes paroles).
Aussi la tradition introspectiviste a-t-elle été l’objet de critiques insistantes, lesquelles culminent avec la psychologie behavioriste qui a dominé la
scène au milieu du XXe siècle. Cette psychologie se propose de limiter ses
investigations aux données publiquement objectivables (les stimulations
sensorielles et les réponses comportementales qui leur sont associées),
d’adopter les méthodes expérimentales en usage dans les sciences de la
nature, et donc d’écarter toute référence aux états intérieurs appréhendés
par le seul sujet. Le behaviorisme considère la totalité de ces états comme
une « boîte noire » inscrutable dont le contenu n’a pas à figurer dans une
explication psychologique digne de ce nom. Le gain en objectivité ainsi
obtenu est toutefois cher payé : des vastes questions abordées par la psycho-logie traditionnelle (la nature de la mémoire, de l’imagination, de la perception, de l’activité de langage, etc.), aucune ne se laisse véritablement traiter
en termes de chaînes associatives entre stimuli et réponses. Le discrédit
croissant, et aujourd’hui définitif, qui a affecté le behaviorisme à partir des
années 1950 n’a pas d’autre origine : capable d’expliquer les aspects les plus
simples de l’apprentissage animal, la méthodologie behavioriste n’était en
mesure d’éclairer aucun des traits décisifs du comportement humain intelligent.
Une explication psychologique satisfaisante ne saurait se dispenser de
considérer l’architecture interne de la « boîte noire ». Le problème crucial est
seulement d’en rendre compte de manière objectivable, sans s’en remettre
aux prétendues données de l’introspection. Un agent, par exemple, se montre capable d’effectuer la tâche suivante : ouvrir un récipient opaque, y
insérer un objet, refermer le récipient, et le sceller. Voilà un comportement
qui ne saurait en tout cas s’expliquer en termes behavioristes, comme
disposition constante, habituelle ou « renforcée », à répondre de telle et telle
manière à un stimulus donné : une fois l’objet mis dans la boîte et la boîte
refermée, l’environnement perçu est identique à l’environnement initial,
alors que l’action effectuée (sceller) n’est plus l’action initiale (ouvrir)
[1].
Puisque les réponses diffèrent pour des stimuli qui ne varient pas, c’est
qu’elles ne sont pas sous la seule dépendance de l’environnement, mais sont
également déterminées par la valeur de certaines variables « internes ». Ces
valeurs, les « états internes », contribuent, au même titre que les entrées
sensorielles et, si l’on ose dire, en coopération avec elles, à causer les sorties
comportementales. Et c’est même cette contribution causale qui les définit,
comme on dit,
fonctionnellement. Notre agent possède un certain mécanisme capable d’être dans (au moins) deux états distincts, disons E et F. Si
l’agent voit que la boîte est fermée, et si le mécanisme est dans l’état E, alors
il ouvre la boîte. Mais il la scelle si le mécanisme est dans l’état F à l’instant
où il la perçoit fermée. D’une certaine manière, on peut en rester là. Les états
E et F sont
objectivables, puisqu’il est démontré que, s’ils n’étaient pas
distincts, l’agent ne pourrait faire ce que manifestement il fait. L’objectivité
d’un état interne ne serait en cause que si l’on pouvait le supprimer sans
dommage de l’explication, c’est-à-dire s’il n’avait aucun rôle causal distinctif, autrement dit encore si l’ensemble des réponses manifestes à tous les
stimuli possibles était le même, que l’agent soit ou ne soit pas dans l’état
considéré. Les états E et F, qui ne sont pas dans ce cas, sont donc objectivables, bien qu’ils ne soient pas
observables au sens strict. Dans ces conditions,
on pourra proposer du comportement une explication « fonctionnelle » qui
spécifiera, en termes de ces états internes dont la nature physique ou
physiologique exacte est laissée provisoirement indéterminée, un ensemble
de
règles analogues aux instructions d’un programme informatique. Dans
l’exemple rudimentaire qui nous occupe interviendra par exemple la règle
de bifurcation suivante :
(*) Si l’on perçoit que la boîte est fermée, alors 1) si l’on est dans l’état E, l’ouvrir
et passer à l’état F, et 2) si l’on est dans l’état F, la sceller [2].
Un exemple de ce genre illustre assez bien l’une des caractéristiques
essentielles de la psychologie cognitive contemporaine. Au lieu de répondre
directement à la question de savoir comment notre cerveau s’y prend, dans
les faits, pour accomplir une tâche intelligente comme le jeu d’échecs, la
reconnaissance des visages ou la planification du mouvement, on examine
comment un système quelconque (éventuellement doté de certaines propriétés caractéristiques plus ou moins semblables à celles du cerveau humain)
pourrait s’y prendre pour effectuer la même tâche. D’une certaine manière,
la méthode a été appliquée pour la première fois par Chomsky en linguistique dans les années 1950, lorsqu’il s’est proposé de déterminer l’
état interne
(« initial ») qui doit nécessairement être attribué à tout système capable de
produire ou de comprendre un nombre indéfini de phrases d’une langue L
donnée (
sortie), connaissant la dimension du corpus de phrases correctes de
L auquel ce système a été effectivement exposé (
entrée). A cet égard, le cas du
langage est, lui aussi, assez représentatif d’une règle générale selon laquelle,
à complexité de comportement donnée, la richesse des mécanismes internes
que l’on doit invoquer dans l’explication varie en raison inverse de la richesse
du stimulus : l’architecture interne du système étudié doit être supposée
suffisamment riche pour produire le comportement observé en suppléant
lorsqu’il le faut aux données fragmentaires en provenance de l’environnement. Pour qu’une telle démarche puisse mettre à jour des structures
internes « objectives », il importe de déterminer d’abord de manière rigoureuse la tâche effectuée par l’agent (la nature des ‘entrées’et des ‘sorties’) et
les contraintes auxquelles doit satisfaire son accomplissement (pour l’essentiel, le temps qui lui est alloué) : le « problème » de la vision, pour donner
encore un autre exemple, consiste à obtenir « en temps réel » une représentation tri-dimensionnelle du monde à partir de l’ensemble des stimulations
rétiniennes. Ayant ainsi défini, pour ainsi dire, la « fonction » calculée par le
système, on cherche alors à spécifier un algorithme de calcul de cette
fonction dont on ait des raisons substantielles de penser (par exemple parce
que la machine informatique sur laquelle il a été implémenté donne les
mêmes résultats en des temps comparables) qu’il coïncide avec celui qui est
employé par le système étudié. Ce niveau « fonctionnel » d’explication est
indépendant du troisième, « physique », auquel il incombe pour finir de
déterminer comment les procédures algorithmiques qui ont été mises en
évidence sont « réalisées » dans la structure physique ou neurophysiologique de l’agent étudié (à ce dernier niveau, les états et processus
internes ne sont plus seulement « objectivables », mais, si l’on veut, « observables », c’est-à-dire désignés intrinsèquement et non plus par leur rôle
fonctionnel
[3] ).
L’explication « algorithmique » d’un comportement intelligent, dont on
ne trouverait aucune contrepartie dans la psychologie behavioriste, doit
donc mettre à jour un ensemble d’états internes qui doivent être spécifiés
fonctionnellement, c’est-à-dire sans faire aucune référence à la nature matérielle du système étudié. Une explication de ce genre doit être
effective,
c’est-à-dire (idéalement) pouvoir être rédigée sous la forme d’un programme
informatique qui ait les mêmes « sorties », pour des « entrées » analogues,
que le processus mental étudié
[4]. Cette exigence d’élémentarité et de testabilité vise à écarter les « explications » qui recourraient à des capacités
complexes inanalysées (la « sociabilité », la « capacité à appréhender les
formes prégnantes », etc.) ou à des notions dont la compréhension réclamerait des dons herméneutiques étendus. Ainsi, une théorie psychologique qui
expliquerait certains phénomènes en attribuant à l’esprit un « mouvement
centrifuge » ou des « tendances appétitives bouillonnantes »
[5] serait-elle sommée d’indiquer la manière dont ce « mouvement » ou ces « tendances »
pourraient être construites sur la base des seuls processus élémentaires à
l’
œuvre dans les automates logiques...
2. L’analyse de la perception. Dans l’usage courant, les verbes de
perception sont ambigus, et peuvent être employés de deux façons distinctes
au moins. Dire qu’un individu a vu une maison signifie tantôt qu’il a eu la
représentation visuelle d’une maison (il a perçu une chose
comme maison),
tantôt qu’une maison était la cause environnementale des excitations sensorielles qui lui parvenaient à l’instant où il regardait
[6]. La perception au
premier sens, suppose évidemment de la part de l’agent la possession de la
catégorie ou du type (
maison) auquel est rapporté ce qui est vu. La perception au second sens, qui est l’expérience purement sensorielle des qualités
phénoménales de la scène ou de l’objet perçus, ne suppose, quant à elle, rien
de tel.
En pratique, les deux variétés d’expérience, disons la perception
« neutre » et la perception « conceptualisée », sont le plus souvent corrélées :
bien des catégories au travers desquelles nous appréhendons les stimulations
en provenance de l’environnement (
serpent,
arme,
visage ami) embrayent, si
l’on ose dire, sur des schémas d’action déterminés (évitement, fuite, approche), en sorte, par exemple, qu’une espèce animale dont les membres
seraient incapables, dans les conditions « normales », de percevoir comme
tels les objets tombant sous des catégories de ce genre aurait tôt fait de
disparaître. Il n’en demeure pas moins que les deux expériences sont
logiquement indépendantes. D’une part, je peux évidemment percevoir un objet
d’un certain type sans percevoir cet objet comme cas particulier du type en
question, notamment si je ne possède pas le concept de ce type. D’autre part
je puis être placé, par exemple, dans de mauvaises conditions d’éclairage, et
voir comme objet d’un certain type quelque chose qui stimule ma rétine,
mais qui s’avèrera être un objet d’un autre type.
2.1. Les inférences perceptives. La perception comme X possède toutes
les caractéristiques d’un jugement (
ce que je vois est un X ) reposant sur
l’interprétation des données ou des indices contenus dans l’expérience
sensorielle de l’objet. Aussi est-il tentant, compte-tenu de la distinction de
rigueur entre d’une part la réceptivité sensorielle, faculté essentiellement
passive dont la fonction est d’accueillir et d’enregistrer les signaux en
provenance de l’environnement, et d’autre part l’intelligence, faculté active
auxquelles les données sensorielles fournissent un matériau brut, de considérer que nous devons sur ce point résister aux suggestions de la langue
naturelle, en admettant que des expressions comme
je vois une maison
(entendue au premier des deux sens que nous avons distingués plus haut) et,
a fortiori,
je vois que la maison est entre la fontaine et la statue sont de
simples abus de langage, dont la contrepartie rigoureuse serait respectivement
je juge que ce que je vois [au sens « neutre »] est une maison et
je juge,
d’après ce que je vois [toujours au sens « neutre »] que la maison est entre la
fontaine et la statue. Telle est la conception « classique », dont on trouverait
sans doute chez Descartes l’expression la plus nette
[7] : la taille, la forme, la
distance et l’identité des objets ne sont pas des qualités
perçues, mais des
propriétés que nous attribuons aux objets sur la base de notre expérience
sensorielle, et ce en vertu d’un acte
intellectuel de jugement qui repose sur
des règles explicites faisant appel à la comparaison, à la mémoire et au
raisonnement.
Qu’un processus d’interprétation et, d’une certaine manière, de raisonnement, s’interpose entre la réception de l’impact des objets sur les récepteurs sensoriels et le moment où les objets sont perçus comme tels et tels,
c’est un point sur lequel la psychologie cognitive contemporaine se trouve en
parfait accord avec cette conception cartésienne. L’argument commun, et à
vrai dire décisif, est ici que la perception de l’objet comme X peut certainement être erronée, alors qu’il n’y a aucune place pour l’erreur (ni d’ailleurs
pour la vérité) dans la simple expérience des impressions sensibles, laquelle
est le pur résultat de l’action causale des objets sur notre appareil sensoriel :
ce résultat est ce qu’il est, et l’erreur ne saurait se situer que dans les
jugements prononcés sur la base de cette expérience, et notamment dans les
jugements relatifs à la nature, à la position réciproque et à la taille des objets
qui en sont la source. La perspective cognitiviste, qui s’accorde avec la
tradition cartésienne pour voir la source des illusions perceptives dans une
erreur de raisonnement et de jugement relative à l’interprétation des données sensorielles brutes, s’en sépare en revanche en postulant que les raisonnements et jugements en question interviennent beaucoup plus tôt que ne le
concevait Descartes, et plus précisément qu’ils interviennent « en amont » de
la pensée consciente proprement dite, au cours du processus perceptif
lui-même.
Bien que les raisonnements de « géométrie naturelle » qui conduisent,
par exemple, à juger de la distance relative des objets à partir de la comparaison des impressions rétiniennes reçues par les deux yeux soient tout à fait
semblables à ceux que tiennent les arpenteurs pour mesurer les lieux inaccessibles à partir de deux points d’observation distincts
[8], ces raisonnements
et les jugements auxquels ils conduisent s’en distinguent néanmoins par leur
automaticité et par leur caractère à la fois involontaire et incorrigible.
Comme l’écrivait déjà Malebranche, une caractéristique essentielle de « ces
jugements naturels de la vue » est qu’« ils se font en nous, sans nous, et même
malgré nous »
[9]. C’est en effet de la chose jugée, et non du jugement
lui-même ou,
a fortiori, de ses attendus, que nous avons conscience. Dès que
nous ouvrons les yeux, nous voyons des objets indépendants de nous (arbres,
automobiles, maisons) dans des relations déterminées de position et de
mouvement, alors que ces percepts conscients sont des produits dérivés, et
que ce qui nous est véritablement
donné n’est pas cela, mais un input
égocentré et parcellaire consistant en lignes, en sommets, en angles ombrés,
en gradients de textures ou en vitesses angulaires dans le champ visuel. La
perception comme tel et tel, qui s’apparente aux activités intelligentes
« supérieures » par le caractère indirect, inférentiel et faillible des verdicts
qu’elle délivre, est donc néanmoins une perception, et même la forme pour
ainsi dire obligée de l’expérience perceptive consciente elle-même : nous ne
pouvons nous contenter de purement et simplement
éprouver l’impact du
monde sur notre appareil sensoriel, ni prendre conscience de nos sensations
visuelles et auditives sans les rapporter aux objets dont elles signalent, fut-ce
illusoirement, la présence (on réservera, comme atypique et difficile, pour le
moins, à analyser, le cas des tentatives systématiques pour régresser en
amont du processus de structuration des données sensorielles, qu’il s’agisse,
par exemple, du projet impressionniste visant en quelque sorte à saisir le
champ visuel lui-même en écartant tout ce qui excède la sensation optique,
ou de la démarche du phonéticien pour entendre les phrases de sa langue
comme purs objets acoustiques
[10] ).
Reste à expliquer comment la perception consciente peut nous
apparaître comme une expérience aussi directe et immédiate, alors qu’elle repose
sur l’effectuation d’opérations complexes (formulation et évaluation d’hypothèses, inférences et résolution de problèmes) tout à fait similaires à celles
que nous effectuons de façon si laborieuse et si lente lorsque nous calculons
et raisonnons consciemment. C’est précisément le problème que la tradition
pré-cognitiviste a échoué à résoudre autrement qu’en invoquant une sorte de
miracle dans « l’Institution de la Nature ». Puisqu’il est nécessaire d’attribuer la structuration des données perceptives à quelque entité qui aurait les
pouvoirs organisateurs de l’esprit, mais qu’il est, en même temps, manifestement impossible de supposer que c’est le nôtre qui effectue cette tâche – il
est beaucoup trop lent pour cela, et, en tout état de cause, ses opérations sont
conscientes, alors que la tâche en question ne l’est pas –, on s’est résigné à
conclure que cette structuration s’effectuait par la grâce du concours divin :
à en croire Malebranche, « nous voyons toute chose en Dieu », car lui seul,
parce qu’il est capable de raisonner, si l’on peut dire, instantanément, peut
nous donner avec l’apparence de l’immédiateté ces conclusions perceptives
auxquelles nous ne pourrions nous-mêmes jamais parvenir aussi rapidement
[11].
L’explication que retient la psychologie cognitive contemporaine, évidemment fort différente, tient à l’hypothèse d’une organisation
modulaire
des systèmes perceptuels : les opérations de calcul qui interviennent entre la
réception des impressions sensorielles et la perception consciente elle-même
sont bien notre fait, mais les mécanismes spécifiques qui, en nous, les
effectuent sont « encapsulés », c’est-à-dire à la fois automatiques et insensibles aux informations possédées par l’intelligence centrale. De même que les
calculs opérés par un ordinateur s’exécutent sans être aucunement influencés par l’
interprétation sémantique pouvant être attribuée aux variables qui
figurent dans le programme, les processus de traitement et de transformation des représentations visuelles ou auditives ne peuvent être affectés par
aucune information extérieure relative aux événements physiques exogènes
auxquels se réfèrent ces représentations. Ce cloisonnement informationnel
est clairement attesté par un phénomène comme la persistance des illusions
visuelles : même en possession de l’information selon laquelle les segments
de droite de la figure 1a sont de longueur identique, ou selon laquelle ils sont
parallèles dans la figure 1b, nous continuons irrépressiblement à les percevoir respectivement comme de longueur ou de direction différentes, parce
que les processus inférentiels spécifiques utilisés par le système visuel pour
déterminer la longueur ou le parallélisme des objets perçus en fonction des
indices de perspective (convergence ou divergence) présents dans l’image
rétinienne sont computationnellement autonomes, et que leur déroulement
ne peut être modifié par les informations à la disposition du système central
[12].
Figure 1a
Illusion de Müller-Lyer
Figure 1b
Illusion de Zöllner
Ces illusions ne proviennent pas d’un fonctionnement défectueux de
notre appareil visuel lui-même – à ce titre il ne convient pas du tout de les
qualifier d’illusions « sensorielles » –, mais résultent plutôt de la manière
dont les données sensorielles sont traitées par les mécanismes inconscients
de calcul et d’inférence qui « construisent » la perception consciente sur la
base de ces données. Les « jugements » de la perception consciente ne
peuvent être corrigés ou influencés par ce que nous pouvons savoir par
ailleurs des objets qui sont la cause distale des sensations, et nous devons
simplement considérer cette incorrigibilité comme la rançon naturelle de la
célérité avec laquelle les mécanismes computationnels en jeu délivrent leurs
verdicts : compte tenu de la rapidité avec laquelle nous devons généralement
prendre les décisions qui dépendent de ce que le système perceptif nous dit
du monde, il est hors de question que ces mécanismes « périphériques »
puissent consulter la totalité des informations pertinentes que l’intelligence
centrale détient éventuellement à son sujet.
Cette autonomie computationnelle rend compte de la récalcitrance de la
perception à la modification par les connaissances d’arrière-plan, mais elle
n’est encore que la moitié de l’explication. Les systèmes périphériques, qui
ressemblent à certains égards à l’intelligence consciente par les opérations
qu’ils effectuent (inférences, jugements) et les capacités qu’ils sollicitent
(mémoire « à court terme », anticipation et planification), s’en distinguent en
revanche toto caelo par la manière dont ils appliquent les règles qui définissent ces opérations.
D’un côté, un comportement peut se conformer à une règle parce que
celle-ci est explicitement représentée, et que l’agent la consulte pour déterminer les actions qu’il s’apprête à entreprendre. C’est le cas, si l’on veut,
pour les règles du rugby, de la conduite automobile, de l’arithmétique ou de
la versification : lors même que, souvent, nous nous y conformons sans nous
y référer consciemment, en vertu de la grande habitude que nous avons
peut-être de pratiquer les activités qu’elles régissent, nous restons capables
d’expliquer pourquoi nous les suivons, de dire à quelle occasion nous les
avons rencontrées pour la première fois ou comment nous les avons apprises,
et, le cas échéant, de les critiquer et de les remplacer par d’autres. En somme,
les règles de ce premier type, disons les règles
explicites, sont conscientes (ou
peuvent le devenir sans trop d’effort), peuvent ne pas être appliquées,
peuvent être modifiées, et doivent être apprises. D’un autre côté, certaines
règles, dites
tacites, sont d’un type très différent : leur application est
inconsciente, obligatoire et rigide, et elles ne font pas l’objet d’un apprentissage (elles sont, si l’on veut, « câblées » en nous, et font partie de notre
équipement natif). Les opérations qui se conforment à de telles règles ne
sont pas explicitement « guidées » par elles, mais purement et simplement
exécutées conformément à elles par le substrat physique ou anatomique
qu’elles concernent, et ce d’une manière qui ne requiert en lui aucune
représentation interne (bien que l’on puisse aisément énoncer la règle selon
laquelle il fonctionne, le tachymètre digital, par exemple, qui affiche tel ou
tel nombre en fonction de la vitesse du véhicule, ne peut pas être dit « obéir »
à une instruction expresse). Des règles de ce genre peuvent être attribuées à
autre chose qu’à des personnes, et notamment elles peuvent être imputées à
des parties ou des sous-systèmes, isolés par analyse, d’êtres intelligents. Bien
qu’elles puissent être modifiées ou rendues inopérantes par des lésions ou
des altérations de l’organisme considéré (l’absorption de drogues étant à cet
égard un exemple typique), elles sont en tout cas, selon l’expression consacrée, « cognitivement impénétrables », c’est-à-dire à la fois inscrutables par
l’introspection directe et insensibles à tout changement dans les croyances
du sujet. Il n’est guère difficile de comprendre pourquoi les règles qui
« équipent » les mécanismes de la perception
[13] doivent être, pour l’essentiel,
de ce type. Si les règles qui régissent les systèmes perceptuels étaient non pas
« encapsulées », mais au contraire re-programmables à l’envie, si le contact
de l’organisme avec l’environnement était lui-même sous l’emprise et le
contrôle de l’intelligence centrale, en bref si tout était « cognitif », l’organisme n’aurait avec le monde aucune interaction causale stable, l’agent serait
un despote dont le seul contact avec l’environnement se ferait par l’intermédiaire d’auxiliaires dociles à ses vues, qui lui diraient obséquieusement les
choses qu’il désire entendre, en sorte qu’il vivrait à tous égards confiné dans
le monde de ses souhaits. L’absurdité – et, en tout cas, l’absence de viabilité
– de cette situation est le plus sûr argument en faveur de la modularité des
systèmes périphériques : dire que l’
Å“il (ou l’oreille) sont en eux-mêmes
« intelligents » constitue, jusqu’à un certain point, une image acceptable de
la situation réelle, mais cette image ne devrait en aucun cas nous entraîner à
supposer, comme il est communément fait aujourd’hui
[14], que l’on voit (ou
que l’on entend) très exactement ce que l’on
croit. Bien que cette mise en
garde soit probablement essentielle pour une compréhension correcte des
processus cognitifs (au sens large), nous allons voir qu’il peut être néanmoins difficile de savoir comment s’y conformer en pratique, dès que l’on en
vient au détail des phénomènes.
2.2. La perception catégorielle. Les systèmes « périphériques » (visuel,
auditif...), on l’a vu, peuvent être conçus comme des « modules » de résolution de problèmes, dont la fonction essentielle consiste, à partir des stimulations reçues par les organes sensoriels, à « calculer » une représentation
cohérente de la source distale de ces stimulations. On pourrait, de cela,
retirer l’impression que les processus computationnels qui assurent le passage de la sensation à la perception consciente comme tel et tel ont pour tâche
principale de
suppléer intelligemment à la pauvreté informationnelle du
stimulus proximal (dans le cas paradigmatique de la vision, des procédures
de calcul interviennent, par exemple, pour reconstituer l’orientation des
surfaces visibles à partir de quelques indices comme la texture lumineuse ou
la nature des contours
[15] ). Mais ce n’est évidemment pas le cas, puisqu’il
serait absurde que l’information relative au stimulus distal puisse être en
quoi que ce soit
enrichie au cours de processus qui se déroulent
après
qu’aient été enregistrées les impressions sensorielles causées par lui, c’est-à-dire à un moment où tout contact « réel » avec l’objet a, éventuellement,
cessé. Bien au contraire, le passage au percept conscient doit être conçu
comme un
appauvrissement de la masse des informations contenue dans les
impressions sensorielles : l’important, après tout, est plutôt de
décroître la
quantité d’informations qu’il s’agira de percevoir consciemment, d’apprendre et de mémoriser, et sur la base de laquelle il faudra ensuite raisonner et
décider. Cette diminution peut être aussi massive que l’on voudra, dans la
limite toutefois où elle reste compatible avec la manière dont l’agent catégorise son environnement. Soient par exemple O et O’deux objets, S(O) et
S(O’) les impressions respectivement produites par ces deux objets dans
l’appareil sensoriel d’un sujet donné, et P(O) et P(O’) les deux percepts
conscients auxquels ces impressions aboutissent après avoir été « traitées »
par les mécanismes périphériques pertinents. La situation dans laquelle ces
mécanismes « appauvriraient » l’information contenue dans les deux stimuli
(supposés
distincts) S(O) et S(O’) au point que les percepts résultants P(O)
et P(O’) en viendraient à être
identiques, cette situation est à tous égards
naturelle et même souhaitable, à la condition toutefois que O et O’n’appartiennent pas à deux catégories elles-mêmes distinctes dans le contexte des
actions où l’agent est habituellement engagé. Le comportement intelligent
réagit identiquement à des situations distinctes, pour autant que les différences qui séparent ces situations ne soient pas
cruciales pour l’objectif qu’il
vise. Sa détermination ne requiert donc pas
tout le stimulus, mais seulement
l’
appartenance catégorielle du stimulus. Or traiter comme identiques des
choses différentes revient à négliger l’information relative à ce qui les
distingue, et il est à cet égard plus approprié de ne
jamais acquérir cette
information superfétatoire (« intra-catégorielle ») que de l’enregistrer pour
l’écarter
ensuite par une décision expresse. Pour autant, par exemple, que
notre comportement d’évitement et de survie – l’un de ceux, donc, qui
demandent à être engagés avec le plus de célérité – soit concerné, un essaim
de 164 abeilles est, si l’on ose dire, convenablement similaire à un essaim qui
n’en compte que 163, en sorte qu’une ergonomie optimale voudrait que nous
les percevions simplement comme une assemblée de nombreuses abeilles,
donc à fuir, plutôt que de les percevoir selon leur quantité exacte et d’« appliquer » ensuite la règle pertinente parmi une infinité de règles mémorisées
(..., « essaim de 163 abeilles : à éviter », « essaim de 164 abeilles : à éviter »,
...)
[16]. On doit donc s’attendre à ce que les systèmes périphériques procèdent
d’eux-mêmes aux appauvrissements appropriés dans la richesse informationnelle du stimulus. Ce qui est étonnant n’est pas qu’ils le fassent, mais
que dans nombre de cas ils le fassent si massivement et si tôt, au point même
d’altérer et de rendre radicalement inaccessibles les informations que l’on
pourrait s’attendre à voir enregistrées par les organes sensoriels, compte
tenu de la nature de la scène perçue et des capacités objectives (physiologiquement déterminées) de discrimination de ces organes.
Lors même que la transition de l’objet perçu (stimulus distal) au percept
conscient est généralement conçue comme un processus en deux étapes,
dont la première, de nature purement psycho-physique, conduit à la production des effets sensoriels de l’objet sur les capteurs (stimulus proximal), et
dont la seconde, de nature proprement interprétative, conduit de ces données sensorielles brutes à la perception de l’objet comme tel et tel, l’analyse
de certains types de perception, au premier rang desquels la perception des
sons parlés, montre qu’une distinction aussi tranchée entre le psycho-physique et le « mental » est insoutenable, et que nous devons probablement
renoncer, au moins dans ce domaine, à l’idée même de données sensorielles
pures de toute interprétation. Ainsi qu’on l’a constaté dès les années 1950,
l’audition même du discours parlé est en effet « catégorielle », c’est-à-dire
que ce stimulus sonore continu est d’emblée appréhendé en fonction des
catégories phonétiques de la langue. Le phénomène a été particulièrement
bien mis en évidence à propos de la perception des consonnes occlusives. La
différence acoustique entre les sons /ba/ et /pa/ tient pour l’essentiel à
l’instant où interviennent les vibrations laryngiennes après le relâchement
de l’occlusion : d’emblée dans le premier cas, de façon différée dans le
second. Ne retenant pour seule dimension de variation du stimulus que cet
instant de début de voisement (VOT, pour Voice Onset Time), on peut
synthésiser un continuum de sons dans lequel ce paramètre varie, par
exemple, de 10 à 80 millisecondes, c’est-à-dire d’une réalisation canonique
de /ba/ à une réalisation canonique de /pa/. L’auditeur est alors placé
devant deux tâches. La tâche d’identification consiste à catégoriser comme
/ba/ ou comme /pa/ un ensemble de sons successifs extraits de ce continuum. La tâche de discrimination est la suivante : étant donnés des triplets
(A, B, X) de sons successifs extraits du continuum, triplets dans lesquels A et
B sont distants, par exemple, de 10 µs, et où X est ou bien A ou bien B, on
demande à l’auditeur d’indiquer si X est A ou B. En l’absence du phénomène de perception catégorielle, les résultats de ces épreuves devraient être
du type suivant :
Figure 2a
Taux attendu d’identification comme /ba/
Figure 2b
Taux attendu de discrimination entre paires de stimuli équidistants
D’une part (Fig. 2a) l’identification du stimulus comme /ba/ devrait linéairement décroître avec l’augmentation du VOT, d’autre part (Fig. 2b) la
réussite au test ABX, qui met en jeu la capacité de discriminer des paires de
stimuli équidistants, devrait demeurer constante, au titre de fonction d’une
capacité de discernement « purement auditive », ne mettant en jeu que le
fonctionnement psycho-physique de l’appareil sensoriel (loi de Weber). Or
tel n’est nullement le cas, et les données massivement attestées depuis
l’article séminal de Liberman
& alii
[17] montrent que la situation réelle est au
contraire la suivante :
Figure 3a
Taux effectif d’identification comme/ba/
Figure 3b
Taux effectif de discrimination de stimuli équidistants
D’une part (Fig. 3a) les stimuli sont massivement perçus comme /ba/ ou
/pa/ selon qu’ils sont d’un côté ou de l’autre de la frontière qui sépare les
deux catégories. D’autre part et surtout (Fig. 3b), les capacités de discrimination s’exercent différemment selon que les deux stimuli comparés appartiennent ou non à la même catégorie : des différences acoustiques de même
ampleur sont sensibles au voisinage de la frontière inter-catégorielle,
lorsqu’elles mettent en jeu des stimuli de catégories distinctes, alors qu’elles
demeurent imperceptibles lorsqu’elles impliquent des stimuli de même
catégorie, et notamment au voisinage des réalisations canoniques de /ba/ et
de /pa/. En d’autres termes, la connaissance des propriétés physiques du
signal sonore (stimulus distal), jointe à la connaissance des capacités discriminatives de l’appareil auditif, ne suffit pas pour prédire la nature du son
perçu. Même au niveau le moins « traité », celui de la sensation sonore, il n’y
a rien qui soit le simple enregistrement de l’impact de l’environnement sur le
système perceptif, et rien à propos de quoi l’on pourrait parler de donnée
pure de toute activité d’interprétation ou de catégorisation.
S’agissant du discours parlé, la perception catégorielle est une solution
éminemment économique aux difficultés qui peuvent résulter du contraste
entre le caractère continu du signal sonore et le caractère discret des oppositions linguistiques pertinentes (la possibilité de déformer continûment
/bier/ en /pier/ n’a évidemment aucune contrepartie sémantique du côté
du référent des mots « bière » et « pierre »). L’impossibilité de discriminer
auditivement les stimuli situés dans le continuum intra-catégoriel maximise
la stabilité acoustique par rapport à la variabilité du signal, puisque le seul
paramètre perçu est celui de l’appartenance catégorielle, et que les autres
sont purement et simplement ignorés dès le stade de la sensation. Réciproquement, puisque les stimuli sont, avec une très haute probabilité, identifiés
par l’auditeur comme /b/ ou comme /p/ selon qu’ils se situent d’un côté ou
de l’autre de la frontière inter-catégorielle, le locuteur a l’assurance d’être
compris même si son émission sonore est objectivement assez éloignée du
/b/ ou du /p/ canonique. Cette économie considérable, à la fois dans la
reconnaissance et dans la production du signal, est le résultat d’une catégorisation qui reflète l’articulation phonématique de la langue, et qui est donc
susceptible de varier d’une langue à l’autre : ce qui est entendu (et non pas
seulement, donc, la manière dont ce qui est entendu est interprété) dépend
largement de la langue maternelle des sujets
[18].
Libermann et ses collaborateurs expliquent ce phénomène de perception catégorielle en postulant que les sons continus du discours parlé
sont rapportés par l’auditeur à l’ensemble discret des configurations articulatoires (position de la langue, des lèvres, etc.) qui en régissent la production : les sujets tendent à oblitérer la différence entre sons dont ils se
représentent l’articulation comme semblable, et à creuser la différence entre
sons qu’ils se représentent comme le résultat de gestes articulatoires distincts. Ceci expliquerait très bien, par exemple, que la discrimination auditive des stimuli du continuum /ra/-/la/ ne présente chez les locuteurs
japonais aucun « pic » caractéristique : ces locuteurs entendent « également »
le continuum en question, car ils n’ont jamais à produire la distinction
entre /ra/ et /la/, puisque cette opposition n’est pas pertinente dans leur
langue.
Compte non tenu d’un certain nombre d’objections techniques dans le
détail desquelles nous ne pouvons pas entrer ici, cette théorie « motrice » est
aujourd’hui en passe de succomber sous un ensemble impressionnant de
contre-arguments généraux. D’une part, cette théorie avait été expressément
construite pour rendre compte de la perception du discours parlé, que l’on
croyait à l’époque être le seul cas de perception catégorielle, et elle semble
incapable d’expliquer les autres cas de perception de ce type, comme la
perception des sons musicaux. Ainsi, les musiciens entraînés perçoivent les
hauteurs catégoriquement (un
la est entendu directement, « absolument »,
comme
la), et nombre de travaux plus récents, comme ceux de Burns et
Ward
[19], montrent que leurs performances en matière de discrimination
présentent les irrégularités caractéristiques de la perception catégorielle
[20] :
les sons sont mieux différenciés au voisinage des bornes entre intervalles
bien tempérés qu’à l’intérieur de ces intervalles. On pourrait évidemment
essayer d’
étendre la théorie motrice à ces phénomènes, en expliquant
en
général les phénomènes de perception catégorielle par une sorte de
congruence entre perception et production. Dans une telle hypothèse, nous
appréhenderions les sons musicaux, les gestes de l’autre ou les expressions
de son visage, etc., en nous référant à la manière dont nous les produirions
pour notre propre compte. Mais cette hypothèse semble empiriquement
réfutée, au moins sous sa forme la plus générale, par les données relatives aux
créatures (enfants pré-verbaux, primates) dont la perception possède tous
les traits caractéristiques de la catégorialité alors même qu’elles sont évidemment incapables de produire eux-mêmes les stimuli pertinents. Comme
l’écrit par exemple St. Walker
[21] après avoir passé en revue les études
consacrées à la perception du discours parlé chez les primates, le fait que les
singes rhésus se montrent aptes à détecter la différence entre consonnes
voisées et non voisées suggère bien que « l’expérience consistant à produire
soi-même des sons, bien qu’elle soit indubitablement de quelque aide, n’est
en aucune façon nécessaire pour parvenir aux discriminations phonétiques
de base ». La perception catégorielle, en d’autres termes, ne semble pas
reposer sur la représentation interne ou sur la maîtrise pratique des facteurs
physiologiques capables de produire des événéments semblables aux événements ainsi perçus.
Ces considérations invitent à se rabattre sur une théorie d’allure
« conventionnaliste », dans laquelle les phénomènes de perception catégorielle ne seraient plus expliqués par l’existence d’une relation
naturelle –
comme la contrainte articulatoire – entre les stimuli et les catégories dans
lesquelles ils sont distribués. Dans une variante défendue en particulier par
Lane
[22], les catégories en question auraient simplement leur origine dans le
fait que l’on a
appris aux sujets à classifier les stimuli ainsi, hypothèse qui
semble largement confirmée par les expériences de Burns et Ward : pour
autant que la perception des intervalles soit concernée, l’apprentissage serait
capable d’induire une « catégorification » de la perception (on passe progressivement de courbes du type de la figure 2 pour les novices à des courbes du
type de la figure 3 pour les musiciens entraînés). Ceci semble suggérer que la
plasticité de l’organisation perceptive serait en quelque sorte sans limites,
c’est-à-dire pourrait conduire à une catégorisation
quelconque, à la
seule
condition que le sujet soit exposé à des stimuli appropriés en quantité
suffisante. L’hypothèse semble pouvoir s’autoriser d’une loi d’« adaptation
sélective », selon laquelle les frontières inter-catégorielles se rapprochent des
valeurs représentées par le stimulus répété (dans le cas du continuum
/ba/-/pa/, par exemple, on constate qu’un sujet auquel a été présenté
répétitivement l’un des stimuli extrémaux, disons le /pa/ canonique, fait
preuve ensuite des performances d’identification et de discrimination caractéristiques d’une perception catégorielle dans laquelle la frontière s’est
déplacée vers la droite du spectre
[23] ).
Mais une telle conclusion est évidemment hâtive : une chose est de dire
(ce qui semble aujourd’hui à peu près acquis) que les catégories n’ont pas de
fondement naturel dans l’activité motrice, autre chose est de dire que les
processus de catégorisation perceptive reposent seulement sur des mécanismes
généraux d’apprentissage opérant sur une structure initiale amorphe et
arbitrairement malléable. Car la perception catégorielle suppose non seulement des capacités
générales de discrimination sensorielle suffisamment
fines, mais également des récepteurs neuro-sensoriels répondant très
sélectivement à des domaines bien délimités de valeurs acoustiques. En d’autres
termes, le fait que le tracé des frontières catégorielles puisse évoluer sous
l’influence de l’environnement et de l’apprentissage est
pour le moins compatible avec l’existence de dispositifs innés spécialisés dans le traitement des
stimuli ainsi catégorisés. Du reste, la réalité de tels mécanismes modulaires
innés peut être attestée, dans certains cas, par l’existence d’une catégorisation initiale universelle. Un exemple classique (Fig. 4) est celui du VOT, qui
est identiquement catégorisé de la façon suivante par les enfants préverbaux
issus de collectivités linguistiques diverses : une première frontière correspondant à un VOT négatif (-30µs), et l’autre vers 30µs
[24].
Figure 4
La catégorisation universelle du VOT chez les enfants préverbaux
La question de savoir quel est,
en général, le type d’argument qui devrait
nous conduire à postuler l’existence de tels mécanismes modulaires dans les
cas de perception catégorielle est actuellement disputée
[25] : il est clair que la
prolifération inattendue de ces cas doit rendre circonspect, si l’on veut éviter
de supposer que nous naissons équipés d’une jungle de mécanismes spécialisés. Une discussion de ce genre serait sans nul doute mieux assurée si l’on
possédait, à propos de la perception des sons non parlés, une variété de
données et d’analyses comparable à celle dont on dispose aujourd’hui à
propos de la perception des signaux auditifs linguistiques.
2.3. De la perception à l’interprétation. H. von Helmholtz, qui fut au
XIX
e siècle le premier théoricien systématique des « inférences perceptives »
et qui est souvent tenu pour l’un des précurseurs de tout premier plan des
sciences cognitives
[26], considérait en romantique convaincu que la psycho-logie devait essentiellement mettre l’accent sur l’activité créative de l’esprit,
et il concevait, par exemple, la perception comme une
Å“uvre d’interprétation plutôt que comme la réception passive d’un donné. D’une certaine
manière, on pourrait donc soutenir que la théorie cognitiviste de la perception dont on vient d’indiquer quelques caractéristiques prend sa source dans
l’alliance improbable de l’informatique contemporaine et du romantisme
allemand. Mais Helmholtz considérait aussi que les « perceptions artistiques » n’étaient pas elles-mêmes fondamentalement distinctes des perceptions sensorielles : à l’en croire, les deux, parce qu’elles « viennent sans
peine » et qu’elles « apparaissent soudainement, sans que leur possesseur
sache d’où elles leur viennent », sont des produits typiques de l’activité
inconsciente de l’esprit
[27]. Or il est plus malaisé de discerner dans le « champ
cognitif » contemporain un écho de cette affirmation, selon laquelle, par
exemple, la perception sensorielle de l’
Å“uvre (comme matériau) et sa perception comme structure artistique sont issues du
même travail mental
inconscient. C’est par une remarque très générale touchant cette thèse que je
voudrais néanmoins terminer cet article.
On pourrait, me semble-t-il, distinguer entre deux conceptions opposées
des rapports entre la perception sensorielle et la perception symbolique,
conceptions que je qualifierai, faute de meilleurs mots, l’une de « relativiste »
et l’autre de « modulariste ». Le relativisme insiste sur l’idée que c’est la
même
chose qui est à la fois éprouvée et interprétée, alors que le modularisme voit la perception symbolique comme une activité qui commence là où
la perception sensorielle s’achève (les conceptions effectivement défendues
par tel ou tel théoricien sont probablement des amalgames diversement
dosés entre ces deux thèses « idéales », mais on voit sans peine, s’il faut des
noms, que N. Goodman
[28] et R. Jackendoff
[29] pourraient respectivement
convenir). Bien que la discussion soit sans doute rarement conduite en des
termes aussi nets et, encore une fois, que tout ceci doive plutôt être pris
comme une simple « reconstruction rationnelle », le point de désaccord est le
suivant. Le relativisme prend
toujours à la lettre les expressions du type
« voir (ou entendre) telle ou telle chose comme X », c’est-à-dire qu’il admet
sans limite la possibilité d’influences « descendantes » (
top-down) du « cadre
conceptuel » sur l’expérience sensorielle elle-même : à l’en croire, ce qui est
vu ou entendu est, en vertu de mécanismes généraux, littéralement sous la
dépendance des croyances et de la manière de catégoriser. Le modularisme,
à l’opposé, soutient que la pénétration de ces influences est limitée, que des
phénomènes comme celui de la perception catégorielle des sons parlés, dans
lesquels la sensation sonore est partiellement sous l’emprise de la catégorisation phonématique particulière à l’auditeur, sont des expériences exceptionnelles qui mettent en jeu des mécanismes spécifiques, et qu’au total la
perception sensorielle se montre au contraire remarquablement « objective », c’est-à-dire en définitive très récalcitrante à l’altération par les croyances et l’organisation conceptuelle du sujet particulier qui perçoit : comme
l’écrit Jackendoff, l’expérience musicale, par exemple, est « informationnellement encapsulée », ce qui signifie, entre autres, que les informations
extérieures qui concernent l’
Å“uvre écoutée n’ont aucun effet sur l’écoute
elle-même (le fait de savoir que la
Symphonie Héroïque a été, à l’origine,
dédiée à Napoléon, peut être pertinent pour l’analyse de l’
Å“uvre, mais n’a
aucune incidence sur
ce qui est perçu lors de l’une de ses exécutions)
[30].
La controverse ainsi définie concerne l’une des questions ouvertes des
sciences cognitives contemporaines, celle de l’étanchéité de la distinction
entre perception et « cognition ». La manière dont cette question est
aujourd’hui posée est indiscutablement de nature à renouveler la réflexion
philosophique traditionnelle sur la nature et l’immédiateté des sense data,
en lui conférant la précision et la testabilité qui lui manquent trop souvent.
[1]
J’emprunte l’exemple à la thèse de O. SIGAUD,
Apprentissage : de la commande au
comportement, (Université de Paris-XI, 1996).
[2]
Naturellement, cette règle se situe, pour ainsi dire, en amont de la distinction traditionnelle entre les diverses « facultés » constitutives de l’intelligence, puisque les états internes
auxquels elle fait référence peuvent être indifféremment interprétés en termes de
mémoire (on
est dans l’état F si l’on se rappelle avoir ouvert la boîte), de
jugement (on est dans l’état F si l’on
juge que l’objet est déjà dans la boîte) ou de
planification (on est dans l’état F si le scellement de
la boîte est la prochaine action dans l’agenda).
[3]
Cette distinction de niveaux explicatifs est développée par D. Marr dans son ouvrage
Vision, Freeman & Co, 1982, p. 22
sq.
[4]
Un tel programme ne doit être considéré comme une explication adéquate que si, en
outre, sa durée d’exécution est comparable au temps mis par les individus à élaborer leurs
réponses à partir des entrées considérées, et s’il existe par ailleurs des indices montrant que
l’algorithme utilisé par le programme est le même que celui auquel se conforme l’activité
mentale étudiée.
[5]
« Le mouvement centrifuge [du champ de conscience] le porte à son « ex-centricité » en
l’opposant au milieu où foisonnent et bouillonnent ses tendances appétitives. » (H. EY,
La
conscience, P.U.F., 1968, p. 333).
[6]
Une distinction analogue est celle que trace N. GOODMAN (
Languages of Art, Hackett
Publ., 2
e éd., 1976, p. 27
sq.) entre l’image d’un cheval noir et l’« image-d’un-cheval-noir »
(
black-horse picture), qui représente
identifiablement son objet comme un cheval noir.
[7]
Cf. par exemple
Dioptrique, A.T., 140,
Oeuvres Philosophiques I, Garnier, 1963, p. 709-710.
[8]
Loc. cit., A.T. 137-138, Garnier, p. 707.
[9]
De la Recherche de la Vérité, I, VII, V, in
Oeuvres I, Bibliothèque de la Pléiade, 1979,
p. 70.
[10]
Cf. sur ce point J. FODOR,
The Modularity of Mind, M.I.T. Press, 1983, trad. française
La modularité de l’esprit, éditions de Minuit, 1986, p. 75-77.
[11]
Op. cit., Dernier éclaircissement, § 26, p. 1087.
[12]
Pour une discussion détaillée de cette question, cf J. FODOR,
op. cit., notamment p. 87
sq.
[13]
A en croire les linguistes de la tradition chomskyenne, les règles sous-jacentes à
l’activité linguistique sont, elles aussi, du même ordre (la référence sur ce point est : J. FODOR,
op. cit. p. 63
sq.).
[14]
Cf. par exemple N. Goodman : « L’
œil ne fonctionne pas comme un instrument
autonome et indépendant, mais comme un membre obéissant d’un organisme complexe et
capricieux. C’est ce que l’on voit, et non pas seulement comment l’on voit, qui est réglé par le
besoin et le préjugé » (
op. cit., p. 7).
[15]
La théorie computationnelle de la vision proposée par D. Marr (
op. cit.) constitue à
maints égards la meilleure illustration de ce point.
[16]
Naturellement, nous nous plaçons ici dans le cas où chaque abeille est « disponible à la
perception visuelle », c’est-à-dire où l’angle de vision est tel que chacune est isolément visible
(aucune, par exemple, ne masque l’autre) : il est bien question de l’appauvrissement de
l’information effectivement enregistrée par les organes sensoriels, et non de l’incapacité « objective » éventuelle de ces organes à être « impressionnés » par la totalité du stimulus distal.
[17]
A.M. LIBERMAN, F.S. COOPER, D.P. SHANKWEILER & M. STUDDERT-K ENNEDY, « Perception of the Speech Code »,
Psychological Review, 74,1967, p. 431-461.
[18]
On ne peut ici que renvoyer à la littérature comparativiste (et en particulier à L. LISKER
& A.S. ABRAMSON, « The Voicing Dimension : Some Experiments in Comparative Phonetics »,
in
Word, 20,1964, p. 384-422) : les frontières de voisement diffèrent pour les anglophones
(30 µs) et pour les francophones (0 µs), et plus encore pour les locuteurs thaï, qui tracent quant
à eux
deux frontières dans le continuum, dont l’une correspondant à un VOT négatif (- 20 µs).
Cette dernière répartition du voisement, qui répond à une autre organisation phonologique de
la langue (cf N. CHOMSKY & M. HALLE,
Principes de phonologie générative, Seuil, 1973, p. 167,
Tableau VIII) semble en outre assez voisine de la catégorisation universelle « initiale » décrite
par J. MEHLER & J. BERTONCINI, « Infant’s Perception of Speech and Other Acoustic Stimuli »,
Infant Behavior and Development, 2,1980.
[19]
Par exemple E.M. BURNS & W.D. W ARD, « Categorical Perception – Phenomenon or
Epiphenomenon : Evidence from Experiments in the Perception of Melodic Musical Intervals »,
Journal of the Acoustical Society of America, 63,1978, p. 456-468. Cf. aussi, à propos
de la perception du rythme, l’étude citée de J. Mehler & J. Bertoncini : dans un continuum de
600 µs borné par deux battements à chaque extrémité et contenant un battement intermédiaire
variable, la perception est catégorielle avec deux frontières (les trois classes invariantes dans
lesquelles sont rangées le battement variable sont : « même que 1 », « entre 1 et 2 », « même que
2 »).
[20]
L’élargissement de la gamme de stimuli entraîne par ailleurs une baisse dans la capacité
d’identification, qui est donc naturellement moins élevée que dans les cas « purs » de perception
catégorielle.
[21]
Animal Learning, Routledge & Kegan Paul, 1987, p. 289.
[22]
H. LANE, « Motor Theory of Speech Perception : A Critical Review », in
Psychological
Review, LXXII, 1965, p. 275-309.
[23]
P.D. E IMAS & J.D. CORBITT, « Selective Adaptation of Linguistic Feature Detectors »,
Cognitive Psychology, IV, 1973, p. 99-109.
[24]
Cf J. MEHLER & J. BERTONCINI,
loc. cit. Ce tracé initial est radicalement modifié par
l’apprentissage, puisque l’existence de deux frontières de voisement répond à une organisation
phonologique de la langue qui n’est que rarement attestée (la langue thaï est un exemple,
cf. N. CHOMSKY & M. HALLE,
Principes de phonologie générative, Seuil, 1973, p. 167, Tableau
VIII), et la plupart du temps le tracé final n’en contient qu’une (par exemple à 30 µs pour les
anglophones, et 0µs pour les francophones).
[25]
Pour une discussion pénétrante, cf. encore J. FODOR,
op. cit., p. 69
sq.
[26]
Cf. notamment R.L. G REGORY,
The Intelligent Eye, Weidenfeld & Nicholson, Londres, 1970. Sur Helmholtz, cf. aussi J. BOUVERESSE,
Langage, perception et réalité I. La
perception et le jugement (éd. J. Chambon, 1995, p. 35-231) et Theo. C. MEYERING,
Historical
Roots of Cognitive Science, Kluwer Academic Press, 1989, p. 109
sq.
[27]
H. VON HELMHOLTZ,
Vorträge und Reden II, Friedrich Vieweg & Sohn, Braunschweig,
5° édit., 1903, p. 344.
[28]
Op. cit., cf. la citation de la note 14 ci-dessus.
[29]
Consciousness and the Computational Mind, M.I.T. Press, 1987, en particulier le
chap. XII, ainsi que (avec F. Lerdahl),
A Generative Theory of Tonal Music, M.I.T. Press,
1983.
[30]
Op. cit., p. 262.