2001
Diogène
Mémoires Externes
Hypertexte, Traces et Agents
Guy Boy
[*]
(EURISCO.)
Les “ mémoires externes ” posent le problème du contexte : “ des mémoires externes à quoi ? ” Mémoire externe est un terme technique qui dénote tout ce qui peut être mémorisé dans l’environnement d’un individu. D’une manière générale, j’ai décidé de conserver les termes techniques qui caractérisent le champ du sujet traité. C’est Ted Nelson qui a forgé le mot hypertexte en 1967 pour désigner l’écriture non-séquentielle, ainsi qu’une technologie informatique, permettant à l’utilisateur de se déplacer librement en utilisant des liens logiciels. J’utiliserai le terme logiciel, software en anglais, pour désigner des programmes informatiques. La publication assistée par ordinateur est née avec le système Xanadu développé par Nelson. Au niveau le plus bas, un hypertexte est un système de gestion de bases de données qui permet à l’utilisateur de connecter des écrans d’informations en utilisant des liens associatifs. C’est une combinaison de textes interconnectés par des branchements interactifs. Ces présentations dynamiques de textes non-linéaires ne pourraient pas être imprimées sur une page conventionnelle. L’hypertexte permet d’assurer la traçabilité de la genèse d’une information. Dans ce chapitre, traçabilité est synonyme d’explication : “ Pourquoi cet équipement a-t-il été conçu de telle manière et pas de telle autre ? ”. Il s’agit de retrouver la trace du processus de conception qui a conduit au concept final de l’équipement. Les explications requises sont souvent nécessaires longtemps après les décisions prises, c’est la raison pour laquelle la traçabilité est une question de mémoire. Le terme agent est souvent utilisé pour désigner certains membres d’une communauté qui agissent en son nom. Il y a les agents d’une entreprise ou d’une administration. Il y a les agents biologiques. Dans un monde non-technologique, la traçabilité est idéalement assurée par des agents humains qui expliquent à d’autres agents humains. Le terme agent a été étendu au niveau informatique pour désigner des logiciels à qui l’utilisateur délègue, parfois sans le savoir, des tâches plus ou moins complexes. On parle alors d’agents logiciels. Dans ce texte, je parle d’agent au sens large. Il faut comprendre acteur ou entité qui est capable d’agir dans un contexte restreint, avec un rôle très spécifique et des ressources adaptées.
Je me souviens de ces soirées des années soixante au coin du feu dans la campagne du Quercy. Les femmes tricotaient. Les hommes nettoyaient leurs fusils de chasse. Les enfants jouaient aux chevaux, un jeu de société très populaire dans cette région. J’écoutais les discussions. On parlait de la journée, des élections, des récoltes difficiles cette année-là et de tous ces sujets habituels. On critiquait, on disait du mal des voisins, on buvait de la tisane. Je me souviens de certains proverbes comme “ rouge au couchant demain beau temps ”, parce qu’il fallait prévoir si, demain, on allait aller aux champs ou continuer les travaux de l’étable. Ces paysans utilisaient ces arts de la mémoire de façon naturelle, sans théorie. Tout semblait si intégré. Cela fonctionnait très bien. Longtemps après ces épisodes de mon enfance, je repense à ces vielles femmes qui discutaient des souvenirs à la veillée : elles étaient la mémoire de la communauté. Rien n’était noté. On n’en avait pas besoin. Cette mémoire était vivante puisqu’elle était discutée régulièrement. Son champ était certes limité, mais quelle profondeur ! Chacun avait son propre savoir
[1] sur un domaine. On savait que Jérémie connaissait bien la vigne et ses maladies, il avait connu le mildiou qui avait ravagé les vignes au début du siècle. On savait que Constant était un chasseur hors pair, et bien qu’il ait été assez jaloux des gîtes de lièvre repérés cet été-là, on espérait qu’il allait nous dire ses secrets de la chasse au lièvre. On savait qu’un tel connaissait bien telle chose, on allait le consulter. Tous participaient à cette mémoire externe sur laquelle chacun pouvait s’appuyer le moment venu. Ces paysans ne connaissaient pas le taylorisme industriel, l’organisation hiérarchique et l’isolement des villes. Ils étaient contraints à s’aider, à coopérer et à coordonner certains travaux comme les dépiquages pour assurer une efficacité suffisante.
Trente ans plus tard, la campagne s’est vidée. Internet est arrivé. Depuis ma maison de cette région ancestrale de mon enfance, je suis connecté avec le monde. Je consulte mes courriers électroniques. J’envoie un message à un ami parce que je sais qu’il connaît bien le sujet qui me préoccupe : je suis en train de terminer un rapport sur un projet d’automatisation d’un poste de pilotage d’avion, et je dois en donner les perspectives d’acceptation par un groupe d’utilisateurs. Mon ami est sociologue, spécialiste de l’évolution des nouvelles technologies et de l’émergence de nouvelles pratiques. J’utilise ce nouveau médium de communication à l’intérieur d’une communauté que l’on appelle aujourd’hui l’interaction homme-machine. C’est l’un de mes villages. Ces villages sont composés d’hommes et de femmes, bien sûr, mais aussi d’agents logiciels par l’intermédiaire de l’Internet. Ces agents logiciels sont des programmes informatiques permettant une recherche rapide d’informations, par exemple. Le fait de placer les hommes et les femmes au même niveau que les agents logiciels peut choquer, mais l’évolution des techniques actuelles de l’informatique m’oblige à oser cette juxtaposition. Ces agents logiciels sont des esclaves technologiques modernes plus ou moins bien développés, dont on comprend plus ou moins bien le comportement et qui, lorsqu’ils sont bien utilisés, peuvent faciliter la vie de leurs utilisateurs. L’interactivité, artificielle certes, de ces agents logiciels, associés à des bases documentaires énormes, fait d’Internet une mémoire externe analogue à celle des paysans du village quercinois de jadis. Je vais essayer d’expliquer comment de tels villages, virtuels par la technologie informatique qui leur sert de support, sont bien réels par les connaissances qui y sont échangées.
Il existe un facteur d’échelle considérable entre ces deux types de mémoires externes. Cependant, la capacité cognitive de l’être humain est toujours aussi limitée. L’accès à la mémoire externe était souvent meilleur dans le village ancestral parce que les hommes et les femmes qui la détenaient étaient disponibles. Ils pouvaient même proposer spontanément des solutions sans qu’il soit nécessaire de mettre en Å“uvre des processus de recherche complexes. Les habitants du village avaient appris à construire des outils de repérages cognitifs pour explorer et exploiter leurs mémoires externes. Nous appellerons ces outils des cartes cognitives qui permettent d’articuler les échanges d’information entre ceux qui cherchent et ceux qui savent. Aujourd’hui, avec l’utilisation des nouvelles technologies de l’information et de la communication, de nouveaux types de cartes cognitives émergent. Dans le village ancestral, l’accès à l’information utile et l’acquisition des cartes cognitives étaient assistés par les anciens, ceux qui savaient et qui savaient faire. Dans les villages virtuels d’aujourd’hui, des processus de pilotage de l’accès aux informations pertinentes sont disponibles, même s’ils doivent être améliorés. Ces processus sont représentés par des moteurs de recherche ou des portails par exemple.
Les nouvelles technologies de l’information et de la communication ont introduit des mémoires externes dont le support est l’hypertexte. La technologie de l’hypertexte a été développée à partir d’un modèle cognitif de la connectivité largement basé sur la notion d’extension des capacités cognitives humaines et plus spécifiquement de la mémoire associative. La systématisation de ces mémoires externes a introduit de nouvelles possibilités d’accès à l’information, et a notamment promu la notion de traçabilité. Cette systématisation a permis de mettre à plat des relations sémantiques et pragmatiques au sein des mémoires associatives résultantes humaines et machines. L’être humain a toujours autant besoin d’appui externe pour accéder aux informations dont il a besoin et, finalement, résoudre ses problèmes. J’introduirai la notion d’appui cognitif pour relayer l’utilisation de l’hypertexte dans un monde connu et rassurant.
Les supports technologiques modernes des mémoires externes doivent prendre en compte la notion de contexte. En particulier, lorsque l’indexation des connaissances stockées est contextualisée, elle offre aux utilisateurs non seulement des processus de recherche plus pertinents et rapides, mais aussi des moyens accrus d’aide à la compréhension. La contextualisation des connaissances est un processus itératif que les technologies modernes permettent de prendre en compte. J’en donnerai un exemple. En contextualisant, on augmente les connaissances déjà disponibles par des indices, des relations et des commentaires qui en renforcent la pertinence. Le savoir est ainsi reconstruit en permanence. C’est en l’annotant, en ajoutant des points de vue, que le savoir à la fois se particularise et se généralise. Des catégories émergent progressivement, ou disparaissent parce qu’elles ne sont plus intéressantes et deviennent obsolètes. L’intelligence artificielle a introduit des représentations permettant de stocker les connaissances et de les catégoriser d’une certaine manière. L’utilisation de ces connaissances formalisées a mis en évidence la notion de fonction cognitive étendue à des machines. L’étude de la congruence des fonctions cognitives humaines et machines est aujourd’hui un problème central. Ces fonctions cognitives sont progressivement co-construites par les hommes, les organisations et le monde technologique. Les relations causales entre ces fonctions ne peuvent être construites que dans l’action et l’interaction.
L’utilisation des nouvelles technologies de l’information et de la communication a fait émerger une controverse entre les protagonistes de la manipulation directe et ceux des agents logiciels. Pour bien comprendre cette controverse, il convient de distinguer interaction et tâche. Le premier point de vue fait la promotion des interfaces homme-machine facilitant l’interaction laissant le contrôle de la tâche à l’utilisateur de la machine. Les interfaces les plus conviviales consistent en une automatisation forte des modes d’emploi de la machine. Le second point de vue fait la promotion de programmes modulaires assistant l’utilisateur dans l’exécution de la tâche ; une tâche de recherche d’informations par exemple. Les interfaces correspondantes sont qualifiées de profondes et consistent en une automatisation forte des procédures opérationnelles servant de support à l’exécution de la tâche. Lorsque la machine a pour mission de connecter un utilisateur à une mémoire externe, les deux solutions peuvent être considérées de concert. Ces technologies offrent un nouveau support à la connectivité. La connectivité propre aux communautés ancestrales était bien établie et répondant à des usages bien intégrés. On y privilégiait la convivialité autant que l’assistance à l’exécution des tâches. Les communautés de pratiques d’aujourd’hui construisent de nouveaux codes de communication à la fois dans l’espace et dans le temps, et entre des agents humains et machines.
Hypertexte : un modèle cognitif de la connectivité. Un peu d’histoire
Le terme hypertexte est relié au terme “ espace hyperbolique ” introduit dès le xviiie siècle et popularisé par le mathématicien F. Klein au xixe siècle. Klein utilisait le mot hyperespace pour décrire une géométrie à plusieurs dimensions. Les processus mentaux humains ont été modélisés par de tels espaces multidimensionnels. Vannevar Bush, qui était le Conseiller Scientifique du Président Roosevelt, a conçu en 1945 une nouvelle façon d’organiser et de retrouver des informations. Cette vision nouvelle l’a conduit à une machine appelée Memex. L’idée de base était de permettre à quiconque de se déplacer dans une bibliothèque et d’établir des liens associatifs entre n’importe quelle référence de cette bibliothèque. Douglas Engelbart a été le premier chercheur influencé par les concepts de Bush. Les premiers travaux d’Engelbart à la NASA, puis au Stanford Research Institute (SRI), portaient sur la notion d’augmentation de l’intellect humain. Afin de naviguer rapidement dans un système d’intelligence augmentée, Engelbart a inventé la souris comme outil de pointage.
Au début des années 60, Engelbart et ses collaborateurs ont conçu et développé le “ système en-ligne ” NLS (
oN-Line System). Ce système a été présenté publiquement lors de la convention ACM
[2] de 1968. Dans sa forme initiale, il a été utilisé comme : un système de stockage de mémos, de notes de recherche et de documentation en général ; un réseau de communication depuis que la téléconférence en ligne est possible ; un espace de travail partagé dans lequel des chercheurs pouvaient planifier et concevoir des projets. Engelbart disait en 1963 que NLS était “ un bon moyen d’intercommunication par l’intermédiaire de consoles ”. NLS était un précurseur des systèmes de bureautique et de courrier électronique. NLS a été renommé
Augment pendant que Douglas Engelbart était chez McDonnell–Douglas dans les années 70. Il convient de mentionner que les
systèmes de travail coopératif assistés par ordinateur, dont on parle aujourd’hui, ont été introduits par Engelbart. Plus récemment, Engelbart a lancé un projet sur le travail coopératif connu sous le nom de projet
bootstrapping à l’Université de Stanford. Ce projet consiste à développer un système ouvert d’hyperdocuments dans le but d’optimiser les capacités des organisations afin qu’elles puissent devenir de véritables organismes sociaux au sens biologique et évolutionniste. Engelbart et English ont signalé en 1968 que les utilisateurs étaient satisfaits de NLS, même s’il a été un échec commercial. Il est vrai que ce type de technologie n’était pas particulièrement adapté aux ordinateurs des années 60. À l’heure actuelle, l’hypertexte est une technologie que l’on utilise tous les jours par l’intermédiaire d’Internet. Les ordinateurs sont beaucoup plus performants et ont des capacités de traitement graphique sans comparaison possible avec celles de l’époque.
Ross Quillian est parti du principe que le cerveau humain fonctionne par association. Selon lui, la mémoire sémantique n’est rien d’autre qu’un ensemble de nÅ“uds interconnectés par différentes sortes de liens associatifs. C’est l’activation d’un ensemble pertinent de liens qui donne un sens à une information stockée dans un nÅ“ud du réseau. L’expression “ l’oiseau gris est sur l’arbre ” donne un sens au nÅ“ud “ oiseau ” par l’activation des liens “ couleur ” et “ lieu ”. Les réseaux sémantiques ont beaucoup été utilisés en intelligence artificielle pour représenter des connaissances factuelles déclaratives. Le thésaurus d’une bibliothèque, par exemple, peut être représenté par un réseau sémantique. Il donne une représentation externe structurée des ouvrages. On peut y accéder généralement par un ensemble de mots-clefs.
Les informations que nous stockons dans notre mémoire à long terme sont associées les unes avec les autres par des relations contextuelles, c’est-à-dire établies dans un contexte donné. On associe la date de la rencontre d’une personne avec celle d’une élection nationale, par exemple. C’est en pensant à l’une que l’on a accès à l’autre. Lorsque certaines informations sont rendues explicites, il s’agit de les lier entre elles pour recréer une mémoire associative externe. De la même manière, lorsque l’on peut accéder à une information, on peut aussi avoir accès aux informations qui lui sont reliées. On parle de liens hypertextuels. Un système hypertexte peut être décrit comme un système incluant une base de données qui est un réseau de nÅ“uds textuels ou graphiques, et de fenêtres à l’écran correspondant de façon bi-univoque aux nÅ“uds d’une base de données de liens entre ces nÅ“uds. Une telle base de données de liens hypertextuels est un graphe orienté. Il convient de noter que peu de nÅ“uds sont simultanément à l’écran. Depuis le début des années 90, l’hypertexte a été mis en réseau pour donner naissance à la fameuse toile d’araignée mondiale, le World Wide Web ou Web. La mémoire externe est désormais à l’échelle de notre planète.
L’hypertexte est un moyen adapté permettant de conserver des parcours dans une documentation. Ces parcours peuvent être retrouvés le moment venu pour expliquer des points de vue, des décisions ou des actions par exemple. L’évolution des processus industriels depuis ces vingt dernières années est telle que la possibilité de remonter facilement à une décision de conception, par exemple, est devenue un problème majeur. Les travailleurs européens avaient l’habitude de rester dans leur entreprise depuis la date de leur embauche jusqu’à la retraite. Aujourd’hui, on “ bouge ” ! On change de service plus facilement, on change aussi d’entreprise et même, avec l’évolution européenne, de pays. La préservation de l’acquis technique et organisationnel pose de nouveaux problèmes parce que l’évolution est très rapide, à la fois dans l’espace et dans le temps.
Il n’est donc pas anormal que le monde de la recherche réagisse à cette augmentation du nombre d’interfaces technologiques et à l’émergence de nouvelles pratiques. Cette réaction correspond à un besoin de conservation du savoir comme un corps biologique conserve son milieu intérieur. Puisque la permanence du personnel n’est plus assurée comme dans le passé, l’entreprise ou l’organisation s’adapte en inscrivant ses propres savoir et savoir-faire sur des supports appropriés. Les supports aux inscriptions peuvent être multiples, mais l’utilisation accrue des ordinateurs pousse à favoriser les inscriptions logicielles. Les ordinateurs, et surtout les réseaux d’ordinateurs, ont ouvert une nouvelle voie induisant une réorganisation des contenus eux-mêmes, de leur accès et des liaisons entre ces contenus. L’hypertexte permet la traçabilité des connaissances stockées dans un ordinateur par le biais d’un système d’indexation suffisamment renseigné en fonction du contexte pour permettre à un utilisateur de trouver une information et surtout de la comprendre.
Le Concorde a été conçu pendant les années soixante. Il existe bien sûr beaucoup de documentation sur sa conception. Il arrive cependant que les informations provenant de cette documentation ne soient pas suffisantes. Il est souvent nécessaire de recourir aux concepteurs eux-mêmes pour lever certaines incompréhensions, ambiguïtés et incohérences apparentes. Malheureusement, peu de concepteurs de l’époque sont aujourd’hui disponibles pour expliquer le contexte des choix qui ont été faits. L’histoire de la conception est une connaissance extrêmement riche qui est susceptible de faire prendre conscience d’une situation et de suggérer certaines actions. Sa disponibilité est clairement une exigence. Cependant, elle doit être suffisamment vivante (contextualisée) pour être utilisable et utile. Son adaptabilité aux contextes actuels est cruciale.
Les connaissances doivent être correctement indexées pour être correctement comprises. Indexer c’est augmenter les connaissances initiales en en explicitant certains concepts intrinsèques, que nous nommerons descripteurs sémantiques, et certains concepts extrinsèques portant sur l’utilisation de ces connaissances, nous les nommerons descripteurs pragmatiques. En pratique, les descripteurs sémantiques sont représentés par des mots-clefs, et les descripteurs pragmatiques par des attributs du contexte physique et social externe. Les premiers doivent émerger de la signification des connaissances stockées. Les seconds peuvent êtres construits progressivement en découvrant divers aspects d’utilité ou d’utilisabilité des connaissances stockées. C’est en renseignant progressivement les connaissances stockées à la fois en les analysant (production de descripteurs sémantiques) et en les utilisant (production de descripteurs pragmatiques) que l’on peut accéder à une véritable mémoire vivante. Il s’agit de construire un réseau de relations entre les descripteurs et les connaissances auxquelles ils se réfèrent. Nous appellerons référents ces connaissances indexées par des descripteurs. Dans la terminologie hypertexte, une relation entre un descripteur, ou un ensemble de descripteurs, et un référent est appelée un lien.
Appui cognitif et contextualisation
La notion d’appui a été très étudiée en physique. Lorsque l’on pose un objet sur une surface plane, cet objet trouve un appui par le principe de l’équilibre entre l’action de l’objet (créée par une force de gravité) et la réaction de la surface plane. Le skieur qui négocie une trajectoire sur la neige cherche des appuis pour rester en équilibre et gérer un virage. Dans ce cas, les appuis recherchés sont établis en dynamique, d’une part parce que les skis glissent sur la neige et d’autre part, parce que la nature de la neige change en fonction du terrain.
Comme le skieur qui cherche ses appuis physiques, l’utilisateur d’un système à forte composante cognitive cherche ses appuis cognitifs. Nous appellerons appui cognitif le maintien d’un équilibre dans l’interaction homme-machine. Du coté de l’utilisateur, cet équilibre se traduit par une bonne conscience de la situation. En particulier, la machine doit lui renvoyer les informations nécessaires pour une bonne appréhension et compréhension de la situation. Dans les avions de transport actuels, il existe des systèmes d’alarme donnant aux pilotes les avertissements nécessaires pour les prévenir d’un danger imminent. Les avertisseurs de proximité de sol, par exemple, sont des systèmes électroniques offrant un appui cognitif aux pilotes.
Avec la notion d’appui cognitif, on passe d’un monde physique à trois dimensions (appui physique concret ou simulé) à un monde à n dimensions caractérisées par des descripteurs sémantiques et pragmatiques. L’utilisateur se déplace dans cet hyperespace en suivant des directions correspondant à des combinaisons de descripteurs. L’appui cognitif sera d’autant plus stable que ces combinaisons correspondront aux besoins de leur utilisateur. Les utilisateurs experts apprennent à combiner de façon adaptée les descripteurs dont ils ont appris à connaître leur utilisation en contexte. La fréquence et la persistance d’utilisation de certaines combinaisons de descripteurs conduisent à concevoir des descripteurs agrégés.
Métaphores et relais dans un monde connu et rassurant
Une interface entre tout individu et une mémoire externe est nécessairement basée sur un modèle conceptuel. Ce modèle peut dans certains cas être approché par une métaphore suggérant une interaction adaptée. La métaphore n’est pas définie par un processus de déduction à partir d’axiomes, mais plutôt par l’analyse des actes de langage entre l’utilisateur et la mémoire externe. Par exemple, le type de conversation qui s’installe entre un individu et le bibliothécaire est souvent riche en métaphores pour que l’un puisse expliquer à l’autre l’objet de sa demande, et réciproquement l’organisation et le contenu pertinent de la bibliothèque.
La navigation dans un Intranet, c’est-à-dire un réseau informatique de documents répartis sur plusieurs ordinateurs au sein d’une organisation, peut devenir très complexe. Le repérage des débutants peut être grandement facilité par l’utilisation d’une métaphore globale de cet Intranet. Cette métaphore peut être celle de la poste qui distribue le courrier. Elle peut être celle d’une bibliothèque avec son bibliothécaire, ici appelé le “ Webmaster ”. Elle peut être celle du téléphone visuel avec son répondeur. Elle peut être celle du livre électronique avec sa profondeur sémantique par l’intermédiaire de liens dont on ne se soucie pas de la connectivité matérielle. Elle peut être celle d’une fenêtre ouverte sur le monde, une sorte de télévision interactive.
L’agrégation de combinaisons de descripteurs sémantiques conduit à l’utilisation de métaphores en synthétisant le sens. Pour certains concepteurs, l’utilisation de métaphores est devenue une nécessité pour assurer un appui cognitif suffisant lorsqu’un utilisateur se déplace dans un hyperespace de documents électroniques, et plus spécifiquement l’Internet. On assiste au phénomène de désorientation. Les utilisateurs d’hypertextes ont besoin de repérage et de référence à un monde connu. Certaines métaphores sont utiles. D’une manière générale, je ne conseillerais pas d’utiliser de métaphores trop approximatives sauf pour apprendre à utiliser un nouveau système ou si la métaphore capture tous les attributs du modèle conceptuel de l’interaction correspondante.
Internet est l’une des technologies les plus puissantes de la fin du début du xxie siècle. Il a placé l’informatique interactive à la portée de tout le monde au niveau de la planète. Il a cependant une interactivité plutôt mauvaise. Le futur de l’informatique va être dans des ordinateurs plus petits et peu coûteux. Les formes et les tailles vont varier en fonction des besoins. Les gens vont donc pouvoir interagir avec des médias électroniques dépendants de la tâche à effectuer dans un nombre varié de situations.
Rationalisation et fonctions cognitives
Le problème des mémoires externes est aujourd’hui devenu suffisamment crucial pour demander une rationalisation. Les années 1980 ont vu le développement d’une certaine intelligence artificielle basée sur les systèmes dits à bases de connaissances et plus spécifiquement les systèmes experts. En parallèle, des méthodes et des outils d’acquisition et d’explicitation des connaissances à partir d’experts d’un domaine se sont développés. Bryan Gaines et l’école de Banff ont joué un grand rôle dans ce champ scientifique et technique. Le but était de rationaliser les connaissances d’experts afin de les mettre en Å“uvre au sein de bases de connaissances informatiques. La rationalisation se fait alors généralement en utilisant des représentations de connaissances normalisées sous la forme de règles SI-ALORS, de scripts, de cadres conceptuels (frames), de schémas ou d’objets plus ou moins complexes. La prise en compte du contexte n’était pas à l’époque une préoccupation majeure. Il arrivait même parfois que l’on veuille explicitement choisir des représentations indépendantes de tout contexte. On cherchait des connaissances les plus générales possibles. La généralisation était l’une des préoccupations les plus importantes de l’apprentissage symbolique automatique (machine learning). Membre de cette communauté se reconnaissant de l’intelligence artificielle, je me suis progressivement aperçu qu’au contraire la notion de contexte et de spécialisation des connaissances était cruciale dans l’expertise. En fait, la spécialisation et la généralisation sont des processus intimement liés. On se spécialise autant que l’on généralise pour devenir plus efficace. On devient à la fois expert et chercheur. Les experts construisent progressivement du savoir-faire, des habiletés ou compétences correspondant à des spécialisations. Les chercheurs construisent progressivement des savoirs ou connaissances correspondant à des généralisations. La grande question réside dans l’universalité du savoir-faire et du savoir. Un savoir-faire peut parfois être plus “ universel ” qu’un savoir. Je suis parti de ce constat pour façonner la notion de fonction cognitive comme une entité ayant un rôle défini dans un contexte donné, et utilisant un ensemble de ressources. Certaines ressources peuvent être elles-mêmes des fonctions cognitives. Un agent possède un ensemble fini de fonctions cognitives qu’il a construites en fonction des besoins. Certaines fonctions cognitives peuvent utiliser des fonctions cognitives que possèdent d’autres agents. De ce fait, une fonction cognitive est un réseau de fonctions cognitives réparties parmi plusieurs agents. Ces agents peuvent être des êtres humains ou des machines.
La notion de fonction cognitive sert de support et étend celle de mémoire externe. Un être humain ne peut vivre sans un appui cognitif constitué de fonctions cognitives adaptées, qu’elles soient internes et externes. La construction de ces fonctions cognitives internes et externes est effectuée au cours du temps. Les unes s’adaptent en fonction du comportement et de la performance des autres, et réciproquement. Cette co-adaptation s’effectue selon quatre dimensions :
- la dimension des fonctions cognitives internes qui correspond à l’apprentissage, la formation et l’entraînement d’un être humain ;
- la dimension des fonctions cognitives externes qui correspond à l’environnement nécessaire pour assurer l’activité de l’être humain ;
- la dimension de l’interaction entre certaines fonctions cognitives qui correspond aux procédures nécessaires pour que l’être humain puisse utiliser les ressources que lui offre l’environnement ;
- la dimension de l’émergence et de l’évolution de certaines fonctions cognitives qui correspond à la co-adaptation de l’être humain et de son environnement.
Il est courant d’entendre que les mémoires externes sont composées de documents. Les bibliothèques sont des mémoires externes. Les documents sont des intermédiaires, ou interfaces, entre les gens qui les conçoivent et les produisent et ceux qui les utilisent. L’idéal serait que les gens qui ont généré les documents soient présents et puissent utiliser ces documents pour expliquer les messages et concepts qu’ils y ont exprimés. C’est généralement l’utilisateur du document qui fait (re)vivre le contenu du document pour le comprendre et l’assimiler. Le principal problème est que les fonctions cognitives mises en Å“uvre par l’utilisateur ne sont généralement pas les mêmes que celles de la personne qui a généré le document. Comprendre ce qu’a documenté l’auteur reste un problème crucial.
Contextualisation de documents
Nous avons déjà vu que le contexte est crucial dans la traçabilité (recherche et compréhension) d’une information, et peut être concrétisé sous la forme d’annotations. Les annotations ne sont pas générées en un coup. Il est plus facile et surtout plus pertinent et efficace de les générer lorsque l’on consulte l’information. C’est le meilleur moment de donner un avis, une évaluation ou un commentaire sur cette information en fonction de l’intérêt du moment. L’approche de la génération d’annotations contextuelles est forcément événementielle. Le problème ensuite est de traiter la mémoire épisodique résultante. Dans le système de documentation électronique intégrée CID (Computer Integrated Documentation) développé à la NASA, nous avions conçu un algorithme de catégorisation basé sur une idée originale de Douglas Fisher, le concept clustering, ou classification conceptuelle. Il s’agit de gérer progressivement des classes de formes contextuelles, c’est-à-dire des combinaisons de descripteurs pragmatiques, au fur et à mesure que des annotations sont générées. Ce processus est identique à un classement de fiches par catégories. Quatre cas sont en général possibles : 1) l’annotation en cours est incluse dans une classe (formes contextuelles) existante et il convient alors de la ranger dans cette classe ; 2) l’annotation en cours ne correspond à aucune classe existante dans la base de données et il convient alors de créer une nouvelle classe ; 3) l’annotation en cours met en évidence que deux classes existantes peuvent être regroupées et il convient alors de regrouper ces deux classes en une nouvelle classe ; 4) l’annotation en cours met en évidence qu’une classe existante peut être divisée en deux ou plusieurs classes et il convient alors de diviser cette classe de façon appropriée. Par exemple, lorsque l’intérêt d’un document est partagé par plusieurs personnes d’une même classe, il convient de créer une classe du type d’utilisateur de ce document. Si un nouvel utilisateur qui appartient à cette classe ne trouve aucun intérêt à ce document, c’est probablement que la classe initialement définie doit être repensée et deux classes doivent être déduites.
Seuls les experts d’un domaine arrivent à des catégories très complètes de contextes d’utilisation des documents de ce domaine. L’expérience guide la contextualisation. La gestion électronique des mémoires externes a un grand intérêt. Cet intérêt réside sur le fait que l’expérience de tous ceux qui la documentent sous la forme d’annotations contextuelles peut être partagée et catégorisée pas à pas. Dans CID, nous avions accumulé des annotations positives autant que des annotations négatives. Lorsque l’utilisateur du système CID était satisfait de ce qu’il trouvait, il pouvait donner un avis positif. Dans ce cas, le système accumulait et accommodait une forme contextuelle attachée au lien entre la requête (le descripteur sémantique de recherche qu’il avait utilisé) pour accéder à l’information. La fois suivante, le système était plus renseigné sur la réponse à donner à une requête de l’utilisateur, à condition que l’utilisateur donne un certain nombre de caractéristiques du contexte de sa recherche comme ses références personnelles, la tâche en cours ou des données temporelles pertinentes, c’est-à-dire des descripteurs pragmatiques. Lorsque l’utilisateur du système CID n’était pas satisfait de ce qu’il trouvait, il pouvait donner un avis négatif. Dans ce cas, le système apposait une exception sur la forme contextuelle correspondante. Le système était ensuite capable de gérer les exceptions : “ Je donne cette information, sauf si… ”. Le processus de contextualisation dans CID est un exemple d’allocation progressive de fonctions cognitives à une machine informatique. Plus la contextualisation des documents d’un domaine avance, plus l’orientation et la navigation au sein de la base documentaire peuvent être guidées.
Données brutes et interprétation
L’analyse des enregistreurs de données des avions de transport est un exercice qui demande beaucoup de connaissances causales. L’évolution temporelle de certains paramètres du vol ainsi que des voix du poste de pilotage sont disponibles à partir d’enregistreurs de données différents. Ces enregistrements fournissent plusieurs ensembles de “ points ” que les analystes utilisent pour “ recaler ” des modèles causaux construits au cours d’analyses antérieures. Si ces modèles guident les investigations, leur recalage par les données provenant des enregistreurs est capital. C’est la complétude de ces données et les relations causales des modèles servant de support à l’analyse qui garantissent le succès de l’investigation.
Les données brutes contenues dans les boîtes noires de l’avion constituent une mémoire externe qu’il convient ensuite d’interpréter. Dans tous les cas, toute information provenant d’une mémoire externe doit être explicitée. L’interprétation peut être laissée à l’initiative de l’utilisateur de cette mémoire externe ou à l’initiative d’agents externes, ces agents pouvant être humains ou artificiels. La gestion des connaissances, aujourd’hui à la mode et connue sous le nom de Knowledge Management, est devenue une question essentielle de notre société où l’information a pris une place considérable. Nous avons beaucoup, beaucoup trop d’informations disponibles et accessibles. Nous avons, en revanche, peu de connaissances pour traiter la plupart de ces informations. Dans beaucoup de domaines, nous avons développé des automates augmentant nos capacités de traitement. Cette délégation de traitement, et progressivement de dépendance, a amené de nouvelles difficultés comme la prise de conscience (situation awareness) du pourquoi des informations traitées.
Influence croisée de l’évolution des hommes, des organisations et des technologies
Les hommes, les organisations et les technologies se sont toujours adaptés les uns par rapport aux autres. Cette adaptation croisée est toujours guidée par des modèles dominants. Dans le domaine du traitement de l’information, les années 1960-1970 ont été dominées par le traitement de données numériques. Des modèles de catégorisation mathématique ont été développés. Ils étaient essentiellement basés sur des approches numériques et statistiques. Les années 1980 ont vu s’installer le traitement symbolique. Des systèmes experts essentiellement basés sur des règles SI-ALORS, ou systèmes à base de connaissances, ont été développés pour aider à la prise de décisions. Les années 1990 ont vu le développement des technologies interactives et de la coopération. Le Web se révèle progressivement être un outil de préservation de l’acquis et de commerce électronique.
De nouvelles questions émergent, comme la crédibilité dans les informations auxquelles on peut désormais accéder très facilement. Le problème de la validation des informations et des connaissances accessibles est devenu central. L’espionnage industriel n’est plus uniquement le problème de la protection des connaissances d’une organisation. C’est aussi le problème de la croyance excessive en des connaissances factices produites par d’autres organisations. Comment faire la part des choses ? Les compétences et les connaissances de certains acteurs sont cruciales. Les experts sont devenus des gourous de plus en plus rares. On les paye très cher. On observe aussi que leurs connaissances sont limitées dans le temps. Un expert doit se renouveler très souvent pour rester en activité.
Les technologies de l’information et de la communication évoluent de plus en plus vite. Le turn-over au sein des organisations est de plus en plus rapide. Les mémoires externes des organisations industrielles sont de plus en plus instables et éphémères. Les pratiques changent très vite. Le besoin de capitalisation des connaissances est devenu une nécessité. Le besoin de connaissances n’est pas tellement une question d’oubli. La reconstruction des connaissances est certainement une activité très utile et bénéfique. Le problème majeur de notre époque est la rapidité de l’évolution des technologies et de l’émergence de nouvelles pratiques. Il faut suivre ! Le plus déroutant est que les organisations ont aussi du mal à suivre, justement parce qu’elles n’arrêtent pas de se réorganiser. Il en résulte une instabilité permanente dans laquelle les gens doivent adapter leurs comportements. Les réorganisations tendent à mettre en présence des cultures différentes. Elles doivent se re-stabiliser constamment et surtout rapidement pour conserver une performance acceptable.
De la famille ancestrale à l’équipe de circonstance
La famille quercinoise de mon enfance réunissait trois générations, parfois quatre, sous le même toit. Je me souviens du grand-père racontant des histoires de sa vie à ses petits-enfants. La fenêtre temporelle de la mémoire familiale était très large. Le champ des connaissances transmises de bouche à oreille pourrait certes être considéré comme étroit aujourd’hui, mais leur profondeur était immense. On prenait le temps d’expliquer et d’amener une solution à maturité. Dans mon travail actuel, la fenêtre temporelle des organisations industrielles que je côtoie est de plus en plus étroite, en raison des problèmes d’évolution rapide due à une demande de rentabilité immédiate. Le champ des connaissances est plus large, mais leur profondeur n’est partagée que par quelques individus. Des équipes de circonstance se forment pour résoudre des problèmes difficiles et apporter des solutions le plus rapidement possible.
Le savoir et le savoir-faire dans la famille ancestrale étaient presque uniquement transmis oralement. La transmission orale était illustrée par l’action. À l’opposé, les membres de l’équipe de circonstance d’aujourd’hui n’ont pas tous une formation issue du même creuset. Ils n’ont pas la même culture ou langue. Ils peuvent très bien ne pas se connaître. Ils passent parfois leur période de travail en commun à tenter de se comprendre. L’équipe a besoin de supports physiques comme un journal de bord, des références documentaires ou des messages écrits. Est-ce parce que la technologie est disponible et à la mode, ou parce que les organisations actuelles ont besoin de ces supports technologiques ? Comme nous l’avons vu, il y a co-adaptation.
La bureautique et le courriel contribuent au développement des mémoires externes
Une étude récente qu’EURISCO a réalisée au sein d’une entreprise industrielle a révélé trois aspects importants de la documentation technique. 1) L’écriture technique n’est pas une compétence a priori. Elle devrait être enseignée et renforcée au sein des équipes de conception. 2) La transparence doit être acceptée comme un concept relatif. Il y a des informations publiques et des informations privées. Cette dichotomie doit être respectée. Des efforts sont encore à faire dans le domaine juridique à cet égard. 3) La maturité d’une information doit être indiquée. Avant de rendre publique une information, il convient de s’assurer de son degré de maturité. La détermination de la maturité d’une information passe souvent par un processus d’évaluation impliquant des acteurs appropriés.
Les outils électroniques de traitement de texte ont profondément changé la façon dont le travail est organisé dans les entreprises. Les secrétaires qui tapaient des rapports ou des notes techniques ont disparu. Les ingénieurs rédigent eux-mêmes leurs documents techniques. Les documents ne sont plus générés de la même façon. La fonction copier-coller a révolutionné la conception et la production de documents. Les gens qui génèrent des documents utilisent souvent des documents déjà édités et procèdent par analogie. Ils ont leurs propres mémoires externes de notes techniques, de lettres types, de rapports d’avancement et autres documents déjà catégorisés.
La communication orale est le support le plus naturel d’échange d’informations et de connaissances dans une organisation. C’est aussi le plus simple et souvent le plus efficace. En particulier, les choses n’ont pas à être formalisées pour être communiquées oralement. Les gens gèrent des points de vue subjectifs plus efficacement et de manière fiable. De plus, l’interaction directe entre êtres humains a tendance à générer de nouvelles idées non-anticipées initialement, et qui peuvent s’avérer extrêmement efficaces et créatives. Tous ces avantages sont évidents à court terme, ils disparaissent cependant à long terme. En effet, les personnes en question peuvent ne plus être disponibles. Si elles sont disponibles, elles peuvent oublier. Si elles se souviennent, il faut être sûr de la validité de leur mémoire. La communication orale a le grand désavantage d’être volatile. Une fois qu’une information est transmise, elle peut être oubliée pour toujours par une communauté si elle n’est pas simultanément documentée.
Aujourd’hui le courrier électronique permet de faire passer beaucoup de cette communication orale par écrit. Le courrier électronique remplace progressivement le téléphone. Il est moins intrusif par le fait qu’il a un fonctionnement asynchrone ; les gens n’ont pas besoin de répondre immédiatement. Il permet aussi d’envoyer un message instantanément à beaucoup de personnes. Il offre un cadre semi-formel d’expression, d’échange d’idées, de demandes d’informations et de réponses. Les conversations informelles par courrier électronique peuvent être conservées. De ce fait, l’ambiguïté entre communication informelle “ pseudo orale ” et texte (introduisant une certaine formalité) peuvent causer des dysfonctionnements. Certains effets négatifs sont enregistrés, notamment par rapport à la maturité des informations transférées. En contrepartie, la conservation des épisodes de communication fournit un excellent support contextualisé pour une traçabilité ultérieure.
Conclusion et perspectives
Les mémoires externes des habitants du Quercy de mon enfance étaient très locales. Leurs fenêtres espace-temps étaient limitées. Elles en étaient d’autant plus profondes. Ces communautés ne connaissaient pas ou peu l’histoire de la France. Michel Serres a déjà illustré ce propos : “ les villageois et les métayers de mon enfance, dans le Quercy ou la moyenne Garonne, n’avaient jamais participé à l’histoire, qu’ils ne cherchaient pas à comprendre par pur désintérêt, ou qu’ils ne rencontraient que par la conscription et le service militaire… ” La question centrale est bien l’intérêt que nous portons aux informations et aux connaissances de nos mémoires externes. Celles-ci n’existent que par l’intérêt que nous leur portons. Une mémoire externe se constitue à l’intérieur d’une communauté. Elle a d’ailleurs du mal à survivre de façon vivace lorsque la communauté disparaît. Les scientifiques se regroupent et se reconnaissent à l’intérieur de communautés, par exemple. Ils y développent des jargons et un esprit qui sont difficiles à pénétrer lorsque l’on vient de l’extérieur. Il serait finalement préférable de parler de “ mémoire interne à une communauté ”.
La fin du vingtième siècle a vu émerger des foyers de multidisciplinarité un peu partout dans le monde. La fusion de plusieurs disciplines très différentes a par exemple donné naissance aux sciences cognitives. Les scientifiques de ce nouveau domaine sont aujourd’hui occupés à tenter de se comprendre. Les mémoires externes sont difficilement accessibles pour les non initiés. Ingénieur de formation initiale, j’ai commencé à évoluer professionnellement dans un champ peu ouvert aux sciences molles. Le chemin a été et est toujours très difficile. Lorsque l’on évolue à la frontière de plusieurs communautés scientifiques, c’est un peu comme si l’on était apatride. On ne peut pas bénéficier des avantages des communautés correspondantes si l’on n’a pas le passeport qui va bien. En plus d’être en marge de ces communautés scientifiques pures et dures, les investigations relatives aux mémoires externes se situent à la frontière de la recherche et l’industrie, entre la science et le cambouis.
Pour terminer, je prendrai l’exemple de la conception de systèmes. Les systèmes complexes, comme les avions par exemple, sont conçus dans des bureaux d’études. Contrairement à certaines attentes, la durée du processus de conception d’un avion commercial n’a pas varié depuis des décennies. Ce qui a changé ce sont les interactions entre les acteurs impliqués dans le processus de conception. Dans le passé, la stabilité de l’organisation faisait en sorte que les idées et les concepts avaient le temps de se former parce que les gens se connaissaient. Les acteurs étaient dans un mode de coopération par compréhension mutuelle. Ils restaient souvent dans la même entreprise toute leur vie professionnelle. De ce fait, les concepts avaient plus de chance d’arriver à maturité avant de couper la tôle, comme disait mon père. Aujourd’hui, les contraintes économiques ont énormément fait diminuer les délais. Le paradoxe est que le temps global reste le même parce que l’on a créé d’autres activités de contrôle et de services pour coordonner des acteurs agissant beaucoup plus transversalement. Les acteurs ne se connaissent plus très bien parce que le “ turn-over ” est très important. Les gens changent d’entreprise plus facilement. Le maintien de la mémoire de l’entreprise devient alors un problème majeur. Le support à la coopération est donc devenu crucial. Comme nous l’avons vu, la documentation du processus de conception et de ses solutions est aujourd’hui une préoccupation principale. De plus, la qualité de la documentation technique contribue à la qualité de la conception. Nous écrivons habituellement pour des lecteurs potentiels. De la même manière, nous concevons pour des utilisateurs potentiels. Nous savons que les documents que nous écrivons doivent être relus par plusieurs personnes avant d’être diffusés à l’extérieur. Nous savons aussi que les artefacts doivent être testés par plusieurs personnes avant d’être diffusés à l’extérieur. Le lecteur d’un document multimédia est devenu un utilisateur d’une application logicielle. De ce point de vue, la lecture évolue vers l’interaction homme-ordinateur. L’écriture évolue aussi vers la conception de logiciels interactifs. “ Concevoir c’est écrire et écrire c’est concevoir ”. Écrire des mots, des phrases, des paragraphes et des chapitres se transforme en concevoir des objets et des agents logiciels. Les documents statiques sur papier évoluent vers des documents (inter)actifs. La partie active d’un livre (d’un système) est le lecteur (l’utilisateur). De plus, l’organisation du livre (système), la façon dont les phrases (objets) sont écrites (conçus), le style et le lexique utilisés suggèrent un certain type d’activité au lecteur (à l’utilisateur). Parfois, le lecteur (utilisateur) a du mal à comprendre ce que l’auteur (le concepteur) a voulu exprimer (représenter). Au lieu de mobiliser les processus cognitifs du lecteur (de l’utilisateur) sur des problèmes d’interaction, la part la plus importante de l’activité cognitive du lecteur (de l’utilisateur) devrait être centrée sur la compréhension et l’interprétation du contenu du document (actif).
·
Barrett, E., Sociomedia. Multimedia, hypermedia, and the social construction of knowledge, Cambridge, MA, MIT Press 1992.
·
Boy, G. A., Computer Integrated Documentation, Ames Research Center, Californi, NASA Technical Memorandum 1991.
·
–– Intelligent Assistant Systems, Londres, Academic Press 1991.
·
–– Cognitive Function Analysis, Stanford, CT, Ablex 1998.
·
Bush, V., “ As we May Think ”, Atlantic Monthly, juillet 1945, p. 101-108.
·
Engelbart, D. C., “ A Conceptual Framework for the Augmentation of Man’s Intellect ”, dans Vistas in Information Handling, Vol. 1, Londres, Spartan Books 1963.
·
Engelbart, D. C. et English, W. K., “ A research center for augmenting human intellect ”, American Federation of Information Processing Societies Conference Proceedings of the Fall Joint Computer Conference, Washington, DC, Thompson Book Company 1968, p. 395-410.
·
Fisher, D. H., “ Knowledge Acquisition via Incremental Conceptual Clustering ”, Machine Learning, 2, 1987, p. 139-172.
·
Floridi, L., The Internet and the future of organized knowledge, Paris, Conférence UNESCO, 14-17 mars 1995.
·
Gaines, B. R., “ Modeling and Extending Expertise ”, dans N. Assenac, G. Boy, B. Gaines, M. Linster, J-. G. Ganascia et Y. Kodratoff (éds), Knowledge Acquisition for Knowledge-Based Systems, Berlin, Springer-Verlag 1993, p. 1-22.
·
Lowry, D. J. et Feaster, T. A., Regarding Space Leadership through Control of Life Cycle Costs, Cocoa Beach, Floride, 25th International Space Conference 1987.
·
Minsky, M., Society of Minds, New York, Touchstone Books, Simon & Schuster Inc. 1985.
·
Nelson, T. H., “ Getting It Out of Our System ” dans G. Schechter, (éd.) Information Retrieval: A Critical Review, Washington D.C., Thompson Books 1967.
·
Nielsen, J., Report From a 1994 Web Usability Study, Useit.com. Papers and Essais 1994.
·
http://www.useit.com/papers/1994_web_usability_report.html.
·
Norman, D. A., The Design of Everyday Things, New York, Doubleday 1990.
·
–– Turn Signals are the Facial Expressions of Automobiles, Reading, Massachusetts, Addison-Wesley 1992.
·
Piaget, J., “ Examen critique de la thèse de Jacques Monod. Hasard et dialectique en épistémologie biologique ”, Sciences, n° 71, 1971, p. 29-36.
·
–– Adaptation vitale et psychologie de l’intelligence, Paris, Hermann 1974.
·
Quillian, M. R., “ Semantic Memory ”, dans M. Minsky (éd.), Semantic Information Processing, Cambridge, MA, MIT Press 1968, p. 216-260.
·
Rosenthal, S., “ Doug Engelbart ”, Electric Word, 18, 1990, p. 20-25.
·
Serres, M., Éclaircissements. Entretiens avec Bruno Latour, Paris, Éditions François Bourin 1992.
·
Winograd, T. et Flores, F., Understanding Computers and Cognition, Reading, Massachusetts, Addison Wesley 1987.
·
Yates, F. A., The art of memory (1966), traduction française par Daniel Arasse, Paris, Gallimard 1975.
[*]
Guy
Boy est Directeur de l’Institut Européen de l’Ingénierie et des Sciences Cognitives (EURISCO). Il a obtenu son doctorat en Automatique et Systèmes en 1980 (ENSAE), son habilitation à diriger des recherches (HDR) en 1992 (Paris VI), et sa qualification de professeur des Universités en informatique et psychologie en 1994. Il a été Directeur du groupe “ Advanced Interaction Media ” au Centre de recherche de la NASA Ames de 1989 à 1991. Ses recherches portent sur la conception centrée sur l’homme et l’étude des systèmes à risques. Il travaille actuellement sur le développement de méthodes et de techniques visant à améliorer la traçabilité des décisions de conception et sur la conception participative. Il a développé des techniques d’explicitation de connaissances comme la méthode GEM (
Group Elicitation Method), et des outils d’ingénierie cognitive comme les documents actifs de conception. Il est l’auteur de deux livres dans le domaine de l’ingénierie cognitive :
Intelligent Assistant Systems, 1991, et
Cognitive Function Analysis, 1998.
[1]
J’utiliserai les termes
savoir et
connaissances indifféremment dans le reste de ce chapitre.
[2]
Association for Computing Machinery.