Accueil Revues Revue Numéro Article

Documentaliste-Sciences de l'Information

2007/1 (Vol. 44)

  • Pages : 120
  • DOI : 10.3917/docsi.441.0018
  • Éditeur : A.D.B.S.

ALERTES EMAIL - REVUE Documentaliste-Sciences de l'Information

Votre alerte a bien été prise en compte.

Vous recevrez un email à chaque nouvelle parution d'un numéro de cette revue.

Fermer

Article précédent Pages 18 - 28 Article suivant

1 - Les langages documentaires au siècle dernier : stabilité et immobilisme

Phylogenèse des langages documentaires

1

Dans le passé, les langages documentaires sont nés à l’occasion d’évolutions techno-culturelles conduisant à repenser la question de l’organisation des connaissances et de l’accès à l’information. Plus précisément, ces évolutions concernent la croissance des volumes d’information disponibles, le déploiement de nouveaux supports d’inscription et l’apparition de nouvelles modalités de communication de l’information.

2

• Sans remonter aux formes primitives de classification des livres, citons les grandes classifications encyclopédiques de bibliothèques : elles résultent du foisonnement éditorial de la fin du XIXe siècle [1][1] Au Royaume-Uni, par exemple, on passe de 600 nouveaux..., qui provoque un accroissement considérable des collections. Conçues pour permettre un arrangement rationnel des ouvrages sur les rayons, elles facilitent l’accès thématique aux ouvrages, mais simplifient également la gestion de ces accroissements. De plus, leur système de notation (en particulier la notation décimale) leur confère des capacités d’aménagement et d’extension qui les rendent aptes à suivre les évolutions amenées par le progrès scientifique.

3

• Les listes de vedettes matière apparaissent et prospèrent à la faveur de l’accélération de la publication et de la circulation des savoirs sous forme imprimée, à l’aube du XXe siècle. L’établissement de catalogues imprimés, avec leur indexation matière, permet la diffusion des informations bibliographiques et favorise l’émergence des premiers « réseaux » de bibliothèques. La publication des travaux scientifiques se fait de plus en plus sous forme d’articles de périodiques [2][2] Au début du XIXe siècle, il y avait aux États-Unis..., d’où une distinction entre unité documentaire et unité physique qui accentue la nécessité des documents secondaires. Les registres et catalogues imprimés sont de plus en plus délaissés au profit des catalogues sur fiches, pour lesquels un classement alphabétique par sujets devient possible grâce à cette forme d’indexation.

4

• Le développement des thésaurus a suivi quant à lui la diffusion des techniques informatiques, vers la fin des années cinquante, bien que leur genèse ne soit pas directement liée à l’apparition des ordinateurs. La stabilisation de leur modèle est l’aboutissement de réflexions autour de trois préoccupations sur l’organisation d’une documentation qui prolifère, qui n’est plus strictement scientifique mais de plus en plus technique [3][3] Les grandes entreprises deviennent alors des protagonistes..., et pour laquelle les langages documentaires existants sont inadéquats.

5

En premier lieu, il s’agissait de concevoir un système compact, qui ne demande pas de répertorier a priori de nombreux concepts, mais qui autorise l’expression d’un grand nombre de sujets. De nouvelles formes d’indexation, dites (post)coordonnées, sont mises au point, comme les descripteurs de Calvin Mooers ou les unitermes de Mortimer Taube, avec les équipements mécanographiques permettant les combinaisons lors des recherches. En deuxième lieu, il importait, en prenant en compte la synonymie, d’harmoniser le vocabulaire des auteurs, celui des indexeurs et celui des utilisateurs. Enfin, il fallait imaginer des moyens de guider indexeurs et utilisateurs dans le choix des termes appropriés, ce que vise la structuration sémantique des termes par les liens hiérarchiques et associatifs.

6

On arrive ainsi aux trois caractéristiques définitoires du thésaurus : un langage structuré, contrôlé et combinatoire. La logique de recherche booléenne qui met à profit cette dernière caractéristique est remarquablement adaptée aux opérations de base effectuées par l’ordinateur, d’où un succès immédiat et durable de ces langages documentaires en contexte informatisé.

Enracinement dans les pratiques et les milieux traditionnels

7

Classifications, listes de vedettes matière et thésaurus sont prototypiques des trois types de langages documentaires mis en évidence par Jacques Maniez [31], dont les propositions sont synthétisées de manière très claire par Sylvie Dalbin dans l’un de ses billets [13]. Y sont respectivement répertoriés des classes de sujets, des sujets et des concepts « élémentaires ».

8

Ces trois souches de langages documentaires restent aujourd’hui bien vivantes et largement utilisées, même si les deux premières sont davantage maîtrisées par les bibliothécaires, et si la troisième demeure une sorte de « domaine réservé » des documentalistes, au moins dans le modèle français de cloisonnement professionnel qui est encore en vigueur.

9

Les classifications encyclopédiques, en particulier lorsqu’elles sont essentiellement énumératives, comme la Classification décimale de Dewey (DDC) ou la Classification de la Bibliothèque du Congrès (LCC), constituent toujours l’ossature de l’accès par sujet dans de nombreuses bibliothèques, bien qu’elles soient critiquables sur de nombreux points. L’usage de la Classification décimale universelle (UDC), aux capacités expressives pourtant très riches, avec son système élaboré de ponctuation permettant d’exprimer très finement des catégories thématiques, semble de son côté en recul.

10

Les listes de vedettes matière sont elles aussi des outils très sollicités, du moins par les catalogueurs [4][4] Les lecteurs semblent moins friands de ce type de langage :..., dans les bibliothèques un peu partout dans le monde : la liste de la Bibliothèque du Congrès américain (LCSH) dans les pays anglophones, le Répertoire de vedettes matière de l’Université Laval (RVM) ou RAMEAU dans la francophonie.

11

Les thésaurus sont sans doute les plus universels des langages documentaires, malgré (ou à cause de) leur caractère le plus souvent spécialisé. On en rencontre de toutes tailles, dans tous les domaines, dans tous les pays et dans toutes sortes d’organisations (entreprises, administrations, institutions d’enseignement, associations), à l’exception peut-être des… bibliothèques.

12

Cette vitalité des usages ne suffit toutefois pas à masquer un conservatisme certain dans leur conception. Bon nombre d’ouvrages consacrés aux langages documentaires qui font autorité à l’heure actuelle ont été publiés quasi simultanément à la fin des années quatre-vingt [2] [10] [29] [47]. Le corpus normatif français et international sur les thésaurus date aussi pour l’essentiel de la même époque. Les nouvelles normes américaine et britannique [5][5] Voir pages 66 et suivantes. apporteront-elles des éléments de renouveau ? Il est sans doute trop tôt pour se prononcer : la première a paru en 2005 [35] et la seconde, bien que partiellement publiée [7] [8], reste à l’heure actuelle en chantier.

Un passage à Internet peu convaincant

13

Les systèmes d’accès navigationnel aux ressources ordonnées à l’aide des grandes classifications encyclopédiques restent, au mieux, embryonnaires ou à l’état de prototypes, comme DeweyBrowser [6][6] http:// deweyresearch. oclc. org/ ddcbrowser/ eboo... de l’OCLC ou le Visual Catalogue [7][7] http:// visualcatalog. univ-paris8. fr/ vc2/ et http://... des universités de Picardie et de Paris-8. Dans le premier cas, seuls les niveaux supérieurs de la Classification de Dewey sont « navigables » ; dans le second, la structure hiérarchique des classifications consultables n’est pas exploitée, et les indices construits ne sont pas légendés.

14

L’interrogation par sujets des catalogues de bibliothèques, de plus en plus consultables par Internet, n’a pas encore bénéficié d’avancées ergonomiques notables par rapport aux OPACs (online public access catalogues) de deuxième génération, dont c’était notoirement la faiblesse majeure.

15

Beaucoup de thésaurus sont disponibles sur Internet, dans des configurations qui tirent plus ou moins parti des possibilités graphiques et hypertextuelles du médium. Citons l’exemple de MOTBIS [8][8] www. motbis. fr/ , dont la nouvelle version fait l’objet sur le Web d’une présentation graphique et de possibilités de navigation soignées, dans la lignée de la réussite que représente le Thésaurus Santé Publique[9][9] www. bdsp. tm. fr/ TSP3/ Default. asp.

16

Mais, faute d’interface suffisamment conviviale pour la constitution de requêtes booléennes tant soit peu élaborées, leur usage sur le Web reste limité à des publics de spécialistes. Pourtant, des enquêtes ont montré que les utilisateurs se déclarent disposés à faire usage d’un thésaurus, à condition qu’il soit mis à leur disposition et que les règles du jeu leur soient expliquées [20].

17

De plus, il arrive fréquemment que les ressources soient indexées avec un thésaurus alors que seule une recherche par requête libre est proposée sur le site Internet. Cette situation est typique des ressources produites selon une approche documentaire traditionnelle, puis exportées vers un système qui n’en prend pas en compte la structure ni les spécificités. Elle peut aussi répondre à la nécessité de s’adresser à un public large qu’une recherche documentaire classique pourrait rebuter, ou à la volonté de proposer un accès à des ressources hétérogènes, non indexées pour certaines. Dans ces configurations, les capacités du thésaurus sont évidemment sous-exploitées, puisque les descripteurs assignés au document sont traités ni plus ni moins comme des éléments du texte intégral. Tout au plus pourra-t-on s’attendre à une amélioration marginale de la précision des réponses obtenues, dans la mesure où les descripteurs donnent aux concepts significatifs un poids supplémentaire dans le document.

À la recherche du langage documentaire parfait

18

Les tentatives pour définir de nouveaux modèles de langages documentaires, dans l’optique d’améliorer la précision dans l’expression des sujets des documents ou des requêtes, n’ont jamais vraiment abouti au cours du XXe siècle. Ces tentatives avaient en commun la volonté d’introduire une syntaxe permettant d’assembler de manière normalisée les éléments du langage documentaire pour reconstruire les sujets des documents traités ou recherchés. En cela, les systèmes issus de ces réflexions seraient pourtant les seuls à vraiment justifier l’appellation de langages documentaires, et les systèmes à syntaxe uniquement combinatoire pourraient, selon la proposition ancienne de Jean-Claude Gardin [12], être qualifiés de lexiques documentaires.

19

Les classifications à facettes, premières en date de ces tentatives, n’ont pas réussi à s’imposer [30], et constituent aujourd’hui, comme le remarque Michèle Hudon, « davantage un objet de recherche plutôt qu’un outil de travail » [28]. Notons toutefois que de nombreux indices permettent d’y voir une solution à la fois élégante et économique à beaucoup de problèmes posés par l’accès à l’information numérique, en particulier sur Internet ou dans les intranets. Des progrès significatifs dans la conception et la réalisation d’interfaces adaptées à ce type de langage ont été accomplis. Il suffit d’utiliser le prototype Flamenco [10][10] http:// flamenco. berkeley. edu/ demos. html, réalisé par l’université de Berkeley, pour se convaincre de la puissance et de la souplesse de ce modèle.

20

Malgré une assise théorique séduisante, la famille des langages syntagmatiques n’a qu’exceptionnellement donné lieu à des mises en application concrètes. Le PRECIS de Derek Austin [3] a bien été utilisé un temps, par exemple par la British National Bibliography, mais a été abandonné. Le SYNTOL de Jean-Claude Gardin [12] ou le CODOC de Robert Pagès [15] n’ont jamais été vraiment en usage ou l’ont été de manière très confidentielle. Et qui, de nos jours, a entendu parler de POPSI [5] ? Tous ces systèmes sont à ranger, comme les classifications à facettes, dans la catégorie des langages analytico-synthétiques.

21

La cause de cet insuccès est sans doute à rechercher dans un rejet de la complexité d’utilisation de ces instruments, aussi bien à l’indexation qu’à la recherche [49].

22

Les réflexions et études consacrées aux listes de vedettes matière, proches par certains aspects de cette catégorie de langages, et également pourvues d’une syntaxe (à travers les subdivisions), tendent à confirmer l’hypothèse qu’un excès de complexité est un frein à l’utilisation pertinente de ces systèmes. Les vedettes construites « complexes » sont souvent mal comprises (par les utilisateurs, mais aussi par les bibliothécaires) [16] et les règles de combinaison des têtes de vedette et des subdivisions sont trop restrictives, et demanderaient à être simplifiées [34].

Langages contrôlés contre langage libre

23

La nécessité d’un contrôle terminologique de l’expression du sujet des documents, à travers un langage documentaire, est fermement établie en théorie ; elle découle des phénomènes de polysémie et de polynymie (fait pour un concept d’être désigné par plusieurs termes synonymes) qui abondent dans la langue. Cette nécessité n’a cependant jamais été confirmée expérimentalement de manière convaincante. Elaine Svenonius a beau affirmer que, puisqu’il est possible de déduire logiquement cette nécessité des « anomalies » des langues naturelles, une démonstration empirique n’est pas nécessaire dans ce domaine [45], le fait reste quelque peu dérangeant.

24

Des expériences d’évaluation de la recherche d’informations sont menées à partir des années soixante. Elles ont notamment pour objectif de mesurer l’efficacité de différents dispositifs d’indexation, à base de langages contrôlés ou de langage naturel. La série d’expériences connue sous le nom de « projet Cranfield », conduite par Cyril Cleverdon, demeure emblématique et a durablement influencé les méthodes d’évaluation [9]. Les meilleurs résultats obtenus lors de ces expérimentations, en termes de rappel et de précision, étaient le fait de la technique d’indexation par sélection de mots simples (unitermes) dans le texte des documents [11]. Tout semble se passer comme si les « anomalies » de la langue étaient en fait moins préjudiciables à la recherche d’informations que les inévitables imperfections et approximations des langages contrôlés.

25

Un grand nombre d’expériences plus ou moins similaires ont suivi celles de Cleverdon, sans permettre de départager nettement langages contrôlés et langage libre [46]. Citons par exemple l’une des plus récentes [41], qui conclut à une meilleure performance du langage contrôlé.

26

Ces résultats parfois contradictoires, de multiples doutes sur la validité des méthodes d’évaluation, et surtout le manque de prise en compte des nombreux paramètres susceptibles d’influer sur la qualité d’une approche incitent à une grande prudence quant à l’interprétation des conclusions de ces études. Cette prudence conduit finalement la communauté des chercheurs et praticiens à recommander des solutions qui combineraient la recherche sur les mots du texte avec un repérage fondé sur une analyse intellectuelle des ressources et une représentation par un langage documentaire, ou au pire avec une assistance terminologique fournie par le langage documentaire.

27

L’article de Gerard Salton, « Another Look at Text Retrieval Systems » [40], marque une rupture de cet équilibre mi-chèvre mi-chou. Il est publié en 1986, c’est-à-dire au moment où paraissent également en France les manuels et les normes de référence sur les thésaurus. C’est aussi la période où la banalisation des outils informatiques et bureautiques favorise la production massive de textes sous forme électronique, dont la diffusion va s’accélérer de façon spectaculaire quelques années plus tard avec l’apparition du World Wide Web. Salton y défend vigoureusement la thèse selon laquelle les systèmes d’indexation automatique du texte intégral donnent des résultats au moins aussi bons que l’indexation manuelle avec un langage contrôlé. Il fait aussi remarquer que ces résultats ne pourront que s’améliorer avec les inévitables progrès de ces techniques, ce qui n’est pas le cas avec les pratiques traditionnelles.

28

L’argument économique est le plus souvent invoqué pour justifier le choix du langage libre et (surtout ?) de l’indexation entièrement automatisée. Dès lors que la recherche libre sur les mots du texte donne des résultats au moins comparables qualitativement à ceux de la recherche avec un langage contrôlé, il serait vain de consacrer des ressources à la constitution d’un langage documentaire et à l’indexation. En réalité, et Jean-Claude Gardin le démontrait déjà en 1964 [12], la recherche libre reporte sur l’usager du système l’essentiel de la charge de travail intellectuel nécessaire à l’élimination des problèmes posés par la polysémie et la polynymie ; de plus, ce travail doit être accompli lors de chaque recherche au lieu d’être consigné de manière permanente dans le langage documentaire et/ou dans les champs d’indexation des documents. Se passer d’un langage contrôlé serait donc contre-productif.

29

Cette analyse n’a que le défaut de supposer que ces problèmes doivent nécessairement être résolus pour qu’une démarche de recherche d’information soit satisfaisante, du point de vue de l’utilisateur. La résolution de la polynymie, par utilisation de termes de recherche synonymes, permet l’amélioration du rappel, ce qui n’offre qu’un intérêt limité dans un contexte de surabondance d’information. Même dans les cas où l’exhaustivité des résultats est souhaitée, il est extrêmement malaisé pour les utilisateurs de se faire une idée du moment où cette exhaustivité est atteinte, Ils peuvent donc se déclarer satisfaits, alors qu’en fait de nombreuses références sont manquées. De ce point de vue, l’expérience menée par Blair et Maron en 1985 reste riche d’enseignements [6] : des juristes à qui il était demandé d’effectuer des recherches de manière à rassembler au moins 75 % des références pertinentes estimaient leur tâche accomplie quand en moyenne 20 % seulement de ces références avaient été identifiées !

2 - Taxonomies et ontologies : diversification ou rupture ?

30

On aurait pu s’attendre à ce que l’explosion des technologies Internet et les mutations informationnelles qui en découlent suscitent des formes nouvelles de langages documentaires. Cela ne semble guère être le cas, et Jacques Maniez pouvait noter en 2002 que les seules nouveautés en la matière étaient à rechercher dans l’organisation des répertoires de sites web à la Yahoo! [31].

31

En réalité, plusieurs phénomènes liés aux évolutions du World Wide Web et de ses avatars (intranets, extranets, places de marché électroniques) dans les années deux mille ont engendré des artefacts dont les structures et les fonctions s’apparentent à celles des langages documentaires, sans toutefois qu’ils soient issus des mêmes communautés de pratiques (bibliothèques ou centres de ressources documentaires) :

  • le développement du Web marchand et celui des sites intranet d’entreprises s’accompagnent de la création de cadres de présentation et de découverte des ressources, les taxonomies ;

  • la nouvelle génération du Web, avec le Web sémantique d’abord, puis avec le « Web 2.0 », est à l’origine de réponses originales, en apparence radicalement opposées, à la question de l’annotation / description des ressources numériques : les ontologies d’un côté, les folksonomies et l’indexation sociale de l’autre.

Dans ce contexte, il n’est peut-être pas inutile de se pencher sur ces instruments dont les définitions ne sont pas toujours très claires et qui suscitent régulièrement la perplexité des professionnels de l’information-documentation. « Quelle est la différence entre taxonomie et ontologie ? », s’interrogeait récemment un internaute sur Yahoo ! Answers [11][11] http:// uk. answers. yahoo. com/ question/ index? qid=.... Doit-on voir dans l’essor récent de ces outils un nouveau péril pour les langages documentaires et les pratiques de traitement intellectuel de l’information qu’ils sous-tendent ? Ne s’agit-il que d’un cas de « réinvention de la roue » par des informaticiens néophytes et ignorants des techniques documentaires ?

32

Nous laisserons de côté le phénomène de l’indexation sociale et des folksonomies, qui est abordé dans un autre article de cette livraison de Documentaliste – Sciences de l’information[12][12] Voir pages 58 et suivantes., pour tenter de cerner les notions de taxonomie d’abord, puis d’ontologie.

Taxonomies

33

L’emploi du terme taxonomie ou taxinomie (les deux formes sont à notre avis équivalentes) dans le contexte des langages documentaires est relativement peu attesté dans la littérature publiée, mais est davantage le fait de praticiens ou d’industriels. Alan Gilchrist [18] en relève cinq significations distinctes dans le domaine de la gestion des connaissances, qui correspondent à des objets s’étageant des systèmes de classification utilisés par les répertoires de sites web à des « thésaurus enrichis », de structure plus complexe. Cet inventaire ne permet guère de se faire une idée précise de ce que recouvre le terme. Les définitions que l’on peut glaner ici ou là ne sont pas plus éclairantes.

34

Dans leur Thésauroglossaire [14], Danièle Dégez et Dominique Ménillet font de taxonomie un terme spécifique de langage hiérarchisé, mais un synonyme de systématique, et en donnent comme définition « classification des formes vivantes ».

35

Jacques Maniez écrit quant à lui [31] : « La taxinomie est, au sens général, la science des classifications, mais on nomme aussi taxinomies les classifications de structure monohiérarchique. »

36

Dans le lexique qu’elle propose en ligne [13][13] www. lingway. com/ fr/ h2. htm, la société Lingway donne la définition suivante : « Réseau sémantique dans lequel la seule relation est la relation hiérarchique. »

37

Le Montague Institute [14][14] www. montague. com/ review/ myths. html définit une taxonomie comme « a system for naming and organizing things into groups that share similar characteristics[15][15] « Un système pour nommer et organiser des objets en... », en précisant que cette définition n’implique pas que le seul mode d’organisation possible pour une taxonomie soit une hiérarchie thématique.

38

Enfin, dans le glossaire Dublin Core [16][16] http:// dublincore. org/ documents/ usageguide/ glossary...., on relève la définition suivante : « Systematic classification according to principles or general laws[17][17] « Classification systématique selon des principes ou.... » Ce même glossaire affirme de plus : « A classification system such as Library of Congress Classification is an example of a taxonomy[18][18] « Un système de classification comme la Classification... », et par ailleurs (à l’entrée thesaurus) : « A thesaurus is a taxonomy[19][19] « Un thésaurus est une taxonomie. ». »

39

Nous sommes donc en présence de conceptions très hétérogènes de ce qu’est une taxonomie en gestion des connaissances : d’une acception restreinte aux classifications de la biosystématique, conformément à l’usage initial du terme, on passe à une définition élargie aux systèmes classificatoires exclusivement hiérarchiques, puis à tout système de classification, qu’il soit hiérarchique ou non ; la portée du terme est finalement étendue à tout langage documentaire doté, exclusivement ou non, d’une organisation hiérarchique.

40

Dans ces conditions, en formuler une nouvelle définition est un exercice périlleux. Nous nous y risquerons néanmoins, en observant que ce ne sont pas tant les caractères structurels des taxonomies qui sont déterminants pour les définir que la fonction qui est la leur. Pour nous, une taxonomie est un cadre d’organisation pour des ressources numériques de toutes natures (et pas seulement documentaires – en cela les taxonomies ne sont pas toujours des langages documentaires) destiné à en permettre une présentation ordonnée et y donnant accès par navigation hypertextuelle.

41

À côté de cet emploi relatif à des instruments autonomes, on parle aussi de taxonomies (de termes, de classes, de concepts) pour désigner la hiérarchie ou l’arborescence autour de laquelle sont construits d’autres types d’instruments.

Ontologies

De la théorie à l’ingénierie ontologique

42

Rappelons tout d’abord que l’ontologie est la branche de la philosophie qui s’intéresse à la notion d’existence, aux catégories fondamentales de l’existant, et qui étudie les propriétés générales de l’être.

43

L’idée de s’appuyer sur une approche ontologique pour fonder une démarche de représentation des connaissances est relativement ancienne. Barry Smith et Christopher Welty [42] datent du début des années quatre-vingt les réflexions concluant à la nécessité de cette approche. Nicola Guarino [22] développe et argumente par la suite cette idée, et défend le rôle en ingénierie des connaissances d’une ontologie chargée des problèmes de représentation, aux côtés de l’épistémologie davantage occupée de problèmes de raisonnement.

44

Bien que ces développements théoriques soient parfois contestés (voir, par exemple, l’argumentation de Jean Robillard [38] ou celle de Marcia Bates [4]), on est rapidement passé de la théorie à la pratique, et de l’ontologie, au singulier – discipline philosophique, aux ontologies, au pluriel – objets techniques. On a baptisé ontologies des ressources de natures diverses utilisées dans des contextes comme l’intelligence artificielle, l’ingénierie linguistique ou la gestion des connaissances, voire conçues sans visée applicative particulière.

45

Une littérature de plus en plus abondante leur est consacrée. À titre indicatif, une rapide recherche dans deux ressources en ligne (Article@ INIST[20][20] http:// services. inist. fr/ public/ fre/ conslt. ... et ACM Digital Library [21][21] http:// portal. acm. org/ portal. cfm) montre un accroissement sensible depuis 2001 du nombre d’articles répondant à une requête sur le mot « ontologies » [figure 1] (l’utilisation du pluriel permet de regrouper des références en anglais et en français, tout en limitant les occurrences du terme pris dans son acception purement philosophique). Il est vraisemblable que les travaux sur l’architecture du web sémantique, dont les ontologies constituent l’un des piliers, ont contribué à cet accroissement.

Figure 1 - Nombre d’articles répondant a une requête sur le mot « ontologies »Figure 1
46

En parcourant cette littérature, on se rend compte que les aspects théoriques évoqués plus haut y sont toujours représentés, mais que le discours de l’ingénierie, où des ontologies sont décrites en tant que constituants de systèmes à base de connaissances, tend à devenir dominant. Là encore, le paradigme du web sémantique peut être un facteur d’explication, dans la mesure où il aboutit à la mise en place progressive d’une infrastructure normative et technique qui favorise le développement de tels systèmes. Trait d’union entre théorie et ingénierie, l’approche méthodologique, ou ingénierie ontologique, y occupe également une place importante.

Flou terminologique

47

On se rend compte aussi que ce corpus est parcouru de questionnements sur ce qu’est vraiment une ontologie et sur les différences entre ontologies et autres ressources telles que thésaurus, taxonomies, réseaux sémantiques, etc. Malgré son histoire déjà longue, la notion d’ontologie semble en effet être entachée de flou.

48

Dès 1995, Nicola Guarino et Pierdaniele Giaretta [24] constatent que le sens du mot demeure un peu vague, et en étudient sept acceptions possibles. Dix ans plus tard, le vague n’a pas disparu, et Silvia Arano [1], par exemple, cite une dizaine de définitions, qu’elle analyse. Christophe Roche note de son côté [39] : « Bien que les ontologies aient une visée normative, nous devons faire face à de nombreuses définitions et approches différentes et parfois contradictoires. »

49

Le terme ontologie doit donc être considéré comme polysémique, même à ne considérer que son emploi en ingénierie des connaissances. Un bon indice de cette polysémie est fourni par l’observation des deux définitions les plus souvent citées :

50

– « An ontology is an explicit specification of a conceptualization[22][22] « Une ontologie est une spécification explicite d’une... » [21] ;

51

– « An ontology is a formal, explicit specification of a shared conceptualisation[23][23] « Une ontologie est une spécification formelle, explicite,... » [44].

52

Elles présentent une assez grande ressemblance et, de fait, elles ne sont pas contradictoires. La seconde introduit deux differentiae supplémentaires par rapport à la première, shared (partagée) et formal (formelle). En cela, elle est plus spécifique et plus contraignante, et ontologie1 serait un hypéronyme d’ontologie2. En réalité, c’est surtout le caractère obligatoirement formel ou non qui permet de différencier les deux acceptions.

53

Notons que la situation est encore compliquée par le fait que le terme ontologie formelle est lui-même ambigu – voir par exemple [23] : « An ontology is sometimes called a formal ontology, although we shall use the expression "formal ontology" only to refer to a philosophical research field. [24][24] « Une ontologie est parfois appelée ontologie formelle,... » En accord avec la définition 1 proposée par Thomas Gruber, nombreux sont les auteurs qui parlent d’ontologies informelles ou d’ontologies semi-formelles (par exemple [19] [48]).

54

Ces auteurs se trouvent en général parmi ceux qui revendiquent la continuité entre l’ontologie philosophique et les ontologies en ingénierie des connaissances.

55

Dans cette perspective, un grand nombre d’objets peuvent être rangés dans la classe des ontologies, y compris les langages documentaires ; ce qu’illustre le schéma de la figure 2, proposé en particulier dans [42]. Ce schéma est repris par Deborah McGuinness [32], qui y ajoute une délimitation tranchée entre les ressources que l’on peut dénommer ontologies, obligatoirement formelles (bien que l’auteure cite la définition de Thomas Gruber) et d’autres types de ressources [figure 3]. Il est vrai que ce caractère obligatoirement formel n’est pas explicitement stipulé dans le commentaire de ce schéma. Il apparaît néanmoins dans l’adaptation [figure 4] qu’en donne Frédéric Fürst [17, p. 18].

Figure 2 - Objets pouvant être qualifies d’ontologiesFigure 2
Figure 3 - « An ontology spectrum »Figure 3
Figure 4 - Les différents niveaux de formalisme et d’engagement sémantique en représentation des connaissancesFigure 4
56

Dans cet emploi du terme, le caractère formel se superpose à la capacité d’une ontologie à se prêter au raisonnement automatique, ce qui apparaît lorsque les trois schémas précédents sont juxtaposés. Il est plus répandu parmi les « ingénieurs », que ce soit au sein de la communauté de l’intelligence artificielle ou de celle du web sémantique.

57

Les étapes de développement d’une ontologie permettent d’avancer une hypothèse pour articuler ces deux acceptions. Le processus d’élaboration d’une ontologie est schématisé par Frédéric Fürst [17, p. 12] ainsi que le montre la figure 5.

Figure 5 - Construction d’une ontologie opérationnelleFigure 5
58

L’ontologie au sens 2 désigne les objets techniques obtenus in fine. L’ontologie au sens 1 pourrait dénoter chacun des états successifs au cours de ce processus – voire le processus lui-même ; ce que peut expliquer en partie la polysémie régulière du genus de nos définitions : specification, en anglais comme en français, c’est l’action de spécifier ou son résultat.

Ontologies et langages documentaires

59

Nous avons vu plus haut que les ontologies étaient parfois considérées comme incluant les langages documentaires et les taxonomies : « Ontologies on the Web range from large taxonomies categorizing Web sites (such as on Yahoo!) to categorizations of products for sale and their features. [25][25] « Les ontologies sur le Web s’étagent des grandes taxonomies... » [36]

60

Plus rarement, le rapport d’inclusion est vu en sens inverse, et l’on fait des ontologies une sorte de langage documentaire, dans un mouvement d’annexion qui n’est pas toujours argumenté. Michèle Hudon, par exemple, écrit [27] : « Au fil des ans se sont développés des langages documentaires de type catégoriel ou classificatoire (schémas de classification, taxinomies, ontologies) et des langages de type combinatoire (répertoires de vedettes matière, thésaurus, listes de mots clés contrôlés). »

61

Ces assimilations peuvent s’expliquer par une certaine homologie fonctionnelle entre ontologies et langages documentaires. Dans la vision du web sémantique, les ontologies doivent servir de cadre de contrôle et de référence pour l’expression des métadonnées et leur interprétation par des applications « intelligentes ». Elles jouent donc dans ce contexte un rôle similaire à celui des langages documentaires dans les systèmes d’information bibliographiques.

62

Il existe d’autre part une homologie structurelle apparente avec les langages classificatoires. Une hiérarchie de classes de concepts est l’élément central d’une ontologie, en particulier d’une ontologie exprimée dans le langage OWL (Web Ontology Language, ou Langage d’ontologies web). Malgré ces similitudes, nous pensons avec Roberto Poli qu’il est inexact d’assimiler de quelque manière que ce soit ontologies et langages documentaires : « An ontology is not a catalogue of the world, a taxonomy, a terminology or a list of objects, things or whatever else. If anything, an ontology is the general framework (= structure) within which catalogues, taxonomies, terminologies may be given suitable organization.[26][26] « Une ontologie n’est pas un catalogue du monde, une... » [37] Dans cette conception, une ontologie est avant tout un modèle pour la description ou la définition formelle de concepts de diverses natures, de manière à en permettre la manipulation par des automates.

63

Un thésaurus peut, par exemple, être représenté dans une ontologie ; cette ontologie est alors celle des thésaurus, ou d’un certain type de thésaurus, mais en aucun cas celle du domaine de connaissances couvert par le thésaurus considéré. Un thésaurus peut également être transformé en ontologie de domaine, la plupart du temps au prix d’un travail considérable de formalisation. L’exemple d’AGROVOC, décrit par Dagobert Soergel [43], donne une idée de la nature de ce travail et des possibilités qu’il ouvre.

Systèmes d’organisation des connaissances

64

À côté des langages documentaires classiques, toujours bien enracinés, d’autres cadres de référence pour l’indexation et les métadonnées prennent donc place aujourd’hui. Nous avons vu qu’une certaine confusion terminologique règne autour de ces nouveaux instruments. Elle résulte en partie du défaut d’un terme générique qui engloberait à la fois les langages documentaires, traditionnels ou atypiques, leurs déclinaisons actuelles, et divers objets ayant en commun l’ambition de capturer et d’articuler les éléments terminologiques et/ou conceptuels d’un ou de plusieurs domaines de connaissance ou d’activité.

65

Le terme système d’organisation des connaissances pourrait jouer ce rôle. D’après Gail Hodge [26], il a été proposé pour la première fois en 1998, lors du lancement du groupe de travail NKOS (Networked Knowledge Organization Systems).

66

Pour l’auteure citée, ce terme inclut les listes de termes (listes d’autorité, glossaires, dictionnaires), les schémas de classement (classifications, plans de classement et taxonomies) et les réseaux de concepts (thésaurus, réseaux sémantiques, ontologies). Le World Wide Web Consortium (W3C), au moment d’élaborer la recommandation SKOS (Simple Knowledge Organization Systems) sur le format d’encodage et le modèle de représentation de ces systèmes [27][27] Voir page 75., utilise également l’appellation schémas de concepts (concept schemes) [33]. Cette recommandation concerne les thésaurus, listes de vedettes matière, terminologies, glossaires, taxonomies, schémas de classification « et autres formes de vocabulaires contrôlés » mais n’englobe pas explicitement les ontologies, ce qui est compréhensible puisque ces dernières font par ailleurs l’objet d’une part importante des activités de réflexion et de standardisation du consortium.

67

Dans tous les cas, c’est en priorité par rapport à un contexte de description, découverte et repérage des ressources numériques que se placent les systèmes d’organisation des connaissances [28][28] « Used as interactive information services on the Internet....

Critiques et perspectives

68

À l’issue de ce panorama, on peut formuler à l’encontre des langages documentaires quelques remarques critiques en forme de paradoxes.

69

• Après plus d’un siècle d’existence pour les grandes classifications et un demi-siècle pour les thésaurus, et dans un environnement informationnel dont l’évolution est de plus en plus rapide, on ne voit guère de remise en question des structures de langages documentaires classiques.

70

• Les langages documentaires les plus perfectionnés et en principe les mieux adaptés à leur fonction de reconstruction et d’expression des sujets (c’est-à-dire ceux qui sont dotés d’une syntaxe) sont aussi les moins répandus.

71

• L’efficacité des langages contrôlés ne fait aucun doute en théorie, mais on n’est pas parvenu à en apporter une démonstration expérimentale nette et définitive.

72

• Le World Wide Web aurait dû être pour les langages documentaires une formidable occasion d’ouverture, de diffusion et de popularisation, mais cette occasion n’a pas été saisie, faute d’une attention suffisante prêtée à la conception ergonomique d’interfaces adaptées à leur utilisation par des non-professionnels.

73

• Les nouveaux modes de description et d’organisation des contenus numériques ont été conçus et sont utilisés, pour une large part, dans l’ignorance des langages documentaires traditionnels et au sein de communautés étrangères à celle des professionnels de l’information-documentation.

74

• Incertitudes et lacunes terminologiques sont fréquentes dans le champ des systèmes d’organisation des connaissances, alors que le contrôle terminologique devrait être dans ce domaine une préoccupation centrale.

Quel devenir pour les langages documentaires ?

75

En dépit de ces critiques, et malgré les interrogations fréquentes au sujet de la pérennité des langages documentaires, souvent exprimées à travers des questions sur l’avenir de l’indexation ou le devenir du catalogage, ils demeurent aujourd’hui un élément fondamental de la formation et de la pratique des professionnels de l’information.

76

L’effet de substitution des technologies d’indexation et de recherche par les mots du texte aux techniques fondées sur l’analyse intellectuelle et la représentation contrôlée des contenus n’est sans doute que marginal. Il serait du reste intéressant de réunir des éléments permettant de quantifier cet effet ; il faudrait déterminer, par exemple, si la création de thésaurus l’emporte sur leur abandon, dans les entreprises et institutions qui se préoccupent de la mise en valeur de leur capital informationnel.

77

En revanche, la pénétration des langages documentaires classiques dans des univers informationnels peu contrôlés ou mal maîtrisés, et au premier chef dans le World Wide Web, reste très limitée.

78

Si les langages documentaires perdent du terrain actuellement, c’est donc en « parts de marché », marché dont la croissance exponentielle a été maintes fois soulignée. Quant à savoir si dans l’avenir ils verront s’accroître leur rôle dans l’économie numérique et ne resteront pas retranchés dans leurs bastions traditionnels, la réponse dépend à notre sens des résultats d’un certain nombre de chantiers qui restent pour l’essentiel à ouvrir.

79

• La réflexion sur une évolution structurelle des modèles de langages documentaires, probablement à construire autour de la notion de facette et de la convergence des trois grandes familles classiques.

80

• La construction d’un argumentaire détaillé, appuyé sur des expériences réelles ou réalistes, démontrant la plus-value apportée par les langages documentaires dans différentes situations de repérage de l’information.

81

• L’élaboration d’interfaces et de guides d’utilisation permettant un usage intuitif et/mais informé des langages documentaires sur les sites Internet ou intranets.

82

• La reconnaissance de l’expertise des professionnels de l’information-documentation par les autres acteurs de l’organisation des connaissances, et notamment par les concepteurs d’ontologies.

83

• La recherche d’un consensus terminologique et d’une vulgarisation des principaux concepts du domaine en direction de communautés de non-spécialistes.


Références

  • Les URL citées en référence ou dans les notes de bas de page ont été vérifiées à la date du 23 janvier 2007.

  • 1 –  ARANO, Silvia. « Los tesauros y las ontologías en la Biblioteconomía y la Documentación ». Hipertext.net, 2005, n° 3. www. hipertext. net
  • 2 –  AITCHISON, Jean, GILCHRIST, Alan. Thesaurus construction: a practical manual. Londres : Aslib, 1987. 1773 p.
  • 3 –  AUSTIN, Derek. « The development of PRECIS: a theoretical and technical history ». Journal of Documentation, 1974, vol. 30, n° 1, p. 47-102.
  • 4 –  BATES, Marcia J. « After the Dot-Bomb: Getting Web Information Retrieval Right This Time ». First Monday, 2002, vol. 7, n° 7. http:// firstmonday. org/ issues/ issue7_7/ bates/ index. html
  • 5 –  BHATTACHARYYA, Ganesh. « POPSI, Its Fundamentals and Procedure Based on a General Theory of Subject Indexing Languages ». Library science with a slant to documentation, 1979, vol. 16, n° 1, p. 1-34
  • 6 –  BLAIR, David C., MARON, M. E. « An Evaluation of Retrieval Effectiveness for a Full-Text Document-Retrieval System ». Communications of the ACM, 1985, vol. 28, n° 3, p. 289-299
  • 7 –  BRITISH STANDARDS INSTITUTION. Structured vocabularies for information retrieval - Guide - Part 1: Definitions, symbols and abbreviations. BS 8723-1:2005. Londres : BSI, 2005. 9 p.
  • 8 –  BRITISH STANDARDS INSTITUTION. Structured vocabularies for information retrieval - Guide - Part 2: Thesauri. BS 8723-2:2005. Londres : BSI, 2005. 59 p.
  • 9 –  CHAUDIRON, Stéphane. « L’évaluation des systèmes de recherche d’informations ». In : IHADJADENE, Madjid (dir.) Les systèmes de recherche d’informations : modèles conceptuels. Paris : Hermès science publications : Lavoisier, 2004. P. 185-207
  • 10 –  CHAUMIER, Jacques. Le traitement linguistique de l’information. Paris : Entreprise moderne d’édition, 1988. 3e éd. mise à jour et augm. 186 p. (Systèmes d’information et nouvelles technologies)
  • 11 –  CLEVERDON, Cyril W., KEEN, Michael. Aslib Cranfield research project - Factors determining the performance of indexing systems; Volume 2, Test results. 1966. http:// hdl. handle. net/ 1826/ 863
  • 12 –  CROS, René-Charles, GARDIN, Jean-Claude, LEVY, Francis. L’automatisation des recherches documentaires : un modèle général « LE SYNTOL ». Paris : Gauthier-Villars, 1968. 2e éd. revue et augm. XIX-260 p. (Documentation et information)
  • 13 –  DALBIN, Sylvie. « Sujets, concepts et classes : des distinctions fondamentales ». Descripteurs. 9 octobre 2005. http:// dossierdoc. typepad. com/ descripteurs/ 2005/ 10/ souvent_prsente. html
  • 14 –  DEGEZ, Danièle et MENILLET, Dominique. Thésauroglossaire des langages documentaires : un outil de contrôle sémantique. Paris : ADBS Éditions, 2001. 181 p. (Sciences de l’information. Série Recherches et documents)
  • 15 –  DEMAILLY, André. « Robert Pagès et l’analyse codée ». Documentaliste – Sciences de l’information, 1992, vol. 29, n° 2, p. 59-72.
  • 16 –  DRABENSTOTT, Karen M. Understanding subject headings in library catalogs. Ann Arbor : School of Information, University of Michigan, 1998. XV-227 p. www-personal. si. umich. edu/ ylime/ meaning/ meaning. pdf.
  • 17 –  FÜRST, Frédéric. Contribution à l’ingénierie des ontologies : une méthode et un outil d’opérationnalisation. Thèse de doctorat en informatique. École polytechnique de l’Université de Nantes. Soutenue le 25 novembre 2004. XIV-174 p.
  • 18 –  GILCHRIST, Alan. « Thesauri, taxonomies and ontologies: an etymological note ». Journal of Documentation, 2003, vol.59, n°1, p. 7-18
  • 19 –  GAMPER, Johann, NEJDL, Wolfgang, WOLPERS, Martin. « Combining Ontologies and Terminologies in Information Systems ». In : SANDRINI, Peter (dir.) Proceedings of the 5th International Congress on Terminology and Knowledge Engineering, 23 - 27 August 1999, Innsbruck, Austria. Vienne (Autriche) : TermNet, 1999. P. 152-168
  • 20 –  GREENBERG, Jane. « User Comprehension and Application of Information Retrieval Thesauri ». Cataloging & Classification Quarterly, 2004, vol. 37, n° 3-4, p. 103-120
  • 21 –  GRUBER, Thomas R. « A Translation Approach to Portable Ontology Specifications ». Knowledge Acquisition, 1993, vol. 5, n° 2, p. 199-220
  • 22 –  GUARINO, Nicola. « Formal Ontology, Conceptual Analysis and Knowledge Representation ». International Journal of Human-Computer Studies, 1995, vol 43, n° 5-6, p. 625-640
  • 23 –  GUARINO, Nicola. « Formal ontology and information systems ». In : GUARINO, Nicola (dir.) Formal Ontology in Information Systems. Proceedings of FOIS’98, Trento, Italy, 6-8 June 1998. Amsterdam : IOS Press, 1998. P. 3-15
  • 24 –  GUARINO, Nicola et GIARETTA, Pierdaniele. « Ontologies and Knowledge Bases:Towards a Terminological Clarification ». In : MARS, Nicolaas (dir.) Towards Very Large Knowledge Bases: Knowledge Building & Knowledge Sharing. Amsterdam : IOS Press, 1995. IP. 25-32
  • 25 –  HILL, Linda, KOCH, Traugott. « Networked Knowledge Organization Systems: introduction to a special issue ». Journal of Digital Information, 2001, vol. 1, n° 8. http:// jodi. tamu. edu/ Articles/ v01/ i08/ editorial/
  • 26 –  HODGE, Gail. Systems of knowledge organization for digital libraries: beyond traditional authority files. Washington (DC) : Council on Library and Information Resources, 2000. 43 p. (CLIR publication ; 91)
  • 27 –  HUDON, Michèle. « Avant-propos [au numéro thématique sur les langages documentaires] ». Documentation et bibliothèques, 2006, vol. 52, n° 2, p. 83-84
  • 28 –  HUDON, Michèle. « Le passage au XXIe siècle des grandes classifications documentaires ». Documentation et bibliothèques, 2006, vol. 52, n° 2, p. 85-97
  • 29 –  MANIEZ, Jacques. Les langages documentaires et classificatoires : conception, construction et utilisation dans les systèmes documentaires. Paris : Éditions d’organisation, 1987. 291 p. (Systèmes d’information et de documentation)
  • 30 –  MANIEZ, Jacques. « Des classifications aux thésaurus : du bon usage des facettes ». Documentaliste – Sciences de l’information, 1999, vol. 36, n° 4-5, p. 249-260.
  • 31 –  MANIEZ, Jacques. Actualité des langages documentaires : les fondements théoriques de la recherche d’information. Paris : ADBS Éditions, 2002. 395 p. (Sciences de l’information. Série Études et techniques)
  • 32 –  MCGUINNESS, Deborah L. « Ontologies Come of Age ». In : FENSEL, Dieter et al. (dir.). Spinning the Semantic Web: Bringing the World Wide Web to its Full Potential. Cambridge (Mass.) : MIT Press, 2003. P. 171-194.
  • 33 –  MILES, Alistair, BRICKLEY, Dan (dir.). SKOS Core Guide: W3C Working Draft 2, November 2005. www. w3. org/ TR/ 2005/ WD-swbp-skos-core-guide-20051102/
  • 34 –  MINGAM, Michel. « RAMEAU : bilan, perspectives ». Bulletin des bibliothèques de France, 2005, vol. 50, n° 5, p. 38-47
  • 35 –  NATIONAL INFORMATION STANDARDS ORGANIZATION. Guidelines for the Construction, Format, and Management of Monolingual Controlled Vocabularies. ANSI/NISO Z39.19-2005. Bethesda (MD) : NISO Press, 2005. 172 p.
  • 36 –  NOY, Natalya F., MCGUINNESS, Deborah L. Ontology Development 101: A Guide to Creating Your First Ontology. http:// protege. stanford. edu/ publications/ ontology_development/ ontology101. pdf.
  • 37 –  POLI, Roberto. « Ontology for Knowledge Organization ». In : GREEN, Rebecca (dir.) Knowledge organization and change: proceedings of the Fourth international ISKO Conference, July 15-18, 1996. Washington (DC). Francfort : Indeks Verlag, 1996. P. 313-319
  • 38 –  ROBILLARD, Jean. « Ontologies : antinomies, contradictions et autres difficultés épistémologiques du concept ». Revue STICEF, 2004, vol. 11. hhttp:// sticef. univlemans.fr/num/vol2004/robillard-05/sticef_2004robillard_05.htm
  • 39 –  ROCHE, Christophe. « Terminologie & ontologies ». Langages, 2005, n° 157, p. 48-62
  • 40 –  SALTON, Gerard. « Another Look at Automatic Text-Retrieval Systems ». Communications of the ACM, 1986, vol. 29, n° 7, p. 648-656
  • 41 –  SAVOY, Jacques. « Bibliographic database access using free-text and controlled vocabulary ». Information Processing & Management, 2005, vol. 41, n° 4, p. 873-890
  • 42 –  SMITH, Barry, WELTY, Christopher. « Ontology: Towards a New Synthesis ». In : SMITH, Barry, WELTY Christopher (dir.) Formal Ontology in Information Systems: Proceedings of the international conference on Formal Ontology in Information Systems, Ogunquit, Maine, USA, October 17 - 19, 2001. New York : ACM Press, 2001. P. III-X
  • 43 –  SOERGEL, Dagobert et al. « Reengineering Thesauri for New Applications: The AGROVOC Example ». Journal of Digital Information [en ligne], 2004, vol. 4, n° 4. Article n° 257, 2004-03-17. http:// jodi. tamu. edu/ Articles/ v04/ i04/ Soergel/
  • 44 –  STUDER, Rudi., BENJAMINS, V. Richard, FENSEL, Dieter. « Knowledge engineering: Principles and methods ». IEEE Transactions on Data and Knowledge Engineering, 1998, vol. 25, n° 1-2, p. 161-197
  • 45 –  SVENONIUS, Elaine. The intellectual foundation of information organization. Cambridge (Mass.) : The MIT Press, 2001. XIV-255 p. (Digital libraries and electronic publishing)
  • 46 –  SVENONIUS, Elaine. « Unanswered questions in the design of controlled vocabularies ». Journal of the American Society for Information Science, 1986, vol. 37, n° 5, p. 331-340
  • 47 –  VAN SLYPE, Georges. Les langages d’indexation : conception, construction et utilisation dans les systèmes documentaires. Paris : Éditions d’organisation, 1987. 277 p. (Systèmes d’information et de documentation)
  • 48 –  VICKERY, Brian Campbell. « Ontologies ». Journal of information science, 1997, vol. 23, n° 4, p. 277-286.
  • 49 –  WEINBERG, Bella Hass. « Complexity in indexing systems – abandonment and failure: implications for organizing the Internet ». Proceedings of the American Society for Information Science, 1996, vol. 33, p. 84-90.
  • 50 –  WEINER, Sharon G. «The History of Academic Libraries in the United States: a Review of the Literature ». Library Philosophy and Practice, 2005, vol. 7, n° 2. www. webpages. uidaho. edu/ mbolin/ weiner. htm

Notes

[1]

Au Royaume-Uni, par exemple, on passe de 600 nouveaux titres annuellement vers 1825 à 6 000 à la fin du siècle, selon l’Encyclopaedia Britannica.

[2]

Au début du XIXe siècle, il y avait aux États-Unis moins de 100 périodiques vivants (autres que les quotidiens) ; en 1885, on en comptait 9 000 [48].

[3]

Les grandes entreprises deviennent alors des protagonistes du champ documentaire, et c’est en leur sein que les thésaurus et leurs précurseurs sont élaborés.

[4]

Les lecteurs semblent moins friands de ce type de langage : un certain nombre d’études sur l’usage des OPACs font apparaître un déclin de la recherche sur le champ sujet, au profit de la recherche sur les mots du titre.

[5]

Voir pages 66 et suivantes.

[12]

Voir pages 58 et suivantes.

[15]

« Un système pour nommer et organiser des objets en groupes qui partagent des caractéristiques similaires. »

[17]

« Classification systématique selon des principes ou lois généraux »

[18]

« Un système de classification comme la Classification de la Bibliothèque du Congrès est un exemple de taxonomie. »

[19]

« Un thésaurus est une taxonomie. »

[22]

« Une ontologie est une spécification explicite d’une conceptualisation. »

[23]

« Une ontologie est une spécification formelle, explicite, d’une conceptualisation partagée. »

[24]

« Une ontologie est parfois appelée ontologie formelle, mais nous utiliserons l’expression "ontologie formelle" uniquement pour nous référer à un champ de recherches philosophiques. »

[25]

« Les ontologies sur le Web s’étagent des grandes taxonomies pour catégoriser les sites web – comme dans Yahoo! – aux classifications de produits vendus et de leurs caractéristiques. »

[26]

« Une ontologie n’est pas un catalogue du monde, une taxonomie, une terminologie ou une liste d’objets, de choses ou de quoi que ce soit d’autre. Une ontologie serait plutôt le cadre général – la structure – au sein duquel catalogues, taxonomies, terminologies peuvent recevoir une organisation appropriée. »

[27]

Voir page 75.

[28]

« Used as interactive information services on the Internet they have an increased potential to support the description, discovery and retrieval of heterogeneous information resources and to contribute to an overall resource discovery infrastructure. [24] » : « Utilisés comme services interactifs d’information sur Internet, ils ont un potentiel accru pour étayer la description, la découverte et le repérage de ressources hétérogènes d’information et pour contribuer à une infrastructure générale de découverte des ressources. »

Résumé

Français

La première contribution s’ouvre par un panorama critique d’un siècle de développement et d’usages des langages documentaires : Bruno Menon en étudie la formation et l’évolution, il en montre les mérites et les limites, il en analyse les pratiques. Dans la deuxième partie de cet article, il examine les taxonomies et les ontologies, nouveaux outils de recherche d’information apparus avec l’explosion des technologies Internet et les mutations induites des pratiques informationnelles. Il suggère enfin un certain nombre de réflexions et de travaux qui permettront aux langages documentaires – dont le concept pourrait être étendu à celui de systèmes d’organisation des connaissances – de s’imposer demain dans l’économie numérique.

Plan de l'article

  1. 1 - Les langages documentaires au siècle dernier : stabilité et immobilisme
    1. Phylogenèse des langages documentaires
    2. Enracinement dans les pratiques et les milieux traditionnels
    3. Un passage à Internet peu convaincant
    4. À la recherche du langage documentaire parfait
    5. Langages contrôlés contre langage libre
  2. 2 - Taxonomies et ontologies : diversification ou rupture ?
    1. Taxonomies
    2. Ontologies
      1. De la théorie à l’ingénierie ontologique
      2. Flou terminologique
      3. Ontologies et langages documentaires
    3. Systèmes d’organisation des connaissances
  3. Critiques et perspectives
    1. Quel devenir pour les langages documentaires ?

Pour citer cet article

Menon Bruno, « Les langages documentaires. Un panorama, quelques remarques critiques et un essai de bilan», Documentaliste-Sciences de l'Information 1/2007 (Vol. 44) , p. 18-28
URL : www.cairn.info/revue-documentaliste-sciences-de-l-information-2007-1-page-18.htm.
DOI : 10.3917/docsi.441.0018.


Article précédent Pages 18 - 28 Article suivant
© 2010-2014 Cairn.info
back to top
Feedback