Accueil Revues Revue Numéro Article

Documentaliste-Sciences de l'Information

2007/1 (Vol. 44)

  • Pages : 120
  • DOI : 10.3917/docsi.441.0084
  • Éditeur : A.D.B.S.

ALERTES EMAIL - REVUE Documentaliste-Sciences de l'Information

Votre alerte a bien été prise en compte.

Vous recevrez un email à chaque nouvelle parution d'un numéro de cette revue.

Fermer

Article précédent Pages 84 - 92 Article suivant
1

EN FRANCE, LE CHERCHEUR D’INFORMATION « pour et sur l’éducation » est confronté soit au thésaurus MOTBIS, utilisé par les centres de documentation et d’information (CDI) des lycées et collèges et par le réseau SCEREN-CNDP [1][1] SCEREN : Service Culture Éditions Ressources pour l’Éducation..., soit au répertoire RAMEAU [2][2] RAMEAU : Répertoire d’autorité-matière encyclopédique..., utilisé notamment par la Bibliothèque nationale de France (BnF) et les bibliothèques universitaires, soit à ces deux vocabulaires à la fois, comme dans les instituts universitaires de formation des maîtres (IUFM). C’est pourquoi il est apparu nécessaire d’élaborer une interface de recherche (un système d’équivalences) permettant d’accéder harmonieusement aux deux langages : l’outil de recherche projeté doit permettre à un utilisateur de trouver de l’information documentaire pertinente, que celle-ci soit indexée à l’aide de MOTBIS ou de RAMEAU.

2

Si l’on envisage la question d’une façon un peu plus générale et que l’on se place dans la perspective d’interroger des banques de données anglophones et francophones, il ne faut pas oublier de prendre en compte le thésaurus multilingue de l’ONU (UNBIS), celui de l’Unesco, le Thésaurus européen de l’éducation (TEE) et le Thésaurus européen multilingue de l’environnement (GEMET) et cela, au moins dans un premier temps, dans leurs versions anglophone (anglo-américaine) et francophone.

3

Face à cette multiplicité de systèmes d’indexation, l’on ne peut pas se limiter à des procédures de « réindexation physique » entre deux d’entre eux (RAMEAU et MOTBIS, par exemple) et donc à une approche de compatibilité descendante (et appauvrissante). Il semble nécessaire d’envisager un système d’équivalences conceptuelles entre les représentations de concepts présentes dans chacun de ces langages contrôlés, sans passer obligatoirement par une phase de modification de l’indexation initiale.

4

Le schéma classique d’utilisation des langages documentaires, outils uniques pour l’indexation et la recherche des références pertinentes, montre ainsi ses limites : il y a en effet une apparente contradiction entre la nécessité d’élaborer des langages documentaires utilisés par le plus grand nombre possible de centres de documentation pour échanger des références documentaires, et les besoins particuliers de catégories d’utilisateurs spécifiques. Cette contradiction peut être surmontée si l’on accepte de différencier la notion de langage d’indexation de celle d’interface d’interrogation.

5

Il est nécessaire que ces interfaces soient élaborées en cohérence avec les langages d’indexation préexistants et il serait souhaitable que les représentations de concepts apparaissant dans ces derniers ne présentent aucune ambiguïté. Enfin il serait également très souhaitable que cette réflexion ne se limite pas à la seule recherche documentaire stricto sensu, mais soit étendue aux spécificités inhérentes à la recherche d’information en texte intégral dans des bases de données multilingues. Ce qui pose des problèmes de repérage de l’information pertinente de plus en plus cruciaux et de toute évidence encore moins bien maîtrisés par les utilisateurs non expérimentés.

1 - Multiplicité des sources d’information et interopérabilité entre langages documentaires

6

Si l’on se limite aux seuls langages documentaires actuellement utilisés dans des bases de données bibliographiques d’établissements scolaires français ou dans des banques de données sur cédérom largement diffusées en France, on peut recenser, outre RAMEAU et MOTBIS, le thésaurus THEA pour les bases de données documentaires des établissements d’enseignement agricole (aujourd’hui appelé Thésagri, ce thésaurus est maintenant totalement compatible avec MOTBIS 2006), ainsi que les listes de descripteurs spécifiques aux banques de données bibliographiques FRANCIS et PASCAL de l’INIST [3][3] INIST : Institut de l’information scientifique et technique....

7

Cette situation pose un réel problème de repérage de l’information pertinente dans la mesure où le même concept va être représenté, selon les cas, par des descripteurs (ou par des éléments de vedettes matière dans le cas de RAMEAU) hétérogènes. Ce problème avait été mis en évidence dans des articles publiés en 1997 et 1998 par Jacques Maniez et par Danièle Dégez [4][4] Jacques Maniez, « Fusion des banques de données documentaires... et méritait d’être pris en compte dans des interfaces visant à aider les utilisateurs dans leurs recherches.

2 - Évolutions récentes et prévisibles des « langages contrôlés » de représentation des connaissances

8

Le changement d’intitulé de la norme ANSI/NISO Z39.19 entre sa version de 2003 (Guidelines for the construction, format and management of monolingual thesauri) et l’actuelle version publiée en 2005 (Guidelines for the construction, format and management of monolingual controlled vocabularies) n’est certainement pas du domaine de l’anecdote et doit être replacé dans le contexte plus général de l’évolution des langages et nomenclatures documentaires depuis le milieu des années soixante-dix et surtout depuis le début des années deux mille au triple niveau nord-américain, français et international [5][5] Voir pages 66 et suivantes..

9

Il convient en effet de noter que, dans ce domaine et depuis plus d’un siècle, les nouveautés sont d’abord apparues dans le monde anglo-saxon, particulièrement nord-américain, avant d’être reprises en Europe et codifiées sur le plan français (AFNOR) et international (ISO) : ainsi, pour ce qui est des langages documentaires précoordonnés, la Classification décimale de Dewey précède de plus de vingt-cinq ans la Classification décimale universelle, et les Library of Congress Subjects Headings (LCSH) apparaissent plus de soixante ans avant l’adoption par la Bibliothèque publique d’information (BPI) de leur version québécoise (le RVM Laval [6][6] RVM : Répertoire de vedettes-matière de la bibliothèque..., lui même apparu dans les années quarante). En ce qui concerne les langages documentaires postcoordonnés, nous assistons à un phénomène comparable : le premier thésaurus apparaît aux États-Unis à la fin des années cinquante, et les thésaurus monolingues sont codifiés, tant sur le plan américain (ANSI/NISO) que sur les plans international (ISO) et français (AFNOR), au début des années soixante-dix (1974 pour la première édition de Z39.19).

10

Notons également que, si la normalisation en ce domaine n’évolue guère depuis les années quatre-vingt au sein de l’ISO et de l’AFNOR, elle continue à évoluer bien plus régulièrement aux États-Unis puisque la procédure actuelle de révision de la norme ANSI/NISO est la seconde effectuée depuis le début des années deux mille. Cela n’est pas sans conséquences : devant les limites actuelles de la normalisation française et internationale en matière de thésaurus, les consultants français font constamment référence aux évolutions récentes de la normalisation américaine…

11

Les thésaurus eux-mêmes ont certes été les langages documentaires dominants dans le contexte de l’informatisation massive des centres de documentation et des bibliothèques (années quatre-vingt dans le meilleur des cas en France, près de vingt ans après celle de la Library of Congress). Mais ils n’ont pas pris, du moins dans le secteur de l’Éducation nationale, la place des grandes listes nationales d’autorités matière (LCSH, RVM, RAMEAU, etc.) qui gardent par ailleurs une place prépondérante (à coté des classifications décimales !) dans les échanges nationaux et internationaux de données bibliographiques [7][7] Cf. le « bloc 6 » d’UNIMARC – Format bibliographiq... et dans le « web invisible ». Sur le plan d’Internet lui-même, et particulièrement en ce qui concerne les systèmes de méthadones et le web sémantique, les thésaurus se trouvent de plus en plus confrontés à (ou concurrencés par ?) d’autres outils d’organisation et de représentation des connaissances tels que les ontologies.

12

D’un point de vue plus général, les thésaurus sont peut-être victimes à la fois :

  • des contraintes de la normalisation les concernant : aspect très contraignant et d’une certaine façon un peu réducteur, parfois, des possibilités de hiérarchisation des concepts/notions ; stricte limitation de l’utilisation des descripteurs à la représentation des notions constitutives d’un « sujet » (à l’exclusion de tout autre contexte d’utilisation) ;

  • des préventions souvent exercées à l’encontre de la polyhiérarchie (pourtant explicitement prévue par la normalisation existante) ;

  • mais aussi de certaines limites actuelles d’une normalisation (AFNOR, ISO) qui remonte aujourd’hui à vingt ou vingt-cinq ans.

Et, plus généralement, il convient de se demander si le schéma de base qui depuis plus d’un siècle sous-tend la notion même de langage documentaire – le même outil pour l’ensemble des indexeurs utilisant le même système d’indexation documentaire et pour les utilisateurs de bases de données, bibliographiques ou autres, recherchant l’information la plus pertinente sur le sujet qui les préoccupe à un moment donné – est aujourd’hui, face à l’hétérogénéité des ressources immédiatement accessibles et à celle des savoirs et des savoir-faire des utilisateurs concernés, encore véritablement efficace.

3 - Interopérabilité des vocabulaires contrôlés et démarche globale d’interopérabilité

13

S’il convient, comme indiqué précédemment, de bien différencier compatibilité et interopérabilité, il est tout aussi nécessaire de bien noter que des dispositifs d’interopérabilité ont été mis en œuvre avant que le terme ne soit employé et mis en exergue : l’ISBD, les formats UNIMARC (données bibliographiques et autorités) et ISO 2709, le modèle OSI, TCP-IP, Z39.50, etc., en donnent des illustrations dans divers domaines.

14

Si cette notion d’interopérabilité est actuellement au centre des réflexions relatives à l’évolution et à la normalisation des vocabulaires contrôlés (dans la future norme britannique relative à ceux-ci, elle devrait constituer à elle seule une partie d’une cinquantaine de pages), il faut la replacer dans un contexte plus large de la gestion de l’information numérisée : à ce titre, il est intéressant de ce reporter au Référentiel général d’interopérabilité (RGI) publié par le ministère du Budget et de la Réforme de l’État en 2005 [8][8] https:// www. ateliers. modernisation. gouv. fr/ ministeres/.... Il pourra également être intéressant de se reporter au document du ministère des Services gouvernementaux du Québec intitulé Cadre commun d’interopérabilité[9][9] www. msg. gouv. qc. ca/ fr/ administration/ standards/....

4 - L’émergence de la notion d’interopérabilité (interoperability)

15

La notion d’interopérabilité est une notion relativement émergente en France. Bien que le terme interopérabilité apparaisse souvent dans des documents en français accessibles sur Internet, il est loin d’être aussi communément usité que son équivalent anglophone interoperability : une recherche effectuée sur Google le 31 décembre 2006 sur le terme interopérabilité et sur son équivalent anglais donne respectivement 1.310.000 pages en français (dont 1.070.000 « Pages : France ») pour le premier contre 17.900.000 pages pour le second.

16

De la même façon, si l’on consulte les dictionnaires du Conseil international de la langue française (CILF) [10][10] www. cilf. org/ bt. fr. html, on ne trouve pas le terme recherché alors que la consultation du Grand Dictionnaire terminologique[11][11] Office québécois de la langue française : www. oqlf.... nous apporte un résultat positif comportant l’équivalence indiquée et la définition suivante : « Capacité que possèdent des systèmes informatiques hétérogènes à fonctionner conjointement, grâce à l’utilisation de langages et de protocoles communs, et à donner accès à leurs ressources de façon réciproque. Notes : L’interopérabilité implique qu’un programme tournant sur un système ouvert fonctionnera également sur un autre système. L’interopérabilité a besoin de plus qu’une bonne connectivité technique puisqu’elle nécessite l’utilisation d’éléments comme des interfaces de programmation et des formats de données standardisés. L’interopérabilité définie ici est l’interopérabilité technique, mais il en existe d’autres types dont l’interopérabilité sémantique qui est associée à un mode de description de l’information contenue dans une base de données (cette description forme les métadonnées) ».

17

De même, si l’on effectue dans la base de notices d’autorités RAMEAU de la BnF une recherche portant sur « Vedette matière RAMEAU contient interopérabilité », on obtient pour seul et unique résultat la construction « Interconnexion de réseaux (télécommunications) » qui pointe vers 16 notices bibliographiques de la base BN-OPALE+ dont une seule comporte le terme « interopérabilité » dans les mots du titre. Par contre une recherche formulée « Titre contient interopérabilité » le 31 décembre 2006 permet de trouver 14 références, toutes publiées depuis 1994 (à l’exception de deux publiées respectivement en 1988 et 1989).

18

Une recherche également opérée le 31 décembre 2006 dans le SUDOC [12][12] Système Universitaire de DOCumentation, catalogue collectif... sur « interopérabilité » ou « inter-opérabilité » dans le titre donne 45 résultats : parmi les références trouvées, 38, soit plus de 80 % de l’ensemble, ont été publiées ces dix dernières années (depuis 1996) et seulement deux sont antérieures à 1990 (respectivement 1988 et 1989).

19

En fait, par delà l’interopérabilité des systèmes informatiques (ou interopérabilité technique), définie dans les années quatre-vingt par le modèle OSI et les divers protocoles de réseaux d’ordinateurs (protocole TCP-IP, protocole http, etc.), les préoccupations actuelles concernent de plus en plus l’interopérabilité des données elles-mêmes et c’est dans ce cadre que se place la problématique de l’interopérabilité terminologique.

5 - Interopérabilité terminologique et repérage de l’information pertinente

20

Depuis le début de la décennie deux mille, plusieurs documents, essentiellement d’origine anglo-saxonne, ont mis l’accent sur l’intérêt et l’importance de l’interopérabilité en ce domaine.

21

En premier lieu, plusieurs interventions relatives à ce sujet lors des 67e, 68e et 69e conférences générales de l’IFLA[13][13] IFLA : Fédération internationale des associations de... (2001-2003).

22

Amélioration de l’interopérabilité des systèmes grâce à Z39.50 : profils Z39.50 et bancs d’essai pour des développements en bibliothèques, par William E. Moen (2001) [14][14] www. ifla. org/ IV/ ifla67/ papers/ 050-203f. pdf.

23

Cette intervention d’un membre de l’École de bibliothéconomie et de sciences de l’information de l’Université du Nord Texas met l’accent, dès son introduction, sur les objectifs d’interopérabilité recherchés par le protocole ANSI-NISO défini « au début des années 1980 » et sur les améliorations qui lui ont été apportées à la fin des années quatre-vingt-dix (profils Z39-50). Elle présente ensuite les caractéristiques et les apports du « profil de Bath » publié en 2001 pour améliorer l’interopérabilité en ce domaine.

24

Dans le cas de ce premier document, il convient donc de préciser que l’interopérabilité recherchée ne se limite pas à l’interopérabilité terminologique sur des indexats de natures et d’origines différentes, mais concerne des ensembles de notices bibliographiques dans des formats MARC hétérogènes. Cependant cette situation va se retrouver dans une bonne partie des cas dans lesquels des systèmes d’interopérabilité terminologique sont susceptibles d’être mis en œuvre.

25

Interopérabilité des accès matière : conclusions du projet HILT (High Level Thesaurus), par Dennis Nicholson (2002) [15][15] www. ifla. org/ IV/ ifla68/ papers/ 006-122e. pdf.

26

Cette contribution d’un membre du Centre pour la recherche informatisée en bibliothèque de la Strathclyde University de Glasgow présente les différentes phases du projet cité dans le titre et le prototype d’« interopérabilité des accès matière » TeRM (Terminologies Route Map ou navigateur terminologique) mis en œuvre à cette occasion en 2001-2002 sur LCSH et les thésaurus de l’Unesco et de l’AAT dans une approche Z39.50.

27

La réalisation de l’interopérabilité entre vocabulaires d’accès matière et systèmes d’organisation de la connaissance : une analyse méthodologique, par Lois Mai Chan et Marcia Lei Zeng (2002) [16][16] www. ifla. org/ IV/ ifla68/ papers/ 008-122f. pdf.

28

Cette contribution de deux membres de l’École de bibliothéconomie et de sciences de l’information de l’Université du Kentucky aborde le problème indiqué dans le titre dans le cadre de « l’environnement hétérogène de la recherche documentaire sur le Web […], du besoin d’interopérabilité entre […] différents vocabulaires et classifications mais aussi différentes langues » et dresse un panorama des méthodes employées pour réaliser l’interopérabilité.

29

Schémas de métadonnées pour les répertoires par sujet, par Lynne C. Howarth (2003) [17][17] www. ifla. org/ IV/ ifla69/ papers/ 053f_trans-Howarth.....

30

L’auteur de cette communication, membre de la Faculté d’études de l’information de l’Université de Toronto, présente dans un premier temps les différents types de sujets définissables avant d’étudier les différentes structures de métadonnées applicables à ces divers sujets et d’étudier les moyens d’améliorer les dispositifs actuels, parmi lesquels il place l’interopérabilité en toute première préoccupation : « La nécessité d’améliorer les protocoles de métadonnées inter-domaines et les passerelles pour supporter l’échange des enregistrements ira grandissant ; les standards de métadonnées supportant l’interopérabilité aux niveaux technique, sémantique, organisationnel, inter-communauté et international peuvent nécessiter d’être développés ou améliorés. »

31

En deuxième lieu, la parution de la première édition de la norme ISO 16642 : Applications informatiques en terminologie – Plate-forme pour le balisage de terminologies informatisées[18][18] Computer applications in terminology – Terminological... (août 2003).

32

L’introduction de cette norme définit un méta-modèle de plate-forme informatisée fondé sur « une approche intégrée » utilisable « aussi bien dans l’analyse de nomenclatures terminologiques, existantes que dans la détermination de nouvelles » et inscrit délibérément cette approche dans l’optique de formats SGML (ISO 8879 de 1986) et de XML, (W3C). Elle indique également qu’une implémentation spécifique du méta-modèle terminologique exprimée en XML est appelée TML (Terminological Markup Language). Par ailleurs le point 4 de cette norme définit « les principes généraux et le principe d’interopérabilité » applicables à un ensemble de balisages TML.

33

Enfin le changement d’intitulé de la norme américaine ANSI-NISO Z39.19 qui, dans sa dernière édition d’août 2005, comme nous l’avons déjà indiqué, est devenu Guidelines for the construction, format and management of monolingual controlled vocabularies alors que, depuis sa première édition en 1974, elle faisait mention de « monolingual thesauri ».

34

L’une des nouveautés majeures de cette nouvelle édition réside dans le fait qu’elle consacre, dans ses annexes, une quinzaine de pages à la question de l’interopérabilité qu’il convient d’établir entre des vocabulaires contrôlés existants de diverses natures (listes d’autorités matière comme LCSH et RAMEAU, mais aussi thésaurus comme ERIC [19][19] ERIC : Educational Resources Information Center., etc.) et envisage plusieurs dispositifs pour y parvenir.

35

Outre ces documents, d’origine essentiellement anglo-saxonne (nord-américaine et britannique), comme nous venons de le voir, il faut également citer le projet multilingue européen MACS (Multilingual ACcess to Subjects = Accès multilingue par sujet) étudié par la BnF au début de la présente décennie.

36

Ainsi que l’indique la BnF [20][20] Cf. BnF-RAMEAU Cooperation internationale.mht., ce projet « a pour but de développer l’accès multilingue par sujet, afin de permettre à l’utilisateur final ou professionnel d’interroger directement, dans sa langue maternelle, le contenu de catalogues étrangers : un utilisateur français pourrait ainsi rechercher, en français, sur le sujet qui l’intéresse, tous les documents signalés par les catalogues de bibliothèques étrangères, même s’ils sont indexés en allemand, en anglais ou en toute autre langue. Actuellement, dans le prototype proposé, l’interrogation par sujet peut se faire, au choix, en anglais, en allemand ou en français, dans les catalogues des quatre bibliothèques nationales partenaires : la Bibliothèque nationale suisse (SNL), la BnF, la British Library, la Deutsche Bibliothek. Mais, tel qu’il a été conçu, ce projet pourrait être étendu à d’autres langues. L’interrogation multilingue a été rendue possible grâce au travail effectué par les gestionnaires des trois langages d’indexation utilisés dans ces bibliothèques : RAMEAU (pour le français), LCSH (pour l’anglais), SWD (pour l’allemand) […] À terme, relier ainsi les langages d’indexation déjà existants par des équivalences devrait permettre d’accéder, via le protocole Z39.50, aux millions d’indexations déjà réalisées avec ces langages. »

37

Sur le plan français, il convient également de citer la contribution intitulée « Accès thématique en bibliothèque numérique : le rôle du langage documentaire de type "thésaurus" », dans l’ouvrage Les bibliothèques numériques dirigé par Fabrice Papy [21][21] Hermès – Lavoisier, 2005. P. 151-177..

38

Ce travail, chapitre 8 d’une étude menée sous la direction d’un enseignant-chercheur de l’Université Paris-8, aborde successivement les points suivants :

  • « La problématique de l’accès thématique en bibliothèque numérique » ;

  • « Interopérabilité sémantique et langages documentaires » ;

  • « Le macrothésaurus en action : application en contexte gouvernemental ».

Dans cette troisième partie, l’étude présente et compare les macrothésaurus EUROVOC (Union européenne), TSBGC (Thésaurus des Sujets de Base du Gouvernement du Canada), GILS Topic Tree (États-Unis) et GLL (Government Category List, Grande-Bretagne).

39

Bien qu’il n’ait pas été initialement envisagé dans cette perspective d’interopérabilité multilingue, le projet OTAREN, mené à bien, à titre expérimental, par le SCEREN-CNDP depuis 2004, s’inscrit dans une problématique similaire.

L’exemple du projet OTAREN

Contexte général de l’élaboration d’OTAREN

40

OTAREN (Outil Thématique d’Aide à la Recherche pour l’Éducation Nationale) est le prototype exploratoire d’une famille de langages de recherche susceptibles d’être proposés par le CNDP, dans un avenir plus ou moins proche, à diverses catégories d’utilisateurs : il a été conçu en fonction d’un contexte général qui est développé par ailleurs dans le cadre de ce numéro thématique et dont les principaux points sont :

  • la diversification des modes d’accès à l’information sur les ressources accessibles à partir des micro-ordinateurs et ses conséquences en terme de « repérage de l’information pertinente » ;

  • l’apport de recherches documentaires portant à la fois sur du langage libre (mots du résumé, mots clés, etc.) et sur du langage contrôlé (descripteurs d’un thésaurus) ;

  • la problématique de la différenciation entre langages d’indexation et interfaces de recherche.

La possibilité, apparue au début des années quatre-vingt-dix sur certains logiciels de recherche documentaire sur micro-ordinateur, d’effectuer des recherches en « plein texte » sur un ensemble de champs (mots du titre, du résumé et de l’indexation, contrôlée ou non…) a mis en évidence trois phénomènes.

41

Les recherches effectuées uniquement sur une zone d’indexation contrôlée par le langage d’indexation sont toujours productrices de « silence documentaire », même si elles sont généralement très satisfaisantes en terme de lutte contre le « bruit documentaire ». Une bonne connaissance préalable du langage documentaire implanté ainsi que des procédures d’optimisation de la recherche (utilisation de l’autopostage sur le thésaurus) permet d’obtenir de bons résultats sans pour cela approcher l’exhaustivité en terme de pertinence.

42

Les recherches effectuées en « plein texte » permettent souvent d’exhumer des références documentaires tout à fait pertinentes qui ne pourraient pas être retrouvées par l’intermédiaire du langage documentaire implanté. Par contre, la recherche « plein texte » est à la fois potentiellement productrice de bruit documentaire (recherches portant sur des chaînes de caractères ambiguës) en même temps que d’un silence documentaire parfois extrêmement important.

43

Les chances d’améliorer les résultats de la recherche sont augmentées si l’utilisateur sait utiliser de façon conjointe l’autopostage descendant (dans le cas d’une recherche thématique avec un thésaurus) et la troncature, tout en restant quelque peu attentif à l’ambiguïté potentielle de certaines chaînes de caractères. Néanmoins, avec la plupart des outils actuels, ce type de recherche correspond fondamentalement à une recherche documentaire de type « expert », qui reste un but à atteindre dans une démarche de formation à la recherche documentaire mais n’est, de toute évidence, pas le cas de la plupart des élèves, au début de leur cursus secondaire tout au moins.

Étapes de l’élaboration d’OTAREN (2004-2006)

44

Historique de l’élaboration d’OTAREN 2006 francophone : 15 janvier 2004-28 avril 2006

45

OTAREN a été élaboré par la Direction des ressources et des technologies (DRT) du SCEREN-CNDP à partir de janvier 2004 sur la base initiale d’une version précédente du thésaurus MOTBIS (version 3.1 de 2001) et de la liste d’identificateurs ID-MEMO (complément à MOTBIS de noms de personnages et de sites maintenu par le CRDP de Poitou-Charentes entre 1992 et 2004). Ceci dans la double perspective de l’élaboration d’une nouvelle version du thésaurus (MOTBIS 2006) et de la compatibilité descendante avec le système d’indexation RAMEAU utilisé pour l’indexation des références bibliographiques dans la plupart des grandes bases bibliographiques françaises actuelles : BN-Opale de la BnF, SUDOC de l’ABES, ELECTRE, etc.).

Deux exemples d’équivalences terminologiques présentes dans OTAREN

Le premier des exemples présentés ci dessous, l’époque de Louis XIV (qui pourrait également être formulé par « France, 1643-1715 »), est représentatif de choix qui ont permis de passer d’environ 9 650 représentations de concepts et d’entités dans MOTBIS 3.1 et ID-Mémo (un peu plus de 9 000 dans MOTBIS 2006) à un peu moins de 8 000 dans OTAREN.

Dans cet exemple, comme dans celui qui suivra, les « Te » (représentations du concept concerné dans d’autres systèmes d’indexation que MOTBIS) apparaissent séparés des « Ep » (représentations du concept concerné dans MOTBIS ou dans le langage naturel). Une fonctionnalité présente dans G3I, la commande « Transformer », permet de fusionner les deux listes sous la dénomination unique de « Te ». Entre crochets on trouvera l’indication du système d’indexation source.

époque de Louis XIV : 1643-1715 1130

?Te Bordeaux (Gironde) | 1652-1653 (Soulèvement) [RAMEAU]

Colbert, Jean Baptiste (1619-1683) [RAMEAU]

Fouquet, Nicolas (1615-1680) [RAMEAU]

France | 1643-1661 (Régence) [RAMEAU]

France | 1643-1715 (Louis XIV) [RAMEAU]

France | 1648-1653 (Fronde) [RAMEAU]

France | History | Louis XIV, 1643-1715 [LCSH]

?La Reynie, Gabriel Nicolas de (1625-1709) [RAMEAU]

Louis XIV (roi de France ; 1638-1715) [RAMEAU]

Mazarin, Jules (1602-1661) [RAMEAU]

?Vauban, Sébastien Le Prestre (1633-1707 ; marquis de) [RAMEAU]

Ep cardinal Mazarin

Colbert, Jean-Baptiste : 1619-1683 [MOTBIS]

colbertisme

cour de Louis XIV

époque de Louis XIV

Fouquet, Nicolas : 1615-1680 [MOTBIS]

France de Louis XIV

Fronde : 1648-1652 [MOTBIS]

La Reynie : 1625-1709 [MOTBIS]

Louis le Grand : 1638-1715

Louis XIV : 1638-1715 [MOTBIS]

Louis XIV, roi de France

Mazarin, Jules : 1602-1661 [MOTBIS]

Nicolas de La Reynie

Nicolas Fouquet

Régence : 1643-1661

régence d’Anne d’Autriche : 1643-1661

règne de Louis XIV

règne de Louis XIV : 1643-1715

royaume de Louis XIV

sous Louis XIV

temps de Louis XIV

Vauban : 1633-1707 [MOTBIS]

Tg 17e siècle

royaume des Bourbons : 1589-1789

Ts question protestante : 1685-1715

Ta château de Versailles

classicisme : 17-18e siècle

Grande-Bretagne : 1603-1714

guerre de Trente Ans : 1618-1648

mercantilisme

musique de Lully : 1632-1687

musique de Vivaldi : 1678-1741

œuvre de Molière : 1622-1673

œuvre de Madame de Sévigné : 1626-1696

œuvre de Pierre Corneille : 1606-1684

œuvre de Racine : 1639-1699

Id frCNDP-03.09.032323

Pr Oui

No NC. périodes et événements

Og OTAREN2006 / MB 2007 /

Lg fre

Mt 944.033 /

Ds 29/09/2003

Cr -03.09.29.

Dm 27/03/2006

Dp 29/09/2003

Su -03.09.29. / PPPBBBPF-03.09.29. /

Va Non

Am Non

Nt 1130

Le deuxième exemple est assez révélateur d’une variété de formulations quelque peu différentes relatives à une notion du domaine éducatif, celle d’outil pédagogique, dans les divers langages consultés.

Ces deux exemples, tout comme les quelque 7 976 autres constituant OTAREN, devront, bien évidemment, être évalués en fonction de l’homogénéité conceptuelle des 7 978 « grappes terminologiques » qu’ils proposent, de leur adaptation à tel ou tel public utilisateur (dans l’état actuel des choses, OTAREN représente un prototype généraliste s’adressant essentiellement à un public d’adultes et devra de toute évidence être adapté à des catégories d’utilisateurs plus ciblées) et à divers outils et situations de recherche (bibliographique ou non). L’expérimentation et l’évaluation du prototype d’OTAREN sont prévues dans le courant de l’année civile 2007.

outil pédagogique 2105

Te audiovisual aid [TEE-ENG]

Audiovisual aids [UNESCO-ENG]

autoinstructional aid [TEE-ENG]

Auxiliaire audiovisuel [UNESCO-FRE]

Edition scolaire [RAMEAU]

Educational publications [UNESCO-ENG]

Educational publishing [LCSH]

guide de l’enseignant [TEE-FRE]

Livre de l’enseignant [UNESCO-FRE]

matériel autodidactique [MOTBIS 3.1 / TEE-FRE]

Matériel didactique [RAMEAU / UNESCO-FRE]

Matériels didactiques [UNBIS-FRE]

moyen audiovisuel [TEE-FRE]

moyen d’enseignement [TEE-FRE]

Publication educative [UNESCO-FRE]

teacher’s guide [TEE-ENG]

teaching aid [TEE-ENG]

Teaching guides [UNESCO-ENG]

Teaching materials [UNBIS-ENG / UNESCO-ENG]

Ep aide audiovisuelle

aide didactique

autoscopie

auxiliaire autodidactique

édition pédagogique

imprimerie scolaire

livre du maître

matériel d’enseignement

matériel éducatif

matériel pédagogique

média pédagogique

publication scolaire

support didactique

Tg technique pédagogique

Ts didacticiel

éducation aux médias

jeu éducatif

laboratoire de langues

manuel scolaire

théâtre scolaire

TICE

Ta BCD

CDI. Centre de Documentation et d’Information

centre de documentation pédagogique

cours : éducation

équipement audiovisuel

équipement scolaire

film documentaire

film éducatif

instructions pédagogiques

méthode audiovisuelle

pratique de classe

séquence d’enseignement

support de diffusion

télévision éducative

Id frCNDP-02.09.003863

Pr Oui

No NC. cas général

Og MOTBIS 3.1 / MOTBIS 2006 /

Lg fre /

Mt 371.3 /

Ds 04/01/2002

Cr PPMIHNGF-02.09.17.

Dm 09/11/2006

Dp 17/09/2002

Su PPMIHNGF-02.09.17. / PPMPKEOG-05.09.23. /

Va Non

Am Non

Gr IUFM /DRTSJ /

Nt 2105

46

Cette élaboration a été effectuée à l’aide du logiciel G3I (Gestionnaire d’Interfaces d’Indexation et d’Interrogation), outil d’élaboration et de maintenance de langages documentaires « client-serveur » également utilisé pour la maintenance du thésaurus MOTBIS.

47

Dans sa version la plus récente (fin avril 2006), OTAREN comporte 7 989 notions déclarées équivalentes à 59 825 autres termes parmi lesquels 29 804 « constructions » RAMEAU.

48

Le vocabulaire disponible est actuellement essentiellement français, mais des équivalences dans d’autres langues utilisées dans les pays de l’Union européenne (anglais-américain, allemand, espagnol, italien, etc.) sont relativement faciles à établir par l’intermédiaire de RAMEAU (LCSH) et par celui d’outils terminologiques tels que les dictionnaires du Conseil international de la langue française (CILF) ou le Grand Dictionnaire terminologique de l’Office québécois de la langue française. Ces trois mêmes sources (RAMEAU, dictionnaires du CILF, GDT) ont été également utilisées pour établir 1 335 définitions (relatives à 1 335 des 7989 notions du « noyau » d’OTAREN 2006).

49

En ce qui concerne l’aspect « dictionnaire » d’OTAREN, chaque terme préférentiel est susceptible d’être accompagné d’une définition (champ « Définition » de la « fiche terme » dans G3I) précisant la signification du concept retenu dans l’outil de recherche et dans les langages d’indexation (RAMEAU, MOTBIS, etc.) avec lesquels elle est compatible. Toujours à la date du 28 avril 2006, 1 335 des 7989 « termes préférentiels » d’OTAREN 2006 comportent une définition (la plupart du temps issue des notices RAMEAU ou des définitions présentes dans les dictionnaires du CILF, ou plus rarement car plus récemment utilisé du Grand Dictionnaire terminologique). Les définitions actuelles ont été établies à des fins uniquement exploratoires et le développement de ce système de définitions ainsi que son emploi par les utilisateurs finals (élèves des collèges et lycées, par exemple) passent bien entendu par une négociation juridique de la possibilité d’utilisation des sources de définition repérées avec leurs producteurs (BnF, CILF, Office québécois de la langue française) ainsi que par une réflexion sur le bien-fondé de leur utilisation et sur les caractéristiques précises de leur formulation.

50

Vers un OTAREN bilingue (français-anglais)

51

Une fois les équivalences établies entre OTAREN, d’une part, et les systèmes d’indexation français (RAMEAU et MOTBIS), d’autre part, il semblait logique d’utiliser les liens déjà établis entre RAMEAU et de grands systèmes d’indexation nord-américains (LCSH et, moins fréquemment, MeSH). Dans la même optique, les équivalences ont été également établies avec les systèmes d’indexation multilingue que sont les thésaurus de l’ONU (UNBIS-ENG et UNBIS-FRE) et ceux de l’Unesco (UNESCO-ENG et UNESCO-FRE) : ces systèmes d’indexation présentent en effet de multiples intérêts (émanations d’institutions internationales pérennes, ils proposent des représentations de concepts qui recoupent largement celles présentes dans OTAREN et ils sont facilement accessibles sur le Web).

52

Le travail effectué depuis le début du mois de mai 2006 a actuellement permis (fin décembre 2006 et malgré une interruption consécutive aux congés annuels) d’établir plus de 11 000 équivalences supplémentaires avec les quelque 8 000 notions présentes dans OTAREN. Dans l’état actuel des choses, cela pourrait nous amener, vers la fin de l’année scolaire 2006-2007, à un outil d’interopérabilité de l’ordre de 85 000 termes comprenant environ 8 000 représentations de notions non ambiguës et environ 77 000 équivalents.

53

Le tableau ci-dessous présente, d’un point de vue chronologique et statistique, les grandes étapes de cette élaboration.

Principales étapes de l’élaboration d’OTAREN

Notes

[1]

SCEREN : Service Culture Éditions Ressources pour l’Éducation nationale.

CNDP : Centre national de documentation pédagogique.

[2]

RAMEAU : Répertoire d’autorité-matière encyclopédique et alphabétique unifié.

[3]

INIST : Institut de l’information scientifique et technique (CNRS).

[4]

Jacques Maniez, « Fusion des banques de données documentaires et compatibilité des langages d’indexation », Documentaliste – Sciences de l’information, 1997, vol. 34, n° 4-5, p. 212-224.

Danièle Dégez, avec des contributions de Claudine Masse, Florence Rénier et Anne-Marie Sardon, « Compatibilité des langages d’indexation : mariage, cohabitation ou fusion ? Quelques exemples concrets », Documentaliste – Sciences de l’information, 1998, vol. 35, n° 1, p. 3-14.

[5]

Voir pages 66 et suivantes.

[6]

RVM : Répertoire de vedettes-matière de la bibliothèque de l’Université Laval.

[7]

Cf. le « bloc 6 » d’UNIMARC – Format bibliographique.

[11]

Office québécois de la langue française : www. oqlf. gouv. qc. ca/ ressources/ gdt. html

[12]

Système Universitaire de DOCumentation, catalogue collectif des bases de données universitaires françaises, géré par l’Agence bibliographique de l’enseignement supérieur (ABES).

[13]

IFLA : Fédération internationale des associations de bibliothécaires et des bibliothèques.

[18]

Computer applications in terminology – Terminological markup framework.

[19]

ERIC : Educational Resources Information Center.

[20]

Cf. BnF-RAMEAU Cooperation internationale.mht.

[21]

Hermès – Lavoisier, 2005. P. 151-177.

Résumé

Français

À partir de l’exemple de l’information « pour et sur l’éducation », cette dernière étude aborde la délicate question de la compatibilité et de l’interopérabilité des langages documentaires, conditions d’un juste repérage de l’information pertinente dans des sources de plus en plus nombreuses et volumineuses. François Feyler explique ici que, lorsqu’on est confronté à une multiplicité de systèmes d’indexation, il faut envisager un système d’équivalences terminologiques entre les représentations de concepts présentes dans chacun des langages contrôlés, sans passer obligatoirement par une phase de modification de l’indexation initiale. Ce qu’illustre le projet OTAREN développé par le CNDP pour l’Éducation nationale.

Plan de l'article

  1. 1 - Multiplicité des sources d’information et interopérabilité entre langages documentaires
  2. 2 - Évolutions récentes et prévisibles des « langages contrôlés » de représentation des connaissances
  3. 3 - Interopérabilité des vocabulaires contrôlés et démarche globale d’interopérabilité
  4. 4 - L’émergence de la notion d’interopérabilité (interoperability)
  5. 5 - Interopérabilité terminologique et repérage de l’information pertinente
  6. L’exemple du projet OTAREN
    1. Contexte général de l’élaboration d’OTAREN
    2. Étapes de l’élaboration d’OTAREN (2004-2006)

Pour citer cet article

Feyler François, « De la compatibilité à l'interopérabilité en matière de repérage d'information pertinente. La problématique et l'exemple d'OTAREN», Documentaliste-Sciences de l'Information 1/2007 (Vol. 44) , p. 84-92
URL : www.cairn.info/revue-documentaliste-sciences-de-l-information-2007-1-page-84.htm.
DOI : 10.3917/docsi.441.0084.


Article précédent Pages 84 - 92 Article suivant
© 2010-2014 Cairn.info
back to top
Feedback