Accueil Revues Revue Numéro Article

Documentaliste-Sciences de l'Information

2005/2 (Vol. 42)

  • Pages : 60
  • DOI : 10.3917/docsi.422.0135
  • Éditeur : A.D.B.S.

ALERTES EMAIL - REVUE Documentaliste-Sciences de l'Information

Votre alerte a bien été prise en compte.

Vous recevrez un email à chaque nouvelle parution d'un numéro de cette revue.

Fermer

Article précédent Pages 135 - 137 Article suivant
1

DE LA RELATION QU’ENTRETIENT LA COMPAGNIE IBM AVEC L’INFORMATIQUE documentaire, on pourrait dire que c’est une histoire d’amour qui dure depuis cinquante ans. 1954 est en effet la date à laquelle le premier système de recherche documentaire sur machine IBM 701 a été mis en marche à l’US Naval Ordnance Test Station. Et 2003 a vu le lancement de Web Fountain, outil de text mining pour le traitement multilingue et l’analyse des contenus web.

2

Tout au long de ce demi-siècle d’informatique documentaire, IBM sera très présent et souvent innovateur. Les logiciels développés par la compagnie seront une des clés du développement de l’informatisation documentaire. Certains des progiciels IBM, des packages comme l’on disait alors, connaîtront un large succès tant aux États-Unis qu’en Europe. D’ailleurs, une bonne partie de ces logiciels conçus pour le domaine documentaire seront développés en Europe et particulièrement en France. IBM sera l’un des seuls constructeurs, avec, à un moindre degré, la CII et Siemens, à occuper pendant de longues années le créneau du logiciel documentaire, avant l’avènement des micro-ordinateurs.

3

Installé au Centre d’études et de recherches IBM à La Gaude, près de Nice, l’ITIRC (IBM Technical Information Retrieval Center) fut longtemps un centre d’excellence en matière d’automatisation documentaire et a vu défiler au cours des années soixante-dix de nombreux professionnels de la documentation venus s’informer sur les possibilités offertes par l’informatique dans leur domaine [1].

4

Dès 1957, un chercheur d’IBM, Hans Peter Luhn, publiait dans l’IBM Journal of Research and Development un article qui devait avoir un grand retentissement [9]. Dans ce texte, suivi d’un autre paru l’année suivante dans la même revue [10], Luhn posait les principes de l’indexation automatique sur des bases statistiques, à partir des calculs de fréquence des mots dans un texte et des calculs de distance entre mots. Les travaux de Luhn furent également importants dans le développement des index de permutations.

Des premiers pas de l’indexation automatique aux premiers logiciels de recherche documentaire

5

En 1959, Francis Levéry, qui deviendra conseiller scientifique à la compagnie IBM France, conduit les premiers travaux d’automatisation sur machines à cartes perforées à Saint-Gobain, travaux rapportés en 1962 dans le Bulletin des bibliothèques de France [11]. Francis Levéry s’intéressera en particulier aux problèmes d’analyse et d’indexation automatiques [7]. En 1962, il sera l’auteur d’un des trois rapports sur l’organisation de la documentation scientifique dans le cadre du Grand Prix de la documentation scientifique organisé par le CNRS [8]. Rappelons, pour mémoire, que les deux autres rapports avaient pour auteurs Jean-Claude Gardin et Éric de Grolier.

6

En 1964 ce sera les premiers tests à la CSF du logiciel SAGESSE sur ordinateurs IBM 1401 et 1620 [13]. Deux ans plus tard, Sagesse, ou Système automatique de gestion et de sélection de la documentation, deviendra le premier progiciel d’informatique documentaire. Il sera ensuite porté sur les premiers ordinateurs de troisième génération, la gamme 360.

7

Sagesse, en 1968, deviendra le progiciel IRMS (Information Retrieval and Management System) pour le DOS 360 [4]. Ce logiciel de recherche documentaire ne fonctionnait qu’en batch, c’est-à-dire en traitement par lots. IRMS sera le premier progiciel de recherche documentaire à connaître une large diffusion et, adopté par de nombreux centres de documentation, il fera beaucoup pour le développement de l’informatisation documentaire en France.

8

En 1974 apparaîtra une version d’IRMS en mode conversationnel, R-IRMS (Remote IRMS), sous DOS ou OS/VS 360.

9

Parallèlement à IRMS, IBM développe en 1967-1968 deux logiciels de recherche documentaire en texte intégral pour l’OS 360 ou 370, les logiciels TEXT-PAC et DPS (Document Processing System). Text-Pac sera surtout utilisé en interne chez IBM, en particulier au centre de recherches de La Gaude. Ces deux logiciels ne tournent alors qu’en traitement par lots.

De logiciels de recherche documentaire en texte intégral à un système de gestion de bibliothèque

10

Événement important, en 1972 : IBM lance le produit STAIRS (Storage and Information Retrieval System), un logiciel de recherche en texte intégral. Ce produit pour machine IBM 360 sous OS/CICS travaille en mode conversationnel. Il va devenir l’archétype des logiciels documentaires en texte intégral.

11

Stairs sera pendant de longues années un des produits phares de la recherche documentaire, avec les logiciels Mistral de la CII [3] et Golem de Siemens. Il sera adopté et adapté par le serveur BRS et deviendra sous ce nom l’un des premiers moteurs de recherche. C’est ce moteur qui sera utilisé par le serveur français G-CAM.

12

Quatre autres programmes d’IBM figuraient également dans le recensement du software documentaire en France réalisé et publié par l’ADBS en 1973 [12], des programmes fonctionnant sur machines 360 sous OS :

  • CIG : interrogation d’un système documentaire en langage naturel ;

  • COMP-VOC : comparaison des vocabulaires des questions et du corpus ;

  • THESAUT-TP : création automatique d’un thésaurus à partir de profils ou questions documentaires ;

  • VOC GENE-TP : liste du vocabulaire généré par mots, masques et racines dans un corpus documentaire.

Il s’agissait là essentiellement d’outils internes associés à Text-Pac, et développés par un chercheur français, F. Adrien. Ils ne furent pas commercialisés, ou très peu.

13

Parallèlement à Stairs, IBM, à la fin des années soixante-dix et au début des années quatre-vingt, lance DOBIS-LIBIS, système de gestion de bibliothèques [2]. Issu de la convergence de deux logiciels développés au départ par des utilisateurs, DOBIS (Dortmunder Bibliothekssystem), de l’université de Dortmund, et LIBIS (Leuvens Integraal Bibliotheek System), de l’Université catholique de Louvain, ce produit est un des premiers logiciels de gestion intégrée de bibliothèques. En France, il sera utilisé, entre autres, par la bibliothèque de la direction générale de l’INSEE, les PTT, le CNRS, la bibliothèque universitaire de Nice.

14

Dobis-Libis couvre l’ensemble des fonctions bibliothéconomiques : acquisitions, catalogage, prêt. Il sera ultérieurement interfacé avec Stairs.

Diversification des outils, premier système intégré de gestion de l’information

15

À partir du milieu des années soixante-dix, IBM enrichit sa gamme autour de Stairs, selon le modèle ci-dessus.

16

ATMS (Advanced Text Management System) est un logiciel d’entrée de données et de traitement de texte.

17

PRINTEXT est, quant à lui, un logiciel de photocomposition reconnaissant le format et les codes Stairs.

18

TLS (Thesaurus and Linguistic System) est un logiciel de traitement linguistique d’aide à l’interrogation avec Stairs. Il comporte deux sous-programmes. Le premier, FLEX, permet l’inclusion dans une question des formes flexionnelles des termes de la requête. Le second, THES, permet la création et la consultation de thésaurus pour enrichir une question.

19

Avec cet ensemble de programmes, nous disposons de l’un des premiers systèmes intégrés de gestion de l’information. Bien entendu, à l’époque, tout ceci est fortement consommateur de ressources informatiques et nécessite des ordinateurs relativement puissants.

Élargissements récents : GED, text mining, balisage, etc.

20

Au fil des années, Stairs aura des successeurs adaptés aux technologies informatiques modernes, tels que Search Manager puis Media Miner.

21

IBM suivra l’évolution des systèmes d’information avec des produits orientés gestion électronique des documents comme IBM Content Manager, veille informationnelle tel que T-WATCH, catégorisation automatique et text mining comme le dernier en date des produits IBM, Web Fountain.

22

Dans cette rapide revue de l’apport d’IBM aux systèmes de documentation, il convient aussi de rappeler les travaux d’un ingénieur IBM, Charles F. Goldfarb qui, au début des années quatre-vingt, a développé le langage GML (Generalized Markup Language). Celui-ci sera à la base du développement de SGML, appelé au succès que l’on sait.

23

La compagnie IBM a toujours porté un grand intérêt au traitement de l’information textuelle et non structurée et ceci sous tous ses aspects : recherche documentaire, traduction automatique, gestion du document, etc., et elle aura été un moteur important de l’informatisation documentaire, en particulier en France avec des hommes tels que Francis Levéry, F. Adrien (longtemps membre de la commission Techniques documentaires de l’ADBS), G. De Dain, F. Guedeney ou R. Dubon.

24

Qu’ils en soient ici remerciés !


Références

  • 1 –  ADRIEN (F.) et al. Eléments d’un diagnostic sur un système documentaire en grandeur réelle : le système ITIRC - La Gaude (IBM France). Documentaliste, 1974, n° spécial, hors série, p. 7-11
  • 2 –  CHONEZ (A.). Le système DOBIS/LIBIS d’automatisation de bibliothèque. Documentaliste - Sciences de l’information, juillet-octobre 1983, vol. 20, n° 4-5, p. 161-162
  • 3 –  CREPOUX (E.). Les logiciels documentaires MISTRAL et STAIRS dans la perspective du texte intégral. Documentaliste - Sciences de l’information, mai-juin 1982, vol. 19, n° 3, p. 87-91
  • 4 –  DAIN (G. de), GUEDENEY (F.), INGELAERE (M.-F.). Gestion et sélection de documentation avec IRMS. Documentaliste, décembre 1969, vol. 6, n° 4, p. 3-10
  • 5 –  DUBON (R.). Système de recherche de documentation avec terminaux à écran cathodique. Documentaliste, 1971, n° spécial, hors série, p. 59-61
  • 6 –  LE DÛ (J.). Utilisation d’un ordinateur pour la diffusion sélective et la recherche rétrospective de la documentation chimique. Documentaliste, 1971, n° spécial, hors série, p. 28-38
  • 7 –  LEVÉRY (F.). La documentation automatique. Science et Vie, n° hors série, « L’informatique », 1968, p. 109-119
  • 8 –  LEVÉRY (F.). Projet pour un centre national de documentation. In : L’organisation de la documentation scientifique. Paris : Gauthier-Villars, 1964. P. 155-193
  • 9 –  LUHN (H.P). A statistical approach to mechanized encoding and searching of literature information. IBM Journal of research and development, 1957, n° 1, p. 309-317
  • 10 –  LUHN (H.P). The automatic creation of literature abstracts. IBM Journal of research and development, 1958, n° 2, p. 159-165
  • 11 –  PICOT (G.), DÉRIBÉRÉ-DESGARDES (M.-L.), LEVÉRY (F.). Une expérience de sélection automatique de documentation. Bulletin des bibliothèques de France, 1962, n° 4, p. 185-295
  • 12 –  SOUS-COMMISSION INFORMATIQUE DOCUMENTAIRE DE L’ADBS. Le software documentaire disponible en France : premier complément et mise à jour. Documentaliste, septembre 2003, vol. 10, n° 3, p. 133-156
  • 13 –  TAMMAN (L.), GAMP (J.). Le système de documentation automatique à la CSF. Documentaliste, mars 1969, vol. 6, n° 1, p. 3-16

Résumé

Français

Depuis un demi-siècle, la compagnie IBM est un moteur du développement de l’informatique documentaire. Très tôt intéressée par le traitement de l’information textuelle, plus récemment tournée vers les systèmes de gestion d’information, elle a conçu un certain nombre de logiciels qui ont marqué l’informatisation des services de documentation et des bibliothèques. Dans ce court article – esquisse d’une histoire qui reste à écrire –, Jacques Chaumier rappelle les grandes lignes du développement et de l’utilisation, notamment en France, de ces produits.

Pour citer cet article

Chaumier Jacques, « La saga IBM de l'informatique documentaire. Quelques jalons », Documentaliste-Sciences de l'Information, 2/2005 (Vol. 42), p. 135-137.

URL : http://www.cairn.info/revue-documentaliste-sciences-de-l-information-2005-2-page-135.htm
DOI : 10.3917/docsi.422.0135


Article précédent Pages 135 - 137 Article suivant
© 2010-2014 Cairn.info
back to top
Feedback