Accueil Revues Revue Numéro Article

Documentaliste-Sciences de l'Information

2005/3 (Vol. 42)

  • Pages : 60
  • DOI : 10.3917/docsi.423.0227
  • Éditeur : A.D.B.S.

ALERTES EMAIL - REVUE Documentaliste-Sciences de l'Information

Votre alerte a bien été prise en compte.

Vous recevrez un email à chaque nouvelle parution d'un numéro de cette revue.

Fermer

Article précédent Pages 227 - 231 Article suivant
1

C’EST SUR L’HISTOIRE QUE L’ON S’EST APPUYÉ POUR ENGAGER UN DÉBAT SUR LA numérisation du patrimoine. Et Troyes, la ville de Chrétien et de la « bibliothèque bleue », proche de Clairvaux, était bien l’une des villes idéales pour ce faire, ainsi que l’a souligné Michel Rudent, élu municipal chargé des nouvelles technologies. Si des défis y ont été relevés dès le XIIe siècle en matière de diffusion du savoir, l’époque actuelle est interpellée par des questions nouvelles qui nous obligent à « hiérarchiser l’information pour garder une lisibilité dans le flot mondial », assurer le rayonnement de l’Europe dans l’avenir, préserver la diversité culturelle et la mettre « à l’abri du secteur marchand » ; ce qui représente un enjeu culturel, identitaire, mais aussi économique.

2

La numérisation, rappelle Éric Gross, fait l’objet de toutes les attentions du ministère de la Culture depuis plusieurs années. Si l’accent avait d’abord été mis sur les outils tels que des bases de données ou des catalogues, il se porte désormais sur les textes. Après avoir privilégié une approche « esthétique », on a progressivement étendu le champ aux fonds à caractère scientifique. Google, aujourd’hui, a l’ambition de numériser le savoir mondial et de mettre le producteur en relation directe avec l’usager, en occultant tous les obstacles, y compris celui du droit d’auteur. Or une œuvre « ne peut pas vivre » sans citation implicite et explicite et sa diffusion en ligne implique que l’on recourre toujours à des médiateurs, à des « metteurs en scène du texte » proposé à l’usager. En relation avec des bibliothèques européennes, la BnF a l’ambition de relever le défi que représente la mise en ligne de corpus multilingues « contextualisés ». Ce projet, qui adopte une approche qualitative, doit marquer la place de la culture dans la construction de l’identité européenne.

Perspective historique : la diffusion des savoirs, du parchemin au numérique

3

C’est le mode d’accès qui est abordé ensuite par une première évocation historique. Philippe Rey a rappelé le rôle joué par le livre au Ier siècle dans la vie intellectuelle en Europe. L’imprimerie, en revanche, ne peut pas être considérée comme une révolution car elle ne modifie pas le mode d’accès au texte, contrairement aux récentes évolutions techniques qui, elles, ont entraîné un bouleversement du mode d’accès à l’information. Mais, s’il est techniquement possible de réaliser une bibliothèque universelle, celle-ci n’implique pas mécaniquement un meilleur accès pour l’homme.

Le programme de colloque

Ouverture de la journée

  • Michel Rudent, adjoint au maire de Troyes chargé des nouvelles technologies

  • Éric Gross, Directeur du livre et de la lecture au ministère de la Culture et de la Communication

  • Philippe Rey, préfet de l’Aube

Perspective historique : la diffusion des savoirs, du parchemin au numérique

Session animée par Thierry Delcourt, directeur de la médiathèque de l’agglomération troyenne

  • La diffusion des textes au XIIe siècle : l’exemple de Clairvaux et le réseau des abbayes cisterciennes, par Jean-Paul Bouhot, chercheur à l’Institut de recherche et d’histoire des textes (IRHT)

  • L’évolution des techniques au service de la connaissance : l’exemple des cartes et plans, par Hélène Richard, chef du Département des cartes et plans à la Bibliothèque nationale de France

  • Le numérique : évolution ou révolution ? par Michel Melot, conservateur général honoraire des bibliothèques

4

L’accent a été mis alors sur les opérations de numérisation faites en France, notamment en Champagne-Ardenne, et la question a été posée de savoir si Google présentait un risque réel de mainmise par une entreprise américaine du secteur privé sur le savoir universel et quel impact cette situation pourrait avoir sur l’avenir intellectuel. Si ce processus ne peut pas être maîtrisé, il peut avoir des conséquences sur la création, la transmission et le comportement des hommes. Il convient d’accompagner ces mouvements par une réflexion philosophique, économique et juridique et de définir des voies pour l’innovation technique pour que les savoirs différents portent tous leurs fruits. Autrement dit d’adopter une attitude volontariste impliquant les pouvoirs publics et de ne pas laisser le marché décider.

5

L’importance de la contextualisation est illustrée par les manuscrits médiévaux. Jean-Paul Bouhot, qui étudie depuis plusieurs années ceux de Clairvaux, met l’accent sur les trois types de savoirs qu’ils transmettent : un savoir pratique autour du livre, un savoir historique sur la vie religieuse et un savoir idéologique sur la pensée des hommes du passé. Il démontre aussi que l’analyse des modes de copie et des circuits suivis par celles-ci est également riche d’enseignement. Se plaçant ensuite sur un tout autre plan, il souligne que la numérisation facilite l’étude de manuscrits difficiles d’accès pour des questions de conservation ou d’éloignement géographique. Mais la numérisation suscite aussi de nouvelles méthodes de lecture. Il faut garder en mémoire que les manuscrits sont des objets qui ont un « poids » et que ce poids doit être transmis.

6

L’étude d’un fonds très particulier, celui des cartes et plans de la BnF, permet également à Hélène Richard de souligner l’importance de la mise en contexte mais aussi les opportunités offertes à cet égard par la numérisation et les techniques nouvelles. Ce sont des documents qui, pour des raisons historiques, sont dispersés dans de multiples bibliothèques, y compris hors de France. Les cartes représentent par ailleurs un investissement important et, dans un souci de rentabilité, elles ont ainsi été maintes fois réutilisées moyennant quelques corrections, voire diffusées sous une forme périmée. Les cartes copiées ont été nombreuses, ce qui rend leur identification difficile et nécessite à cet égard un corpus important. Souvent abîmées, ne serait-ce qu’en raison de leur format important qui résiste mal aux manipulations nombreuses, on s’en débarrassait dès qu’elles étaient jugées obsolètes.

7

Les catalogues, aujourd’hui en ligne, représentent une aide importante et permettent d’organiser des systèmes de conservation partagée avec divers établissements, y compris à l’étranger. Le numérique permet aussi de rapprocher virtuellement des fonds éclatés et de les valoriser. En revanche, la numérisation des cartes, souvent de grand format, est particulièrement délicate à réaliser. S’y ajoutent des contraintes liées à leur consultation en ligne qui exige des outils adaptés et régulièrement mis à jour et des contraintes spécifiques d’accès au document qu’il faut structurer et indexer, voire illustrer avec d’autres documents qui peuvent poser des problèmes liés aux droits d’auteur. Les documents « nés numériques », une pratique adoptée très tôt dans le domaine cartographique, représentent d’autres contraintes en terme de conservation. Et que dire de la conservation et de la mise à disposition des cartes qui se construisent à la demande de l’usager ou des systèmes GPS qui impliquent que l’on définisse les pans d’information à conserver mais aussi ceux qui, comme dans le passé, doivent être jetés car jugés périmés ?

Sommes-nous aujourd’hui face à une évolution ou à une révolution ?

8

Telle était la question posée à Michel Melot qui souligne que l’on qualifie souvent de révolution une simple modification. Si le codex, l’imprimerie, la numérisation sont trois révolutions, comment qualifier alors les blogues ? Représentent-ils une révolution dans le numérique ou sont-ce des évolutions qui s’emboîtent ? On constate bien qu’il faut prendre du recul par rapport à une série de clichés. La numérisation s’inscrirait plutôt dans un mouvement logique sans rupture avec une évolution commencée avec la naissance du langage et ne serait qu’un nouveau moyen de reproduction. Opposer, par ailleurs, l’analogique au numérique n’est qu’un « traquenard » du vocabulaire puisque numériser consiste à reproduire des images par ressemblance, c’est-à-dire par analogie. S’il devait y avoir une nouveauté, ce serait l’extension au son du codage déjà appliqué à l’image et au texte, signe du retour au poids de l’oralité dans la transmission de la culture.

Bibliothèques virtuelles : mythe ou réalité

• La place des moteurs de recherche dans l’organisation des savoirs

Débat animé par Hervé Le Crosnier, maître de conférences à l’université de Caen

Intervenants : John Lewis Needham, Strategic Partner Development, Google France ; Henri Le More, directeur de Librissimo (entreprise de numérisation à la demande) ; Monique Hubey, directrice de la bibliothèque municipale de Lyon ; Gilles Gudin de Vallerin, directeur de la bibliothèque centrale de l’agglomération de Montpellier et président de l’Association des directeurs de bibliothèques municipales et intercommunales des grandes villes de France (ADBGV) ; Xavier de la Selle, directeur des archives départementales de l’Aube ; Thierry Delcourt, directeur de la médiathèque de l’agglomération troyenne

• Le projet Michael : un inventaire européen des fonds culturels numérisés, par Christophe Dessaux, chef de la mission Recherche et technologie, et Thierry Claerr, conservateur à la Direction du livre et de la lecture, ministère de la Culture et de la Communication

9

Au XVIIe siècle, la lithographie qui permettait de reproduire le texte et l’image par estampage a représenté une révolution « photographique ». Dès cette époque, on pouvait tout reproduire, en dehors du son, en donnant l’illusion du réel – l’image, comme on le sait depuis toujours, pouvant être manipulée. La révolution en matière de numérisation ne réside que dans l’intégration de différents messages sonores et visuels par une procédure de reproduction minimale qu’est le pixel. Si recourir à une fragmentation la plus simple et universelle n’est pas nouveau, comme le prouve le recours aux codes que sont le langage et l’écriture, la numérisation permet, en revanche, « de parfaire le canevas ».

10

La transmission à distance serait-elle une révolution ? La nouveauté ne réside que dans la facilité, dans l’universalité potentielle et dans la nouvelle construction puisque l’on ne communique plus par des documents primaires mais par reproductions successives, quel soit le support initial. Ce qui souligne l’importance d’un médium, qui donne une gamme infinie de possibilités. Si la technique n’est pas nouvelle en soi, c’est la dimension qui est nouvelle, comme les blogues dont l’un des avatars est le blogcasting, un nouveau mode de journalisme dont la diffusion est immédiate. C’est cet aspect qui est révolutionnaire, voire préoccupant, et qu’il convient d’analyser.

11

La notion d’auteur « s’évapore », elle est même « pulvérisée » parce que des équipes collectives ne se situent pas sur le même plan qu’un écrivain entendu dans un sens traditionnel. Le mode de l’édition classique, qui concentre sa production sur des objets en fonction d’une rentabilité espérée et immédiate, n’est plus applicable alors que la créativité semble libre sur le web. Dans le mode blogue, par exemple, il n’y a pas d’auteur identifiable. On reproduit des extraits de documents figurant sur le web, souvent avec la complicité de leurs auteurs. La création devient collective et n’est plus le fait de professionnels. Dans ce système qui n’est évidemment pas gratuit, la révolution n’est pas technique mais juridique et économique. Elle remet en cause la frontière entre le public et le privé et autorise un mode de conversation, d’égal à égal. Il y a toujours des auteurs et des récepteurs, mais ceux-ci partagent le même outil. L’œuvre est gratuite. Les chercheurs cherchent même à éviter les éditeurs qui leur apparaissent comme des freins. On accepte facilement de payer le matériel, les logiciels et un temps de communication – c’est ce que vendent Microsoft, Wanadoo ou Google –, mais pas les contenus.

12

Le modèle économique du médium est différent du modèle économique de l’auteur. Remontant à nouveau dans l’histoire, Michel Melot rappelle que le livre est la première industrie culturelle. Au XVIe siècle, il arrivait que des protestants éditent des catéchismes catholiques, en considération du seul intérêt économique de l’opération et dans l’indifférence au contenu. C’est un nouveau monde qui s’ouvre avec un mode de communication et une économie fondés sur le contenant. Deux modèles économiques s’affrontent aujourd’hui : le modèle économique « attrape-tout » de Google, fondé sur un champ le plus large possible, et un modèle « européen » fondé sur un choix validé par des experts. La révolution numérique n’est pas tant dans la technique, qui n’en est qu’une parmi d’autres, que dans l’aspect économique.

« Quand Google défie l’Europe » : un plaidoyer de Jean-Noël Jeanneney

Le président de la Bibliothèque nationale de France fut l’un des premiers à réagir publiquement au projet annoncé par Google, en décembre 2004, de numériser une quinzaine de millions de livres imprimés (cf. sa tribune dans Le Monde du 22 janvier 2005). Au-delà de la prouesse technologique dont au passage il salue la performance, Jean-Noël Jeanneney s’interroge, dans un livre tout récemment publié*, sur les conséquences sociales et philosophiques de cette mainmise d’un seul acteur sur l’accès au patrimoine intellectuel mondial, qui ne peut que renforcer une vision unilatérale du monde. Car les menaces, déjà réelles, prennent ici une autre ampleur : poids encore plus lourd de la culture anglo-saxonne, domination écrasante des éditeurs américains, diffusion en masse de la recherche d’outre-Atlantique. Par ce plaidoyer, il entend secouer « notre éventuelle passivité » face au défi que représente Internet dans l’accès à la connaissance par tous et mettre en garde sur le danger d’une homogénéisation forcée des cultures que fait peser ce projet américain Google Print.

La philosophie dominante de Google, rappelle Jean-Noël Jeanneney, est la seule recherche du profit. S’appuyant sur l’exemple du modèle déjà existant sur ce moteur de recherche, il craint que ce projet de numérisation ne soit financé entre autres par des liens publicitaires, pervertissant ainsi l’objectivité des recherches effectuées sur ces fonds. Le risque étant que la hiérarchie des ouvrages proposés soit fortement influencée par le mode de fonctionnement de Google Print.

Or ces accords entre organisations publiques (des bibliothèques, en l’occurrence) et entreprises privées devraient se conclure sur la base d’un équilibre assuré par la participation d’acteurs financièrement désintéressés. Le rôle de l’État en tant que régulateur est ici primordial pour encourager et soutenir notamment les initiatives du monde culturel.

Comment, alors, répondre à cet ambitieux projet de Google ? Par la création d’un moteur de recherche européen, financé par des fonds publics, pour maintenir une certaine concurrence et garantir notre indépendance, ou par une numérisation forcenée du patrimoine de l’Europe qui lui permette, sous conditions, d’avoir sa place dans les fonds traités par le moteur ? L’auteur esquisse des pistes de réflexion et rappelle que dans ce domaine, où les choses évoluent très vite, il est urgent de prendre rapidement des décisions pour ne pas se laisser distancer. Il en appelle à la responsabilité des pays européens et esquisse, en conclusion, les grands traits de ce qui pourrait devenir une véritable force culturelle européenne et pourrait alors se permettre de « tutoyer Google » !

* Jean-Noël Jeanneney, Quand Google défie l’Europe : plaidoyer pour un sursaut, Paris, Mille et une nuits, 2005, 114 p.

Le vibrant appel de Jean-Noël Jeanneney a porté ses fruits : un décret instituant un comité de pilotage en vue de la création d’une bibliothèque numérique européenne est paru au JO n° 162 du 13 juillet 2005, texte n° 43 (voir p. 172).

Bibliothèques virtuelles : mythe ou réalité

13

• La place des moteurs de recherche dans l’organisation des savoirs

14

Pour introduire un débat sur ce thème, il était opportun d’apporter des précisions techniques sur le mode de fonctionnement des moteurs [1][1] Moteurs de recherche et bibliothèques numériques, introduction.... Hervé Le Crosnier a rappelé qu’ils sont constitués d’un robot d’exploration qui rapporte les documents, d’un système qui va indexer ceux-ci en fonction de la fréquence de certains mots et des liens qui mènent à eux, et d’une interface qui présente les documents selon des critères techniques, « sociaux » mais aussi économiques. Puisque ces moteurs sont des « passages obligés des internautes » et que les pages de résultats les plus consultées sont les trois premières, on mesure pleinement les enjeux du système. D’autant plus qu’ils représentent aujourd’hui un nouveau média adapté au fonctionnement de l’Internet, lié à la performance de leurs outils mais aussi à la propension des entreprises qui les gèrent à lever des capitaux et à les réinvestir dans de nouveaux outils publicitaires et de nouveaux services. On comprend aussi que peu de place soit laissée à des concurrents potentiels, ce qui fait craindre des dérives liées à un monopole sur l’accès à la culture et à la connaissance.

15

Les bibliothèques numériques, autre modèle proposé, sont « des collections limitées, coordonnées, catégorisées, où les métadonnées de catalogage occupent une place centrale ». Hervé le Crosnier les analyse à leur tour en distinguant une phase de numérisation, une phase d’indexation probabiliste et « sociale » de chaque page et une phase de consultation qui pose des questions en matière d’ergonomie et de gestion des accès. Les réutilisations potentielles des documents étant infinies sur les réseaux, il conclut que les modèles qui seront proposés seront des modèles mixtes entre les bibliothèques numériques offrant des accès contextualisés et des moteurs de recherche intégrant les documents dans un « flux médiatique ».

16

• Un panorama des services de Google

17

C’est le modèle d’une entreprise, celle de Google Europe, qui est présenté ensuite par John Lewis Needham. Après avoir exposé son historique et son mode de fonctionnement non hiérarchisé, il indique l’objectif poursuivi : « organiser l’information et la rendre universellement accessible et utile à tous », quel que soit le support. Il précise que, contrairement à ce qui est souvent affirmé, le système est fondé sur la pertinence des réponses, ce qui signifie que les liens sponsorisés sont indépendants des requêtes.

18

Présenté comme un « service pour les bibliothèques et les éditeurs », Google Print doit donner accès non seulement aux ouvrages appartenant au domaine public mais aussi, sous forme d’extraits, aux 85 % d’ouvrages invisibles car épuisés mais toujours protégés par le droit d’auteur [voir ci-dessus]. Google Scholar est un service spécialisé dans la recherche d’articles à partir de divers documents scientifiques et universitaires. Le système Google étant conçu comme un service universel, il est prévu à terme d’intégrer dans le moteur généraliste les références de ce type de documents. Pour parfaire ce tableau, un nouveau service devait être présenté : c’est Google institutionnel, destiné à des intranets et permettant de mieux connaître les ressources réservées aux membres d’une organisation donnée. Un panorama incomplet, les services développés par Google étant, comme on peut le constater par ailleurs [2][2] Panoplie des services Google, VNUnet, s.d., www. vnunet...., très divers. On retiendra aussi que Google se présente non comme un concurrent mais comme un catalyseur à la recherche de partenaires que sont les éditeurs, « maîtres du jeu », et les bibliothèques, mais aussi des partenaires techniques et logistiques.

19

• Diverses expériences de numérisation dans le domaine culturel

20

Gilles Gudin de Vallerin a attiré l’attention sur les travaux de numérisation réalisés dans sa région, le Languedoc-Roussillon, mais aussi sur les pratiques de lecture, y compris de lecture en ligne, tels qu’ils ressortent d’une étude récente pour rappeler que ce sont les lecteurs qui doivent être placés au cœur du débat sur la numérisation des savoirs.

21

Monique Hubey a souligné les changements socio-culturels opérés par l’Internet et les opportunités offertes par les technologies. La bibliothèque municipale de Lyon, une très grande bibliothèque, chargée de plusieurs missions, numérise depuis 1992 et, pour pallier des services devenus inadaptés dans l’environnement électronique, a développé un service baptisé « Guichet du savoir », destiné à aider les usagers. Dans son intervention présentant les travaux réalisés pour la création et la mise en œuvre de ce service, elle a insisté sur l’importance du travail qui doit être réalisé en amont pour concevoir une interface simple et sur la nécessité de recourir à de multiples outils et de multiples partenaires.

22

L’entreprise de numérisation à la demande Librissimo [3][3] www. librissimo. com, présentée par Henri Le More, entend apporter une solution au problème des livres épuisés en proposant, par le biais des catalogues de bibliothèques diffusés en ligne, un système d’impression à la demande. Et ce dans le plus strict respect du droit d’auteur. Il permet ainsi, même si ce n’est pas l’objectif majeur, de créer une bibliothèque numérique uniquement potentielle puisque ce ne sont que les catalogues de références qui sont disponibles en ligne, et en tout cas de sauvegarder des ouvrages.

23

Xavier de la Selle, qui reconnaît lui aussi les opportunités offertes par le numérique, a mis l’accent sur la spécificité des archives et les problèmes plus particuliers qu’elles pouvaient poser. Certaines limites sont liées à la nature même des documents qui présentent des contenus et des structures très particulières. D’autres sont liées aux instruments de recherche, qui requièrent des normes spécifiques et une contextualisation importante alors que les moteurs de recherche créent un « décalage entre le travail de présentation de l’information et la réalité des usages ». Ce qui devrait être privilégié, ce sont des plates-formes de travail collaboratives et les démarches interactives avec les internautes qui sont plus complexes que la recherche par un moteur.

24

Thierry Delcourt évoque alors le programme de numérisation entrepris depuis 1998 à Troyes. Après avoir numérisé dans un premier temps les images « remarquables », ce sont les documents non artistiques, plus difficiles, tels que des incunables, des cartes et des plans que l’on a voulu mettre à la disposition du public. Le risque de doublon a été soigneusement évité et le traitement permet d’accéder au contenu en mode image et de faire des recherches sur le texte par indexation. Mais, malgré le financement important d’un programme qui répondait à une légitimité culturelle, les statistiques de consultation du site sont très basses et le contenu n’est pas accessible aux moteurs. C’est pourtant un travail très contextualisé, proche de ce que pourrait représenter la bibliothèque européenne numérique. Mais, reconnaît-il, c’est l’intérêt des bibliothèques et non celui du public qui avait été privilégié. Pour y remédier, deux approches permettraient de mettre ce fonds davantage en valeur : une indexation de masse, de type Google, et le choix de critères de sélection qui répondraient aux attentes du public - soit les deux modèles objets du débat d’aujourd’hui, un modèle de sélection en masse ou un modèle présélectionné.

25

Quant au projet Michael [4][4] Voir notre n° 2/2005, page 95., dernier sujet abordé lors de cette journée, c’est un exemple de projet associant différents partenaires européens afin de proposer, grâce à un moteur spécifique, un accès simple et rapide aux collections numérisées des musées, des bibliothèques et des archives de divers pays et de permettre leur réutilisation dans des contextes divers.

Notes

[1]

Moteurs de recherche et bibliothèques numériques, introduction à une table ronde, Troyes, 3 juin 2005, par Hervé le Crosnier. VECAM, 27 juin 2005. www. vecam. org/ article. php3? id_article= 461

[2]

Panoplie des services Google, VNUnet, s.d., www. vnunet. fr/ static/ google. htm

[4]

Voir notre n° 2/2005, page 95.

Résumé

Français

Quelque temps après l’annonce par le moteur de recherche américain Google d’un ambitieux projet de numérisation et de diffusion d’ouvrages, un colloque s’est penché sur les travaux en cours en France et sur les perspectives européennes de numérisation du patrimoine culturel et scientifique. Proposé le 3 juin à Troyes par le ministère de la Culture et de la Communication dans le cadre des Rencontres pour l’Europe de la culture, ce colloque s’est d’abord intéressé à certains aspects historiques de la diffusion des savoirs pour envisager ensuite la réalité présente des bibliothèques numériques et leurs perspectives d’évolution.

Plan de l'article

  1. Perspective historique : la diffusion des savoirs, du parchemin au numérique
  2. Sommes-nous aujourd’hui face à une évolution ou à une révolution ?
  3. Bibliothèques virtuelles : mythe ou réalité

Pour citer cet article

Battisti Michèle, « Rencontre pour l'Europe de la culture. Vers une numérisation globale des savoirs. L'ambition de Google, les perspectives européennes», Documentaliste-Sciences de l'Information 3/2005 (Vol. 42) , p. 227-231
URL : www.cairn.info/revue-documentaliste-sciences-de-l-information-2005-3-page-227.htm.
DOI : 10.3917/docsi.423.0227.


Article précédent Pages 227 - 231 Article suivant
© 2010-2014 Cairn.info
back to top
Feedback