![]() |
Documentaliste-Sciences de l’information | 382-386 Distribution électronique Cairn pour les éditions ADBS. © ADBS. Tous droits réservés pour tous pays. Il est interdit, sauf accord préalable et écrit de l’éditeur, de reproduire (notamment par photocopie) partiellement ou totalement le présent article, de le stocker dans une banque de données ou de le communiquer au public sous quelque forme et de quelque manière que ce soit. |
Journée d’étude ADBS
Sabine André
1EN QUELQUES ANNEES, L’IMAGE NUMERIQUE s’est imposée tant au niveau de la production, avec la démocratisation des appareils photo numériques, qu’à celui de la valorisation d’images par la numérisation : le numérique permet un accès rapide aux images, la création de produits multimédia, une meilleure exploitation du fonds... Le passage au numérique paraît aujourd’hui incontournable – encore faut-il bien négocier ce virage : quels sont les éléments à prendre en compte pour gérer au mieux un fonds d’images numériques ou pour amorcer un projet de numérisation ? Comment suivre le développement du numérique tout en en déjouant les pièges ? Enfin, quel impact cette « révolution » aura-t-elle sur les métiers de la documentation ?
2- Définition de l’image. Une image numérique est définie par le nombre de pixels (picture element) qui la composent (largeur x hauteur). Sa résolution, qui s’exprime en points par pouce (dpi), relie sa taille (en pixels) à sa dimension physique. Quant à la définition, elle est l’évaluation du « piqué » global de l’image, exprimée en cycles par millimètres (ou en paires de lignes par millimètres).
3Rééchantillonner une image, c’est-à-dire augmenter ou diminuer le nombre de pixels, est toujours possible mais n’améliore jamais sa qualité. Il faut donc choisir la taille de l’image avant sa production, en fonction de son usage : si la taille est trop petite, les pixels seront visibles ; si la taille est trop grande, le fichier sera inutilement alourdi et créera des problèmes au niveau du stockage et des temps de traitement et de transmission.
4La couleur d’un pixel est déterminée par un triplet RVB (rouge-vert-bleu). Chaque composante de ce triplet est quantifiée sur 8 bits, ce qui équivaut à 256 niveaux pour chaque composante, soit 16 millions de couleurs. Il est possible d’augmenter la quantification sur 12 ou 16 bits afin de traiter des images très contrastées. Les couleurs obtenues à partir de valeurs RVB identiques peuvent varier d’un périphérique à l’autre (appareil photo, scanneur, écran, imprimante, etc.) : chaque équipement ne peut voir ou reproduire les mêmes couleurs. L’International Color Consortium (www. color. org) propose un système de gestion des couleurs qui associe un profil à chaque périphérique d’entrée et de sortie ; des modules logiciels de conversion permettent ensuite de conserver les couleurs originales.
5- Le choix du format. Ce choix aussi est important : il influe sur la capacité de stockage selon le degré de compression des données, sur les logiciels qui vont permettre de visualiser l’image (selon qu’il s’agit d’un format propriétaire ou libre), sur l’usage de l’image selon les caractéristiques et les performances propres à ce format (possibilité d’affichage progressif, de transparence continue, etc.), sur la qualité [voir le tableau page suivante]. Le format soulève également le problème de la pérennité de ces fichiers numériques : les logiciels de lecture évoluent, de nouveaux formats apparaissent ; chaque migration d’un fichier numérique vers un nouveau format risque d’altérer ce fichier, mais comment lire le fichier original si le lecteur (logiciel) n’existe plus ?
6- L’ajout de métadonnées. L’image numérique a par ailleurs l’avantage d’intégrer des métadonnées, utiles au post-traitement du document. Les métadonnées EXIF sont des données techniques relatives à la prise de vue et fournies automatiquement par l’appareil photo. Les métadonnées IPTC (International Press and Telecommunications Concil) ont trait à la sémantique de l’image : elles intègrent la légende, les mots clés, les catégories, les crédits, l’origine (date, lieu), le copyright, une URL, etc. [Voir page suivante le hors texte relatif à l’utilisation de ce standard IPTC par l’IRD]
7D’autres métadonnées sont imperceptibles à l’œil : le tatouage ou watermarking. Elles résistent aux divers traitements et aux attaques ; elles donnent des informations sur les titulaires des droits de l’image et sur les droits de reproduction, ainsi que des informations personnalisées sur chaque copie.
8L’intégration d’images numériques dans un fonds photographique risque de briser l’homogénéité de ce fonds en raison de l’hétérogénéité des formats, de la taille des fichiers et donc de la qualité des images. Il convient donc de définir un certain nombre de contraintes à imposer aux photographes avant même la prise de vue. Il faut définir la taille minimum nécessaire selon les usages envisagés : une photo peut avoir des dimensions et une qualité correctes en affichage à l’écran mais insuffisantes pour réaliser une couverture de livre au format A4 ! Le photographe ne pense pas toujours à utiliser la taille maximum autorisée par son appareil afin de faire davantage d’images.
9Les formats de fichier posent également problème : ils sont nombreux et variés ; il vaut donc mieux exiger toujours le même format, le plus adapté. En général, les appareils professionnels proposent deux types de format à la prise de vue : le JPEG et les formats natifs RAW. Dans le cas du JPEG, il faut choisir la qualité maximale, sans compression supplémentaire. Le format TIFF peut être une alternative au JPEG, format compressé par nature : certains appareils peuvent en faire, mais le nombre de photos est limité. Quant au format RAW, il est nécessaire d’avoir le logiciel correspondant afin de pouvoir récupérer les images car il s’agit d’un format propriétaire.
10L’utilisation des appareils numériques a entraîné une inflation de la production de photos : il n’y a plus vraiment de contraintes matérielles et du même coup financières (la pellicule et son coût). Il convient donc peut-être d’exiger de l’auteur une sélection (élimination des doublons, par exemple). Sinon le temps de sélection des photos risque d’augmenter considérablement pour le gestionnaire du fonds.
11On peut déterminer à l’avance si le nom des fichiers est laissé à la libre appréciation du photographe ou s’il doit obéir à une structure définie. Il faut aussi être attentif à la date de création du fichier : si le photographe effectue des retouches sur la photo et l’enregistre sous un autre nom, la date de création de l’image sera modifiée. Si le logiciel de gestion d’images récupère automatiquement la date de création comme date de prise de vue, c’est gênant !
12Pour faciliter le traitement documentaire des images, on peut demander à l’auteur de remplir systématiquement le formulaire IPTC. Afin d’éviter les problèmes d’interprétation des couleurs selon les différents périphériques, il faut exiger de recevoir les images avec un profil intégré. Enfin, il faut se mettre d’accord avec le photographe sur le niveau de retouche qu’on lui autorise sur l’image : redressement des verticales, recadrage, suppression des flashs, correction de la lumière, des couleurs… Il convient de vérifier auparavant sa maîtrise des outils de retouche d’image ! Cette intervention soulève d’autres problèmes : doit-on également récupérer le fichier original ? dans ce cas, quel sera le statut des deux fichiers ? quel sera l’original ?
13Le recours à l’image numérique est aussi un moyen de valoriser et d’exploiter un fonds d’images fixes : numériser des supports traditionnels va permettre de mettre à disposition, en accès direct et immédiat, des collections d’images jusqu’ici confinées dans à un lieu physique, ou bien de rechercher et sélectionner rapidement des images dans un corpus, de créer des applications multimédias…
14Mais, pour être réussi, un projet de numérisation doit être mûrement réfléchi. La première question à se poser est celle de l’objectif de ce projet : est-il de numériser pour conserver ou diffuser ? Selon le cas, la résolution choisie ne sera pas la même : la conservation exige une résolution de très haute précision puisque le nouveau support est destiné à remplacer l’original. Il faut donc la qualité maximale, ce qui a également une incidence sur la capacité de stockage nécessaire.
Les différents formats d’images numériques

15Les éléments à prendre en compte avant de numériser une image sont les mêmes que ceux pour l’acquisition de prises de vue numériques : le choix du format de fichier, l’intégration d’un profil ICC pour contrer la dérive colorimétrique de l’image… Il faut également veiller à ce que les dimensions de l’original soient conservées. Pour les images en noir et blanc, on préférera numériser en couleurs plutôt qu’en niveaux de gris pour une qualité supérieure, même si le fichier obtenu est plus gros. En général, l’acquisition se fait en RVB, mais il est possible de convertir l’image en CMJN (cyan - magenta - jaune - noir).
16Les possibilités de stockage sont variées : disques durs, DVD-R, CD-R, présentés en tours… Le problème est qu’on dispose de peu d’informations sur la réelle stabilité de ces différents supports. L’altération d’un support entraîne la perte de la totalité des informations contenues et la restitution de ces informations, si elle est possible, est extrêmement onéreuse. Il existe néanmoins des supports particuliers prévus pour des archivages de longue durée (par exemple CD Century). La norme Afnor Z-42-013 s’intéresse à la conception et à l’exploitation des systèmes de gestion et d’archivage électroniques : comment assurer l’intégrité, la conservation et la restitution des documents stockés ? Elle préconise une qualité de support CD-R. La norme Z-42-011-2 est une spécification de la qualité des CD-R et de la qualité de gravure. Elle est de plus en plus fréquente dans les appels d’offre ; les prestataires et les utilisateurs s’équipent en conséquence.
17L’image numérique animée obéit à peu près aux mêmes principes que l’image fixe : elle est également contrainte par son format de fichier. La numérisation d’un fonds d’images animées soulève donc sensiblement les mêmes questions que celle d’un fonds d’images fixes. Avant d’amorcer le projet, il convient d’être sûr de détenir les droits attachés au support, à l’usage que l’on veut en faire, au nombre d’utilisateurs envisagés, au lieu de diffusion, etc. Il faut également être conscient qu’un tel projet coûte cher et que les retombées de cet investissement sont difficilement calculables.
18Mieux vaut donc bien préparer son projet et se poser les bonnes questions : pourquoi numériser ? Pour préserver ? Pour remplacer une technologie obsolète ? Pour diffuser auprès d’un plus large public ? Pour accélérer l’accès au fonds ? Pour remplacer des formats devenus obsolètes ou tout simplement pour être à la mode ? L’important est de recadrer le projet autour de sa mission, sans omettre de se projeter dans le futur, et de cibler la satisfaction de son public. La numérisation apporte une stabilité du codage dans le temps, même si le support, lui, s’altère. Elle exige une capacité de stockage relativement réduite. Elle permet d’accéder rapidement aux documents, de délinéariser les films et d’avoir ainsi un accès direct aux séquences. Elle offre des possibilités de consultation à distance, de valorisation par la publication multimédia…
19Pour définir précisément le projet de numérisation et tirer parti de ses avantages, il faut analyser les publics et leurs spécificités d’usage : ces éléments détermineront la qualité d’image et de son nécessaire, la vitesse d’accès et d’interaction avec le flux, le nombre de connexions simultanées, le lieu de consultation… Il convient également d’évaluer la concurrence : connaître ses concurrents permet de mesurer la spécificité du service rendu, de voir l’évolution du marché. Reste à choisir ce que l’on souhaite numériser : l’intégralité du fonds ou seulement une partie ? La numérisation est l’occasion de s’interroger sur l’intérêt du fonds dont on dispose, sur ce que l’on souhaite offrir au public, et parfois de revoir sa politique d’acquisition.
20Une fois ces questions résolues, l’architecture du projet commence à se dessiner : les formats de fichier sont choisis en fonction des usages identifiés et des contraintes du marché (formats publics contre formats propriétaires, nécessité de mise à jour des lecteurs, etc.) ; les volumes à stocker en découlent. La qualité de service attendue détermine le débit, les vitesses d’accès, le nombre d’accès concurrents souhaités, ainsi que le taux de panne acceptable. L’évaluation de la fréquence des cas extrêmes (affluence inhabituelle, plusieurs demandes sur le même film en même temps, etc.) permet de savoir s’il faut surdimensionner le système pour pouvoir répondre en permanence à ce type de situations ou si l’on peut se contenter d’une architecture moins performante mais qui répond aux besoins en temps normal et qu’on peut éventuellement adapter les jours exceptionnels.
21Enfin, il ne faut pas oublier que la numérisation va apporter des transformations techniques, peut-être nécessiter une formation des personnels, ainsi qu’une nouvelle ergonomie du lieu de consultation. Elle a également un impact sur le travail des documentalistes : favoriser l’accès à davantage de séquences vidéo induit une documentation accrue en amont. Il faut donc envisager des frais de personnel et de formation, prévoir un budget de communication pour faire connaître la valeur ajoutée par la numérisation auprès des utilisateurs. Pour demeurer performant, le système devra continuer à évoluer : les technologies sont remplacées en permanence, il faut donc intégrer une nouvelle logique d’investissement et de rentabilisation.
22Un exemple de traitement d’un fonds d’images animées est présenté page 385 : les choix effectués par Pathé Archives.
23Le passage au numérique a un impact très fort sur la valorisation et l’exploitation des documents : il permet la création de produits multimédias, attractifs et accessibles à tous les publics, une recherche des documents facile et diversifiée, la commercialisation en ligne grâce au téléchargement. Ces évolutions modifient la position du documentaliste dans la chaîne documentaire : il doit s’intéresser davantage à la production des images en imposant un certain nombre de contraintes aux auteurs, mais aussi à la diffusion avec le développement des interfaces. Les facilités du numérique ne doivent pas faire oublier que le traitement de l’image est encore lourd, que la pérennité de ce support est un mirage et que les choix engagés (de format notamment) ont des répercussions sur le bon fonctionnement du système. Sans compter que la numérisation fait tomber dans l’oubli tous les documents qui n’ont pas été choisis faute de moyens ou de temps ! Dernier point à toujours garder présent à l’esprit : l’immatérialité de l’image numérique, ses facilités de transmission et de transformation mettent en péril le droit d’auteur : avant de diffuser, il faut donc penser à protéger.
Sabine André