Accueil Revues Revue Numéro Article

Documentaliste-Sciences de l'Information

2003/6 (Vol. 40)

  • Pages : 60
  • DOI : 10.3917/docsi.406.0362
  • Éditeur : A.D.B.S.

ALERTES EMAIL - REVUE Documentaliste-Sciences de l'Information

Votre alerte a bien été prise en compte.

Vous recevrez un email à chaque nouvelle parution d'un numéro de cette revue.

Fermer

Pages 362 - 369 Article suivant
1

ÉDITION, DOCUMENTATION, E-COMMERCE... À l’heure actuelle, le langage XML a investi de nombreux secteurs professionnels et a même su légitimer son existence à côté d’autres technologies informatiques, en particulier d’autres langages de programmation. Alors, pourquoi XML après SGML et surtout HTML ? Pallier la relative complexité du premier, transcender certaines rigidités du second, qui s’appuie sur un jeu défini de balises et de règles de construction : tels sont les enjeux de XML établis par les groupes de développement du W3C (World Wide Web Consortium) [1][1] <www. w3. org/ >.

2

Ce sont eux en effet qui, dès 1996, rédigent la première version d’un document présentant les fonctionnalités et la structure du langage XML. La recommandation officielle, version 1.0 de XML, ne voit cependant le jour que le 10 février 1998. Dès lors, XML ne cesse de susciter autant de curiosité que de perplexité, et ce malgré les efforts du marché pour rendre cette technologie plus accessible et l’offre plus diversifiée. Nombre de professionnels, aux besoins informatiques très différents, souhaitent concrètement savoir dans quelle mesure XML peut influencer le web, voire s’il remplacera un jour HTML. Ils souhaitent aussi comprendre comment fonctionne XML et à ce titre expérimenter concrètement ce qu’il peut leur offrir. De fait, il apparaît plus que jamais nécessaire de faire la preuve de la pertinence de XML, et même de l’intérêt de l’appropriation de ce langage par des professionnels autres que les informaticiens, notamment par les professionnels de l’information et de la documentation (ID).

1 - Six ans après, des réticences demeurent…

3

De récentes conférences sur XML [2][2] GFII, Dynamisez vos informations avec XML, Paris, 23... ont montré que, malgré des avantages certains, il n’était pas forcément cette révolution qui promettait naguère de reléguer ses ascendants (HTML, SGML) au rang de pièces de musée. En effet, HTML résiste et demeure le principal outil de gestion et de partage des données sur la toile. La variante actuelle XHTML semble aussi un compromis intéressant entre HTML et XML. Plusieurs éléments plaident donc contre une généralisation rapide de XML.

4

Ainsi, contrairement à HTML, XML n’est pas « prêt à l’emploi ». L’intégration des données XML, surtout pour des systèmes complexes d’information comme les bibliothèques numériques, est longue car très normalisée. Pour développer en XML, il ne suffit pas de récupérer des données. Il faut surtout les structurer, les mettre en relation (élaborer une hiérarchie, trouver des rapports d’association, etc.). Ensuite, pour échanger ces données structurées, les professionnels doivent adapter leurs outils de communication actuels, évaluer la compatibilité de leurs plates-formes d’échange. Ce qui fait que le développement en XML requiert un investissement encore lourd, tant en charge de travail qu’en coûts purement financiers.

5

La tendance générale concernant le développement en XML est encore d’« attendre pour voir » : non seulement pour voir si l’investissement requis peut être allégé, mais aussi si les expériences déjà entreprises avec XML se révèlent de réels succès. Faut-il donc « attendre et voir venir » ? Il est d’autant plus intéressant aujourd’hui d’analyser quelles motivations ont poussé certains secteurs professionnels à s’affranchir de la tendance générale pour gérer des bibliothèques numériques à l’aide de XML et des standards associés.

De la description des données…

6

De XML on dit tantôt qu’il est un métalangage (parce qu’il peut décrire d’autres langages), tantôt un format, voire une technologie. Littéralement, XML est un langage à balises extensible (eXtensible Markup Language). À l’image de SGML et de HTML, XML repose donc sur une structure de balises. Mais, à la différence de ceux-ci, il étend la structure logique de ces balises bien au-delà du formatage du document. En effet, XML permet de créer et d’utiliser ses propres balises. De fait, chaque secteur d’activité, chaque corps de métier, et même chaque entreprise peut envisager de mettre au point un vocabulaire qui lui soit spécifique et donc pertinent. À titre d’exemples, XML a été utilisé pour développer les vocabulaires suivants :

  • eb-XML (electronic business XML) pour le commerce électronique ;

  • CheeseML pour l’agro-alimentaire ;

  • MathML (Mathematical Markup Language) pour les notations mathématiques ;

  • AIML (Astronomical Instrument Markup Language) pour les coordonnées célestes des galaxies ;

  • BSML (Biosequence ML) pour les séquences de codes génétiques ;

  • CML (Chemical Markup Language) pour la structure moléculaire des composés chimiques…

Exemples de balises (pour un fonds documentaire sur les arts du spectacle)

Eléments

<representation>, <titre_representation>, <date_representation>, <lieu_representation>

Attributs associés à l’élément <representation>

<representation type=’’theatre’’>, <representation type=’’marionnettes’’>, <representation type=’’danse’’>

Arborescence

<representation>

<representation type=’’theatre’’>

<titre_representation>

<date_representation>

<lieu_representation>

<descriptif_representation>

L’objet de cet article n’étant pas d’initier à la programmation en XML, nous ne pouvons aller plus avant dans le détail de la création d’un document, en faisant notamment la liste des règles à respecter (déclaration du document, balise ouvrante/balise fermante, etc.). Tout manuel du développeur fait état de ces règles, bien mieux qu’il ne pourrait être fait ici !

Pour développer en XML

Editeurs

But : créer des documents XML tout en respectant les règles et standards du langage.

Exemples : XML Spy, WordPerfect, XML Pro, Morphon XML Editor, XMetal

Liste complète sur : <www. xmlsoftware. com/ editors. html>

Analyseurs (parseurs)

But : accéder simplement aux données encapsulées dans un fichier XML.

Exemples :

JAXP : <http:// java. sun. com/ xml/ >

Xerces-J : <http:// xml. apache. org/ xerces-j/ >

OpenXML : <www. openxml. org/ >

LibXML : <http:// xmlsoft. org/ >

MSXML : <http:// msdn. microsoft. com/ library/ default. asp? url= / nhp/ default. asp? contentid= 28000438>

Processeurs XSLT

But : formater les documents XML pour qu’ils soient lisibles dans un navigateur.

Exemples :

XT, de James Clark : <www. blnz. com/ xt/ index. html>

Xalan-Java : <http:// xml. apache. org/ xalan/ >

Saxon : <http:// users. breathe. com/ mhkay/ saxon/ >

FOP : <http:// xml. apache. org/ fop/ >

OmniMark : www. stilo. com/ index. html

… à la modélisation des contenus

7

En tant que langage, XML travaille à la construction et à la modélisation d’univers de sens. Des sens qui ne sauraient être entendus indépendamment d’une forme. Pour être le plus abouti des langages actuels de programmation informatique, XML a pris le parti de soigner autant le fond que la forme. C’est pourquoi il traite dans des fichiers séparés le contenu d’un document (données et structure) et sa représentation graphique et physique. Du point de vue du fond, la règle première veut qu’un document XML soit composé d’unités de stockage appelées éléments et encadrées par les balises. Ces éléments structurent le contenu du document sous la forme d’un arbre. Il existe un élément principal, l’élément racine (root), auquel sont rattachés tous les autres éléments. Chaque élément peut être qualifié par un attribut, voire par plusieurs, afin d’apporter davantage de précisions. La technologie sous-jacente à cette représentation arborescente et à son exploitation est nommée XPath. Elle définit un ensemble de nœuds standards (nodes) et des fonctions pour les localiser, selon qu’ils sont nœuds racines, nœuds d’éléments, nœuds d’attributs, nœuds de texte, nœuds de commentaires, nœuds d’instructions de traitement, ou encore nœuds d’espaces de noms. Chacun de ces types de nœuds est en effet associé à une règle de modèle intégré, grâce à laquelle le nœud peut être traité d’une manière adéquate. [Voir ci-contre].

2 - Fonctionnement de XML

8

Le langage XML n’« enregistre » que la structure logique d’un document, c’est-à-dire l’organisation hiérarchique des données sous une forme arborescente. Pour les professionnels rompus à l’élaboration ou à l’utilisation de thésaurus, le fonctionnement de XML peut sembler familier. Au-delà de la structure logique enregistrée par XML, ce sont d’autres standards qui gèrent notamment :

  • la représentation valide d’un document : DTD ou schéma ;

  • la présentation d’un document : XSL (XSLT) ou CSS ;

  • la gestion des liens : XLink et XPointer.

La syntaxe XML

9

Les DTD (Document Type Definition) sont antérieures à XML ; c’est en effet SGML qui a introduit cette notion. Avec SGML, les DTD sont surtout des grammaires pour décoder correctement le système de balisage et appréhender de façon non ambiguë l’information contenue dans un document. Mais c’est aussi une syntaxe pour instaurer des contraintes à respecter dans un document. Avec XML, les DTD vont au-delà de leur statut de grammaire, en s’intéressant d’une part à la cohérence syntaxique d’un document (parsabilité), d’autre part à la conformité dudit document à un modèle générique (validité). Depuis peu, d’autres formalismes, plus puissants et plus flexibles que les DTD, les schémas (ou spécification « XML Schema »), sont utilisés. Ils commencent seulement à être partagés ; leur adoption officielle ne datant que de mai 2001. Ils tendent à remplacer les DTD dans leurs prérogatives, d’autant qu’ils présentent ce nouvel avantage : ils sont directement transcrits dans une syntaxe XML ; ce qui n’est pas le cas des DTD qui utilisent une syntaxe particulière !

10

Au même titre que pour les DTD, les feuilles de style CSS (Cascading Stylesheet) préexistent à XML. Elles ont été initialement définies pour HTML, mais ne proposent que des fonctions limitées de génération (mise en forme) de contenus et aucune fonction de transformation de données. En d’autres termes, les CSS constituent des présentations assez simples qui ne modifient cependant pas la séquence des données. D’où l’existence d’autres feuilles de styles, plus riches et plus ouvertes pour la présentation externe ou le formatage des données, et fondées sur le langage XSL (eXtensible Stylesheet Language). Elles peuvent intervenir dans la séquence de données, en spécifiant la manière dont les informations doivent être extraites d’un document XML et formatées avant d’être affichées. XSL comprend trois parties essentielles : XSLT, XPath et XSL-FO. XSLT (eXtensible Stylesheet Language Transformation) est un langage dédié à la transformation des documents XML. Passé sous forme de recommandation du W3C en novembre 1999, il sert le plus souvent à générer des documents HTML à partir de documents XML. XPath (XML Path) est le langage d’expression utilisé par XSLT pour faire référence aux différentes parties d’un document XML et y accéder. Quant à XSL-FO (XSL Formatting Objects), il s’agit d’un vocabulaire XML, également utilisé par XSLT, pour décrire le formatage du texte dans une page. Il permet notamment de transformer un document XML en un document au format PDF [3][3] Le programme FOP du projet XML Apache est un outil....

11

Enfin, les spécifications complémentaires XLink et XPointer permettent la représentation de liens hypertextes internes et externes à un document XML. XLink est devenu une recommandation du W3C en juin 2001. XLink utilise la syntaxe XML pour définir des relations entre un document XML et des objets extérieurs, autrement dit pour pointer vers des liens externes au document XML. Dans le cas où la cible du lien est interne au document XML, c’est XPointer qui se charge d’identifier et d’atteindre la cible désignée.

Des vocabulaires spécifiques à la documentation

12

Bien évidemment, il existe encore toute une terminologie associée à XML (espaces de noms, entités, etc.) qu’il serait trop long de définir ici… Il est maintenant plus intéressant de voir quelles données de la syntaxe XML sont particulièrement intéressantes pour les professionnels de l’ID. Il faut savoir qu’il n’est point besoin de tout créer, des documents XML aux outils associés, lorsque l’on développe en XML [voir page 364].

13

Un certain nombre d’outils peuvent en effet être partagés [4][4] Abderrazak Mkadmi, Nasreddine Bouhaï, Marc Langlois..... Il s’agit de modèles, en particulier de DTD, de schémas et de feuilles de styles, que des professionnels de l’ID ont déjà mis au point dans des contextes particuliers. Parmi les ressources partageables, l’EAD (Encoded Archives Description) [5][5] Ghislaine Chartron. La DTD EAD dans les archives et... est une DTD permettant de structurer en XML des documents d’archives : inventaires, répertoires, catalogues de collections. Elle est actuellement utilisée par le réseau des Archives de France, à la BNF (Nouvelles acquisitions françaises), pour le fonds Cuvier, etc. Pour des références bibliographiques, le ministère de la Culture et de la Communication a quant à lui développé la DTD BiblioML [6][6] <www. biblioml. org/ >, fondée sur le format bibliographique Unimarc. Autre DTD « en shareware », la TEI (Text Encoding Initiative) [7][7] <www. tei-c. org/ >, ainsi que sa version simplifiée, la TEILite, adaptée à des fonds littéraires. Elle contient en effet des éléments qui recouvrent toutes les spécificités littéraires, qu’elles soient intrinsèques à une publication (paragraphes, strophes, chapitres, notes de bas de page, etc.) ou extérieures à celle-ci (commentaire éditorial, interprétation, analyse, etc.). La TEILite contient les définitions des éléments les plus couramment utilisés par les développeurs XML. À l’image de la TEI, DocBook [8][8] <www. docbook. org/ > est une DTD servant à baliser des textes narratifs. Mais, à la différence de la TEI, elle dispose d’un certain nombre d’éléments spécifiques désignant notamment les programmes ou les commandes informatiques.

3 - Apports de XML à la documentation

14

L’appropriation des nouvelles technologies informatiques s’est progressivement imposée aux professionnels de l’ID. Selon des données d’enquêtes effectuées auprès de ceux-ci, les NTIC, en particulier Internet, sont naturellement entrées dans les pratiques documentaires [9][9] L’évolution de la fonction information-documentation :.... En effet, conscients de l’intérêt des développements électroniques, les professionnels de l’ID ont fait de leur savoir-faire informatique l’un de leurs principaux atouts. Le langage XML n’échappe pas à cette règle. Du moins ne devrait-il pas y échapper… D’autant moins que, à la différence d’autres technologies informatiques (langage HTML, outils logiciels…), XML se construit suivant des logiques familières à la documentation.

15

Le développement en XML et les traitements documentaires de catalogage et d’indexation, par exemple, peuvent être rapprochés en raison de leur caractère normalisé. En effet, tandis que XML repose sur une recommandation mise au point par le W3C (au niveau international), les techniques de catalogage et d’indexation s’appuient quant à elles sur des normes définies par l’AFNOR (sur le plan national) et par l’ISO (sur le plan international). De plus, par sa capacité à imbriquer les données entre elles et à donner du sens à cette structuration, un document XML présente des ressemblances avec un thésaurus. Les balises, au même titre que les signes conventionnels du thésaurus, servent à établir des relations, en particulier de hiérarchie, entre les données.

Quelques exemples de bibliothèques numériques

Les bibliothèques numériques intégrant la technologie XML participent de nombreux secteurs professionnels ou domaines de connaissance :

Le patrimoine culturel, avec Gallica de la Bibliothèque nationale de France (http:// gallica. bnf. fr), Artistes et œuvres en construction au Centre national de la danse (www. cnd. fr/ ), les inventaires de régions et de villes, archives et autres ressources patrimoniales pour le compte du ministère de la Culture et de la Communication (http:// sdx. culture. fr/ sdx/ applications. html), etc.

Des travaux universitaires, avec CodeX accessible à l’université de Paris X-Nanterre (http:// u-paris10. fr), Pelleas de l’université de Marne-la-Vallée (http:// pelleas. univ-mlv. fr/ ), etc.

La presse, avec Le Monde (www. lemonde. fr), Le Point (www. lepoint. fr), Les Échos (www. lesechos. fr), etc.

L’information scientifique, avec Article@ INIST de l’institut de l’information scientifique et technique (http:// services. inist. fr/ public/ fre/ conslt. htm), etc.

L’information juridique, avec Naïade, Intranet de l’ENIM, Établissement national des invalides de la Marine (www. mer. gouv. fr/ enim/ index. html), Légifrance du cabinet du Premier Ministre (www. legifrance. gouv. fr), etc.

16

Mais il ne suffit pas de rapprocher les logiques documentaires et informatiques pour convaincre les professionnels de l’ID de s’approprier le langage XML : encore faut-il faire la preuve de sa pertinence dans le cadre précis des activités documentaires… Dans le contexte actuel de multiplication de l’offre informatique pour la documentation, il apparaît d’autant plus nécessaire de légitimer l’existence de chaque nouvelle solution offerte. Quelles pratiques documentaires sont-elles concernées par l’apport du langage XML ? Comment XML peut-il faciliter, améliorer, enrichir les prestations documentaires ? Il est évident que ce langage n’est pertinent que dans des configurations précises, selon des paramètres donnés : taille et type du fonds documentaire, besoins exprimés, moyens mis à disposition (techniques, financiers, humains) sont parmi les variables à prendre en considération. Le traitement en XML est relativement long et complexe ; il faut donc s’assurer de sa véritable nécessité.

Réaliser des bases de données structurées

17

Deux possibilités sont offertes aux professionnels de l’ID : créer des données en XML natif ou convertir des données existantes en XML. Dans le premier cas, les documents électroniques sont élaborés directement en XML ; dans le second, les documents électroniques existent déjà sous un autre format (bureautique, informatique, logiciel, etc.) et sont ensuite traduits en XML. De plus en plus de logiciels documentaires (Alexandrie, Cindoc, JLB-Doc entre autres) ou d’applications bureautiques [10][10] Antoine Crochet-Damais. Le XML envahit les logiciels... (Word notamment) intègrent des fonctions de traduction ou des fonctions d’export, en XML. Bien sûr, plus le nombre de documents est important et leur nature complexe, plus XML devient pertinent. En effet, celui-ci implique un traitement informatique lourd, donc peu propice à de petits fonds documentaires.

18

Par contre, XML apparaît comme une ressource intéressante pour tout ce qui peut constituer de véritables réservoirs de documents électroniques, et que l’on nomme généralement « bibliothèques numériques ». En terme de réalisations concrètes, celles-ci peuvent revêtir de nombreux aspects, suivant qu’elles contiennent des œuvres littéraires, des publications scientifiques, des articles de presse, des photographies, des cartes ou encore des plans. De fait, elles sont difficiles à définir absolument. Simplement nous pouvons dire que, en tant que bibliothèques, elles doivent proposer une sélection de ressources utiles à la connaissance, et en permettre l’accessibilité. Parce que les ressources documentaires qu’elles mettent à disposition des utilisateurs sont numérisées, elles s’affranchissent ainsi des contraintes physiques liées à leur consultation. Ces bibliothèques numériques, dont certaines intègrent aujourd’hui la technologie XML, renvoient donc à de nombreux secteurs professionnels et domaines de connaissance [voir ci-contre].

19

Par ailleurs, un certain nombre de projets documentaires XML ont été référencés par le Groupement français de l’industrie de l’information (GFII) [11][11] <www. gfii. asso. fr/ > : notamment Legal News[12][12] <www. legalnews. fr/ >, quotidien en ligne spécialisé dans l’actualité juridique du droit français, ou encore CEDROM-SNI[13][13] <www. cedrom-sni. com/ >, service de diffusion de presse sur Internet. L’ATICA (rebaptisée en février 2003 ADAE, Agence pour le développement de l’administration électronique) [14][14] <www. atica. fr> ou <www. atica. pm. gouv. fr/ > se charge également de fédérer les applications associées au XML, en particulier dans les domaines documentaire et juridique.

Préserver l’intégrité des données

20

En séparant le fond de la forme du document, le contenu de sa présentation, XML aide à conserver l’authenticité des données primaires, en les préservant de l’épreuve du temps et des usages. Avoir à faire à un contenu avant d’avoir à faire à un produit : ainsi pourrait-on vanter le mérite de XML ! En effet, en traitant séparément les données brutes et les informations relatives à leur création et à leur publication, XML s’affranchit en quelque sorte de considérations de production, parfois indifférentes à l’intégrité des données originelles. Il travaille également à rendre les facteurs temps et usages plus « maîtrisables ».

21

Par exemple, pour conserver à long terme un document multimédia, il faut non seulement conserver les données brutes mais aussi la manière dont ces données s’enchaînent sur un support électronique (informations sur la création et sur la publication informatiques). XML véhicule les données et aussi les moyens de déchiffrer celles-ci, voire de les réutiliser à d’autres fins. La version brute et la version chiffrée des documents ont donc toutes deux des valeurs documentaires. En amont, les professionnels de l’ID travaillent à la conception de la version brute, en aval à la cohérence de la version chiffrée.

Diffuser une information personnalisée

22

Lorsque vous envoyez par exemple une requête sur un moteur de recherche codé en HTML, vous obtenez une liste de réponses statiques que vous ne pouvez que lire et imprimer. Mais lorsque vous envoyez la même requête sur un moteur de recherche codé en XML, vous enregistrez une liste de réponses que vous pouvez trier, ajuster, modifier à l’aide de vos propres feuilles de styles XSL et transmettre ainsi remodelée à des utilisateurs.

23

Prenons par exemple une recherche documentaire sur le thème de la maladie de la vache folle. Les besoins en information sur ce sujet sont assez vastes et de natures souvent différentes. Les origines ou les symptômes de la maladie constituent une première recherche de nature médicale. La médiatisation ou la prévention de la maladie sont quant à elles des préoccupations de nature politique. La consommation de viande de bœuf peut être entendue comme une orientation économique et même sociologique du sujet. S’il y a autant de façons d’appréhender le sujet de la maladie de la vache folle, il y a autant de besoins formulés auprès des professionnels de l’ID par les utilisateurs recherchant une information claire, concise, précise, exhaustive sur la question. Un réservoir commun de données sur la maladie de la vache folle peut donc diversement servir, suivant que les recherches sur le sujet sont d’ordre scientifique, sociologique, politique, économique… Ainsi une liste de résultats issue d’une requête sur la maladie de la vache folle soumise à un moteur de recherche, ou encore à une base de données, peut être modelée et adaptée d’autant de manières qu’il y a de besoins à ce sujet.

24

Les professionnels de l’ID interviennent en modifiant la liste d’après leur connaissance des besoins des utilisateurs ou de la demande des clients à qui l’information est précisément destinée. L’idéal pour les professionnels de l’ID recherchant l’information en ligne – en vue de la traiter puis de la diffuser – est de pouvoir fournir une information personnalisée et pertinente selon des critères hétérogènes. Le codage en XML participe d’un nouveau pouvoir sur l’information : pouvoir de modification ou de personnalisation, mais aussi pouvoir de détournement (notion qui peut comporter quelques dangers !). Cette nouvelle démarche d’appropriation de l’information se concrétise par l’élaboration, par les professionnels de l’ID, de profils de recherche que les feuilles de styles XSL (capables de trier l’information) se chargent de retranscrire.

Éditer une même information sur des supports différents

25

Autre caractéristique extensible de XML : un document codé dans ce langage peut être décliné sur tous les supports possibles : Internet, Intranet, Extranet, papier, livre électronique, WAP, etc. Pour mettre en forme un document XML suivant le support choisi, il suffit encore une fois de lui attribuer une feuille de styles XSL, comprenant un certain nombre de règles à respecter et spécifiques à chaque support de diffusion.

26

Vous lancez sur une base de données XML une requête concernant les médicaments anti-cholestérol (soustraction du marché, conséquences pour l’emploi, etc.). Il est évident que vous pouvez être amenés à diffuser l’information obtenue sur différents supports. Par exemple, si vous recherchez l’information pour le compte d’un laboratoire médical, vous serez vraisemblablement amenés à diffuser les résultats sur un support de « durabilité », web en tête. Pour des besoins plus ponctuels, moins spécifiques, l’information pourra être tout aussi bien diffusée sur papier, suivant les souhaits des destinataires.

4 - Un nouveau savoir-faire documentaire ?

27

Pourquoi choisir de s’approprier XML, plutôt que d’autres « technologies » informatiques ? S’il faut très (trop !) brièvement montrer le potentiel de XML par rapport à HTML, qui délivre déjà dynamiquement de l’information, il convient surtout de dire ceci : XML intègre et délivre des données structurées utiles à l’échange d’informations, au partage de notices, à la création de thésaurus, à la personnalisation de sites et de portails documentaires, et ce indépendamment de contraintes de compatibilité des supports et d’hétérogénéité des formats.

28

Mais, pour que les professionnels de l’ID choisissent de s’approprier le langage XML à des fins documentaires, il faut d’abord une nécessité. Celle-ci relève tout autant de besoins documentaires que de considérations individuelles (ambitions professionnelles, gains sociaux ou financiers, etc.) et collectives (évolution logique de la profession, perception de la profession par les autres, etc.). Si l’on démontre rigoureusement que le langage XML est approprié à des usages documentaires, qu’il dynamise, améliore ou enrichit ces usages, alors, qui parmi les archivistes, les bibliothécaires et les documentalistes, pourront et choisiront de s’approprier le langage XML ? Ce seront ceux dont l’environnement professionnel, notamment le secteur d’activité, le contexte de travail, en particulier les moyens associés à la documentation, et la situation individuelle (autonomie, pouvoir décisionnel, etc.) coïncideront pour faire du développement en XML un savoir-faire documentaire.

29

La mise en œuvre de XML, notamment dans le développement des bibliothèques numériques, suppose donc un contexte approprié, où la connaissance des atouts de ce langage doit compléter l’analyse de faisabilité qui décidera du choix ou du rejet de XML, en fonction des besoins et des objectifs professionnels de chacun. Pour des documents similaires, traités dans des contextes proches, deux professionnels de l’ID peuvent opter pour des solutions radicalement différentes ; par exemple choisir de rassembler les documents dans une base de données telle qu’Access, ou décider la création d’une bibliothèque numérique de documents codés en XML. Rien n’indique dans l’absolu que le choix de XML est plus pertinent que celui d’une base de données relationnelle. La pertinence n’est pas un concept universel. XML ne tend pas non plus à l’universalité ; c’est une technologie qui s’adresse à un ensemble de personnes, partenaires d’un échange et conscientes des atouts de celle-ci dans le cadre précis de l’échange.

30

Novembre 2003

Petit récapitulatif des apports d’XML à la documentation

Qu’apporte XML au catalogage et à l’indexation des documents ?

XML introduit des métadonnées descriptives qui correspondent en réalité aux éléments de la notice bibliographique d’un document : titre, auteur, éditeur, date, résumé, mots clés, etc. XML constitue de fait une passerelle entre la connaissance informelle propre à chaque document et devant faire l’objet de traitements documentaires, et la connaissance structurée encadrant et caractérisant la connaissance informelle.

Qu’apporte XML à la gestion courante d’un fonds documentaire ?

XML utilise également des métadonnées administratives qui décrivent d’une part les droits d’accès aux documents, d’autre part les droits de propriété intellectuelle sur ceux-ci. Elles permettent donc de « marquer », de tracer les documents électroniques. Ainsi, lorsqu’un document est rendu accessible, cela doit être fait selon les politiques de diffusion ou de confidentialité définies par ses émetteurs, mais aussi dans le respect des droits d’auteur et d’éditeur sur ce document.

Qu’apporte XML à la recherche d’information ou à la veille documentaire ?

XML ajoute enfin des métadonnées techniques qui rendent l’information intelligible et permettent aux moteurs de recherche qui interprètent ces métadonnées d’être plus efficaces. C’est principalement ce type de métadonnées qui fonde aujourd’hui ce que l’on appelle le « web sémantique ».

Comment XML aide-t-il à la conservation de l’information ?

XML, parce qu’il les distingue de leur représentation graphique, est une assurance sur la préservation des données. En traitant séparément les données brutes et les informations relatives à leur représentation, XML s’affranchit des contraintes de production et perpétue de fait l’intégrité des données originelles. Il s’inscrit par conséquent dans une logique de partage, qui est précisément celle des professionnels de l’I-D.

Comment XML œuvre-t-il au partage des compétences ?

XML se combine à des DTD ou des schémas pour définir la structure d’un document selon un modèle comprenant des règles précises d’assemblage des données. Des bibliothèques, des unités documentaires ou des services d’archives peuvent alors s’entendre pour échanger ces données selon un modèle commun. Le fait de partager un modèle participe à l’évidence à l’acceptation de celui-ci, mais représente surtout un facteur de montée en compétences des professionnels de l’ID confrontés à l’explosion des applications XML.

Comment XML contribue-t-il au rapprochement des usagers et des professionnels ?

XML a recours à des feuilles de styles XSL pour multiplier les présentations de l’information sur différents supports, mais aussi pour personnaliser l’information selon les besoins exprimés, voire les recommandations soumises par les utilisateurs. Cela modifie et enrichit certes les conditions d’accès aux ressources électroniques dans leur diversité, mais également les activités coopératives des professionnels de l’I-D et des usagers des bibliothèques, des centres de documentation ou des services d’archives.


Annexe

QUELQUES SITES POUR…

S’initier à XML

• XML francophone : www. chez. com/ xml

• Comment ça marche ? : www. commentcamarche. net/ xml/ xmlintro. php3

• Activeille : www. activeille. net/ themes/ xml. htm

Développer en XML

• XML techno : www. xmltechno. com

• All HTML : www. allhtml. com/ xml/ index. php

• Club des développeurs : http:// xml. developpez. com

Echanger sur XML

• <XML>fr : http:// xmlfr. org

• XML France (association française des utilisateurs de XML) : www. xml-france. asso. fr

• Mutualiser l’effort de montée en compétences sur XML : www. mutu-xml. org

• CGI Ressources : www. cgi-ressources. com/ XML/ index. php

RESSOURCES SUR XML

• XML pour les bibliothécaires : un manuel et un atelier, par Eric Lease Morgan : http:// morinn. free. fr/ xml

• Dossier documentaire XML : www. educnet. education. fr/ dossier/ xml/ default. htm


Références

  • Le langage XML

    • 1 –  François CHAHUNEAU. XML : un langage universel pour la représentation textuelle de données structurées. In Bibliothèques numériques : cours INRIA, 9-13 octobre 2000, La Bresse. Paris, ADBS Éditions, 2000. P. 119-141
    • 2 –  François ROLE. XML et la documentation structurée : des principes aux techniques. In La recherche d’information sur les réseaux : cours INRIA, 30 septembre - 4 octobre 2002, Le Bono. Paris, ADBS Éditions, 2002. P. 71-97
    • 3 –  Olivier ROUMIEUX. XML sans frontières. Archimag, novembre 2002, n° 159
  • L’actualité de XML

    • 4 –  Antoine CROCHET-DAMAIS. 2003 : enfin l’année du XML ? JDNet Solutions, 23 décembre 2002
    • 5 –  Antoine CROCHET-DAMAIS. Le XML a 5 ans. JDNet Solutions, 13 février 2003
    • 6 –  José DIZ. Le langage XML doit encore convaincre ! JDNet Solutions, 2 février 2001
  • Les bibliothèques numériques associées à XML

    • 7 –  Olivier BIBARD. Le Monde choisit XML pour sa documentation. Décision Micro, 19 mai 2003
    • 8 –  Stéphane CHAUDIRON, Madjid IHADJADENE, François ROLE. CodeX : un système pour la définition de vues multiples guidées par les usages. In Document électronique dynamique - Actes du 3e*** Colloque international sur le document électronique (CIDE 2000), sous la direction de M. Gaio et E. Trupin, Lyon 4-6 juillet 2000. Europia Productions. P. 71-81
    • 9 –  Antoine CROCHET-DAMAIS. Comment Le Point passe de HTML à XML. JDNet Solutions, 23 janvier 2002
    • 10 –  Antoine CROCHET-DAMAIS. Comment l’Université de Marne-la-Vallée gère sa base documentaire avec XML. JDNet Solutions, 7 décembre 2002
    • 11 –  Philippe GUERRIER. LesEchos.fr : place à la « transversalité » de l’information. JDNet, 21 mai 2002
    • 12 –  Catherine LUPOVICI, Thierry CLOAREC, France de CHARENTENAY. Les usages de Gallica. Bulletin des bibliothèques de France, 2003, t. 48, n° 4, p. 40-44

Notes

[2]

GFII, Dynamisez vos informations avec XML, Paris, 23 octobre 2001.

ADBS, XML, pour quoi faire ?, Paris-La Défense, 4 décembre 2001.

[Voir le compte rendu de ces deux manifestations paru dans cette revue : Bernadette Ferchaud. Journées d’étude GFII et ADBS. XML : actualité et perspectives. Documentaliste - Sciences de l’information, 2001, vol. 38, n° 5-6, p. 332-335. Également accessible en ligne : www. adbs. fr/ uploads/ journees/ 532_fr. php>]

Université Paris 13-UFR des Sciences de la Communication, L’édition multi-supports, une révolution éditoriale ? Questions posées par l’adoption des standards de description des documents : l’exemple de XML, Villetaneuse, 14 juin 2001.

[3]

Le programme FOP du projet XML Apache est un outil gratuit chargé de la conversion d’un document XML en PDF, à l’aide de XSL-FO. <http:// xml. apache. org/ fop/ index. html>

[4]

Abderrazak Mkadmi, Nasreddine Bouhaï, Marc Langlois. Partager les modèles XML : quel intérêt ? Bulletin des bibliothèques de France, 2003, t. 48, n° 5, p. 68-73.

[5]

Ghislaine Chartron. La DTD EAD dans les archives et les bibliothèques. BBF, 2003, t. 48, n° 2, p. 112-114. Voir aussi : <http:// lcweb. loc. gov/ ead>

[9]

L’évolution de la fonction information-documentation : principaux résultats de l’enquête ADBS 1999. Documentaliste - Sciences de l’information, 1999, vol. 36, n° 4-5, p. 229-235.

[10]

Antoine Crochet-Damais. Le XML envahit les logiciels bureautiques. JDNet Solutions, 16 juillet 2003.

Résumé

Français

En développement depuis 1998, le langage XML s’installe progressivement sur la toile et sur les réseaux où l’organisation de l’information, de plus en plus complexe, impose de nouvelles contraintes de communication, notamment pour éviter la déperdition de l’information. La recherche, le traitement et la diffusion de l’information nécessitent une organisation rationnelle et rigoureuse à laquelle, par son extrême normalisation mais aussi par son ouverture, participe le langage XML. Cet article vise moins à présenter tous les aspects techniques du principe et du fonctionnement de XML qu’à convaincre les professionnels de l’information-documentation de l’utilité pour leur activité de ce langage qu’il leur faudrait intégrer à leurs savoir-faire spécifiques.

Plan de l'article

  1. 1 - Six ans après, des réticences demeurent…
    1. De la description des données…
    2. … à la modélisation des contenus
  2. 2 - Fonctionnement de XML
    1. La syntaxe XML
    2. Des vocabulaires spécifiques à la documentation
  3. 3 - Apports de XML à la documentation
    1. Réaliser des bases de données structurées
    2. Préserver l’intégrité des données
    3. Diffuser une information personnalisée
    4. Éditer une même information sur des supports différents
  4. 4 - Un nouveau savoir-faire documentaire ?

Pour citer cet article

Savourat Lise, « XML. Pour une appropriation du langage par les professionnels de l'information-documentation », Documentaliste-Sciences de l'Information, 6/2003 (Vol. 40), p. 362-369.

URL : http://www.cairn.info/revue-documentaliste-sciences-de-l-information-2003-6-page-362.htm
DOI : 10.3917/docsi.406.0362


Pages 362 - 369 Article suivant
© 2010-2014 Cairn.info
back to top
Feedback