Document numérique
Lavoisier

I.S.B.N.sans
180 pages

p. 59 à 88
doi: en cours

Veille sur la revue
Veille sur l'auteur
Vous consultez

Volume 7 2003/1-2

2003 Document numérique

Une approche méthodologique de réutilisation en ingénierie de document

Application au e-learning

Azzeddine Chikh Laboratoire de Génie-biomédicalDépartement d’informatiqueFaculté des sciences de l’ingénieurUniversité de Tlemcen, BP 230Chetouane, Tlemcen, Algérie
La réutilisation, en ingénierie de document et plus particulièrement en e-learning, est un nouvel axe de recherche. L’état de l’art en la matière souffre essentiellement du manque de méthodologie. Cet article s’intéresse à ce domaine et tente de définir une approche méthodologique capable de le prendre en charge. Celle-ci permet de définir la réutilisation en ingénierie de document et de l’aborder selon deux dimensions : statique et dynamique. La première est relative aux objets manipulés, et la seconde est relative aux activités et acteurs impliqués. Nous proposons aussi deux modèles sous-jacents. Le premier prend en charge la qualification des briques de document. Le second, englobant le premier, prend en charge la représentation des composants de documents. Enfin, nous illustrons cette nouvelle approche par une application au e-learning.Mots-clés : approche méthodologique, modèle, réutilisation, ingénierie de document, produit-document, brique de document, composant de document, qualification, e-learning. The reuse, in document engineering and more particularly in e-learning, is a new research orientation. The state of the art on the matter suffers primarily from the lack of methodology. This article is interested in this field and tries to define a methodological approach able to deal with it. This one makes it possible to define the reuse in document engineering and to describe it according to two dimensions: statics and dynamics. First relates to the handled objects, and second relates to the implied activities and actors. We propose also two subjacent models. The first deals with the qualification of bricks of document. The second, including the first, deals with the representation of the components of documents. Finally, we illustrate this new approach by an e-learning applicationKeywords : methodological approach, model, reuse, document engineering, document-product, brick of document, component of document, qualification, e-learning.
 
1. Introduction
 
 
Les technologies numériques de la communication rendent possible une formation massive, de qualité et au moindre coût. Le e-learning est défini comme « l’utilisation des nouvelles technologies multimédias et de l’internet, pour améliorer la qualité de l’apprentissage en facilitant l’accès à des ressources et des services, ainsi que des échanges et la collaboration à distance » (Com, 2001). Il s’agit d’une stratégie de création d’un environnement pédagogique soit de type physique (centres de ressources) soit de type virtuel (plate-forme d’apprentissage).
L’ouverture, sans cesse croissante et rapide, de nouveaux cycles et filières de formation sur mesure, provoque d’une part, une croissance exponentielle des besoins en supports pédagogiques et d’autre part, des délais de réalisation très courts. En outre, les produits attendus doivent être de qualité et de moindre coût. Les recherches sur les plates-formes d’apprentissage à distance visent principalement à définir des modèles pour la production, le déploiement, la gestion et l’utilisation de documents pédagogiques (nanard et al., 1998) (Chabert-Ranwez, 2000) (Boulier, 2001). Dans cet article, nous nous intéressons à l’activité de production des documents pédagogiques dans le contexte du e-learning, que nous considérons comme une application particulière de l’activité de production et de modélisation de documents en ingénierie de document. Un certain nombre d’approches ont été proposées pour aider les auteurs en ingénierie de document. Nous citons essentiellement l’approche de traitement de texte (Dessus, 2001) ; l’approche structurée (Quint, 1994) ; l’approche coopérative (Decouchant et al., 1992) (Ellis et al., 1991) (Karsenty, 1994) ; l’approche qualité (Richez, 1996) et l’approche de réutilisation (Levy, 1993) (Priestley, 2001) (Lehtonen, 2002) utilisée dans ce travail.
La réutilisation a fait déjà l’objet de recherches importantes dans le raisonnement à partir de cas (Visser, 1999) (Perron, 2000) et dans le domaine du génie logiciel où elle constitue aujourd’hui un thème de recherche à part entière (Coulange, 1996) (Reynaud et al., 2000) (Coudert et al., 2002). Des catalogues de composants logiciels sont aujourd’hui disponibles sur internet. Ce dernier type de réutilisation a été élargi ensuite aux systèmes d’information (Maurice-Demourioux, 1998) (Semmak, 1998). Des travaux intensifs sur la réutilisation en ingénierie de document commencent à voir le jour. Nous citons entre autres (Paradis et al., 1998a) (Paradis et al., 1998b) (Vercoustre et al., 1998) et (Rekik et al., 1999), qui utilisent une approche « document virtuel » ; (Mühlhäuser et al., 1999) qui propose une typologie des concepts sur le web comme une base à la réutilisation ; et (Alaya, 1996) qui propose une approche d’aide à la rédaction basée sur la réutilisation de la connaissance.
Dans la production des documents en général (documentation de projet, documentation technique, supports de cours…), les auteurs se verront souvent contraints, à chaque nouveau document, de construire ex nihilo. Au moment où certaines parties de la documentation existante, qui présentent une qualité rédactionnelle et éditoriale, peuvent être réutilisées dans la reconstruction du nouveau document. Cette réutilisation reste souvent difficile pour au moins les raisons suivantes : le contexte de rédaction n’est pas toujours le même ; la logique de conception des documents existants n’est pas toujours explicite ; et les auteurs changent des expériences plus ou moins comparables.
Le présent travail, qui s’inscrit dans la continuité de nos travaux de recherche sur la réutilisation en ingénierie de document en général (Chikh et al., 1999) (Chikh, 2001) (Chikh, 2002) et en e-learning en particulier (Chikh, 2003), vise à améliorer la qualité des documents produits (supports pédagogiques) et à augmenter la productivité de leurs auteurs. Il a pour objectifs principaux : de proposer une approche méthodologique de réutilisation en ingénierie de document et de définir des modèles sous jacents ; et d’illustrer son application au e-learning.
Après cette introduction, la seconde section décrit un bref état de l’art, où sont présentés deux travaux (Alaya, 1998) (Rekik, 2001) illustrant des approches différentes de la réutilisation en ingénierie de document. La section 3 est réservée à la présentation de notre approche méthodologique de réutilisation en ingénierie de document. La section 4 présente un modèle de qualification des briques de documents. Ensuite un modèle général de composant de document sera présenté dans la section 5. Une application au e-learning est faite dans la section 6. Enfin, la conclusion rappelle essentiellement les apports de ce travail de recherche et évoque la nécessité de le compléter par le développement d’un environnement technique, en vue de sa validation.
 
2. Etat de l’art
 
 
L’ingénierie des documents peut être décomposée en trios activités principales : la modélisation, la production des documents et la spécification des traitements (Rekik, 2001). Nous nous intéressons dans cet article uniquement aux deux premières activités. Nous considérons en effet, que la problématique de réutilisation, relative aux traitements, relève du domaine du génie logiciel et non pas de l’ingénierie de document. La modélisation consiste à définir les structures génériques appropriées pour une application donnée. Tandis que la production des documents structurés peut être considérée comme une application particulière sur les documents.
Une première analyse de l’état de l’art, en matière de réutilisation en ingénierie de document, nous a permis de classer les travaux de recherche dans ce domaine en deux grandes classes, selon la nature de l’objet à réutiliser. Dans la première classe, l’objet à réutiliser est un fragment de document ou de structure générique de document, selon que l’on soit respectivement dans une activité de production ou de modélisation. Dans la seconde classe, l’objet à réutiliser est un fragment de connaissance. Nous présentons dans cette section deux travaux de recherche (Rekik, 2001) et (Alaya, 1996) qui illustrent respectivement ces deux approches de réutilisation.
2.1. Approche de réutilisation basée sur le document
Le premier travail (Rekik, 2001) propose, en vue de favoriser la réutilisation, trois mécanismes de modularité, de flexibilité et de dérivation qui sont associés aux deux activités de modélisation et de production. La modélisation modulaire des documents structurés offre des avantages considérables au niveau de la réutilisation. Les structures génériques modulaires permettent à la fois de :
  • simplifier la réutilisation des structures génériques existantes (design by reuse) grâce aux mécanismes d’importation de modules externes, aux mécanismes de réutilisation des définitions d’éléments et enfin, grâce à la notion d’encapsulation et de portée des noms qui résout le problème de conflits de noms lors de la réutilisation ;
  • favoriser le développement de structures génériques réutilisables (design for reuse) grâce au développement des modules autonomes plus faciles à réutiliser.
Le découpage modulaire des documents offre des avantages notables en termes de réutilisation :
  • le document composite facilite la localisation et l’extraction des fragments grâce à leur autonomie. Ceci permet d’éviter le problème de résolution de dépendance entre un fragment réutilisé et son document englobant ;
  • l’autonomie du fragment permet de simplifier son intégration dans de nouveaux documents et permet de gérer plus facilement des mécanismes de partage de fragments entre plusieurs documents.
En termes de réutilisation, un module flexible possède un potentiel de réutilisation supérieur à celui d’un module figé. En effet, un module défini par des contraintes structurelles offre plus de chance de s’adapter aux besoins de nouvelles structures génériques qu’un module totalement figé. La flexibilité des structures peut contribuer à la résolution du problème de la conformité des documents par rapport à la structure générique, suite à l’intégration d’un fragment externe. Elle offre, en effet, moins de contraintes au niveau de la structure réceptrice. Les contraintes peuvent être considérées comme une spécification des transformations à réaliser sur un fragment pour être conforme au module flexible. Enfin, le mécanisme de dérivation permet de réutiliser de manière peu coûteuse des fragments existants dont les structures génériques sont liées à la structure éditée par des liens de dérivation.
2.2. Approche de réutilisation basée sur la connaissance
L’approche d’aide à la rédaction proposée dans (Alaya, 1996) consiste à formaliser les éléments de connaissance qui peuvent être réutilisés dans la préparation de divers types de documents. Une base de connaissances est conçue pour faciliter la capitalisation et la réutilisation des connaissances dans un domaine donné. Le modèle de cette base de connaissances, qui constitue une extension du modèle REX (Retour d’Expérience) (Malvache, 1994), est structuré en trois niveaux :
  • le niveau lexical décrivant la terminologie du domaine ;
  • le niveau de la modélisation des connaissances qui offre un cadre pour une organisation sémantique de la connaissance d’un domaine ;
  • le niveau de la description des éléments de connaissance qui décrit le contenu et la structure des éléments de connaissance.
Le niveau lexical et celui de la modélisation des connaissances permettent surtout de faciliter la recherche d’informations et la navigation dans la base de connaissances. Le niveau de la description des éléments de connaissance facilite leur capitalisation et leur réutilisation.
2.3. Discussion
Le tableau 1 dresse une étude comparative entre les deux travaux précités selon quatre critères : la connaissance réutilisable, la connaissance de réutilisation, la solution apportée et la méthodologie adoptée. Les deux travaux utilisent des connaissances réutilisables de nature différente : des fragments de documents et des modules de structures génériques pour le premier, et des éléments de connaissance pour le second. La connaissance de réutilisation est présente seulement dans le second modèle à travers les deux niveaux : lexical et de connaissances. Les deux travaux ne reposent pas sur un cadre méthodologique spécifique à la réutilisation. Le premier s’appuie sur la méthodologie issue de la documentation structurée alors que le second s’appuie sur la méthodologie des mémoires d’entreprise et plus particulièrement sur la méthode REX. La solution de la réutilisation, apportée dans le premier travail, réside dans la proposition des trois mécanismes de modularité, de flexibilité et de dérivation. La solution apportée dans le second travail réside dans la proposition d’un modèle de base de connaissances.

Tableau 1
Comparaison des deux travaux cités
IMGIMGCritères	Travaux	Connaissance réutil...IMGIMF
Critères Travaux Connaissance réutilisable Connaissance de réutilisation Solution apportée Méthodologie (Rekik, 2001) Fragments de documents Modules de structure générique Inexistante Mécanismes de modularité, de flexibilité et de dérivation Documents structurés (Alaya, 1996) Eléments de connaissance Niveau lexical Niveau de connaissance Un modèle de base de connaissance Mémoire documentaire

Dans notre travail nous proposons une approche de réutilisation plus générale, visant à réutiliser à la fois des éléments de connaissance et les aspects de documents relatifs à son analyse, à son contenu, à sa structure générique, à sa structure spécifique et à son formatage. En outre, nous voulons enrichir les connaissances de réutilisation en vue d’augmenter les possibilités de recherche lors de la réutilisation. Par ailleurs, nous définissons dans notre travail un cadre méthodologique spécifique à la réutilisation en ingénierie de document.
 
3. Une approche méthodologique de réutilisation en ingénierie de document
 
 
Comme toute approche qui se veut scientifique, la réutilisation doit faire usage de concepts bien définis et de modèles relativement bien explicités et formalisés. La terminologie concernant la réutilisation est loin d’être unique dans la littérature. L’approche méthodologique, que nous proposons dans cette section, constitue le cadre formel qui permet de définir la réutilisation en ingénierie de document. Elle permet de la mettre en lumière grâce à ses deux dimensions : statique, qui est relative aux objets manipulés, et dynamique, qui est relative aux activités et acteurs impliqués. Elle sera complétée, dans les sections 5 et 6, par la proposition de deux modèles sous-jacents. Le premier, baptisé ASARD, prend en charge la représentation, sous forme d’annotations, des connaissances de réutilisation. Le second, baptisé MCD et englobant le premier modèle, prend en charge la représentation en UML, des composants de documents.
3.1. Une définition en psychologie cognitive de la réutilisation
Une représentation de la réutilisation en psychologie cognitive, provenant du raisonnement par analogie (Visser, 1999), est bien illustrée par la figure 1. Le problème pour lequel on fait appel à la réutilisation, est appelé « problème cible » et la solution qu’on veut construire est appelée « solution cible ». La solution qu’on recherche à réutiliser est la « solution source ». Cette dernière est associée à un « problème source » décrivant son contexte.
Figure 1
Une représentation cognitive de la réutilisation
IMGIMGUne représentation cognitive de la réutilisationIMGIMF
D’après (Visser, 1999) des sous-problèmes d’un projet global peuvent être résolus, ou bien à partir de zéro ex nihilo, ou bien par réutilisation, selon le mode qui est le plus « intéressant » d’un point de vue cognitif. Plusieurs études empiriques montrent que le principal critère de sélection entre ces deux modes est le coût de l’adaptation. Ce dernier peut être évalué sur la base du degré de ressemblance entre la solution cible et la solution source éventuelle. La confrontation des spécifications, décrites dans le problème source, avec les besoins, décrits dans le problème cible, permet de trouver la solution source adéquate, qui sera réutilisée dans la construction de la solution cible.
3.2. Une définition de la réutilisation en ingénierie de document
Nous commençons d’abord par l’instanciation (au sens objet) des concepts-clés de la réutilisation (problème cible, solution cible, problème source et solution source), décrits dans la section 3.1, dans le contexte de la réutilisation en ingénierie de document :
  • le problème cible est représenté par l’ensemble des besoins des auteurs de « produits-documents » (section 3.3.1), qui se traduisent en termes d’objectifs rédactionnels (liés au domaine), de préférences éditoriales (niveaux de structuration, style de rédaction, type de média…) et de préférences techniques (langage de balisage, format…) ;
  • la solution cible correspond, lors de la construction d’un « produit-document », à la partie qu’on cherche à développer ex nihilo ou par réutilisation d’une brique de document source. Le « produit-document » est considéré comme un assemblage de « briques de documents » (section 3.3.2) (Sedes, 1998) (Chrisment et al., 2000) ;
  • le problème source correspond au contexte originel d’une solution source. Il peut être obtenu par déduction (rétro-ingénierie) ou par création. Il consiste à rendre explicites les spécifications rédactionnelles, éditoriales et techniques ;
  • la solution source désigne toute brique de document pouvant être associée à un média particulier (texte, image, son, vidéo) et pouvant être réutilisée dans la construction d’une solution cible.
Nous définissons maintenant la réutilisation en ingénierie de document par adaptation de la définition générique utilisée dans (Visser, 1999), présentée dans (section 3.1). Des fragments d’un nouveau « produit-document » (section 3.3.1) peuvent être construits, ou bien ex nihilo, ou bien par réutilisation, selon le mode qui est le plus « intéressant » d’un point de vue rédactionnel. La réutilisation permet d’exploiter les aspects communs ou similaires à plusieurs « produits-documents ». Elle a pour objectif l’amélioration de la qualité des « produits-documents » et de la productivité de leurs auteurs, d’une part, et l’industrialisation des activités de modélisation et de production, d’autre part. Correctement comprise et utilisée dans un contexte adapté, la réutilisation en ingénierie de document offre des avantages tangibles.
3.3. La dimension statique
Dans cette dimension, nous décrivons le « produit-document », les briques de documents et les composants de documents.
3.3.1. Le « produit-document »
Nous désignons par « produit-document » tout objet documentaire produit, ou à produire, durant l’activité de modélisation ou de production, en ingénierie de document. Ainsi, nous considérons comme étant un produit-document, un projet de document contenant son analyse ; une structure générique de document, conceptuelle ou balisée ; une structure spécifique de document, conceptuelle ou balisée ; un document structuré, conceptuel ou balisé ; et une feuille de style.
3.3.2. Les briques de document
Dans notre approche les briques de document sont de type « briques de produits » contrairement aux « briques de processus » (Biggerstaff et al., 1987). Le premier type correspond aux briques de document autonomes adaptables. La réutilisation de ces derniers met en œuvre un processus de composition qui est généralement à la charge de l’auteur. Le second type correspond à des règles de transformation qu’il est possible d’instancier au moment de chaque utilisation. La réutilisation se traduit dans ce cas par un processus de génération. L’approche « documents virtuels » constitue un exemple de cette approche.
Nous nous intéressons dans cette section à l’identification des solutions sources, à savoir les briques de documents. Nous en proposons une classification, basée sur la nature de leur contenu. Nous recensons ainsi neuf classes de briques :
  • les éléments de connaissance qui seront réutilisés dans l’analyse du nouveau produit-document. Ils nécessitent des opérations de contextualisation et d’adaptation importantes. Une part importante des connaissances intervenant dans l’élaboration d’un document préexistent et peuvent même intervenir dans plusieurs documents (Nanard et al., 1989). L’élément de connaissance est défini dans (Alaya, 1996) comme une collection d’informations sémantiquement homogènes ;
  • les fragments conceptuels de contenu structuré, qui seront réutilisés dans la construction d’un nouveau document structuré conceptuel ;
  • les fragments balisés de contenu structuré, qui seront réutilisés dans la construction d’un nouveau document structuré balisé ;
  • les fragments de contenu non structuré, qui seront réutilisés dans la construction d’un nouveau document structuré conceptuel ou balisé ;
  • les fragments conceptuels de structure générique, qui seront réutilisés dans la construction d’une nouvelle structure générique conceptuelle ;
  • les fragments balisés de structure générique, qui seront réutilisés dans la construction d’une nouvelle structure générique balisée ;
  • les fragments conceptuels de structure spécifique, qui seront réutilisés dans la construction d’une nouvelle structure spécifique conceptuelle ;
  • les fragments balisés de structure spécifique, qui seront réutilisés dans la construction d’une nouvelle structure spécifique balisée ;
  • les fragments de feuille de style qui seront réutilisés dans la construction d’une nouvelle feuille de style.
Nous ne considérons donc pas être dans le cadre de la réutilisation lorsque pour construire un document valide, on réutilise une DTD contenue dans une brique de structure ; ou bien pour formater un document, on réutilise un modèle de feuille de style contenu dans une brique de formatage.
3.3.2.1. Quelques propriétés des briques de documents
Toute brique de document doit respecter des critères de qualité, qui peuvent être scindés en trois classes :
  • critères généraux :
    • qualité rédactionnelle : elle est relative au sens du message et à sa cohérence sémantique,
    • qualité éditoriale : elle est relative à la mise en forme du message et à sa production physique,
    • simplicité et compréhension,
    • autonomie : faculté à être extraite de son contexte,
    • qualifiabilité : faculté à être qualifiée par d’autres informations facilitant sa compréhension et sa réutilisation,
    • réutilisabilité : aptitude à être réutilisée totalement ou partiellement et sans modification majeure dans un autre environnement ou pour un autre usage. cette définition s’inspire de celle de la réutilisabilité d’un document dans (richez, 1996). la structuration favorise puissamment la réutilisation : possibilité d’une réutilisation partielle, facilité d’adaptation structurelle. la réutilisabilité d’une brique de document est proportionnelle à son degré de granularité ;
  • critères techniques :
    • associabilité : capacité d’une brique de document à être associée à d’autres briques de document,
    • portabilité : faculté d’utilisation d’une brique de document sur différentes plates formes matérielles et logicielles,
    • décomposabilité : une brique de document peut résulter de l’assemblage de plusieurs briques de document de granularité plus fine. a chaque niveau d’imbrication, les briques de document doivent respecter les critères de réutilisabilité ;
  • critères fonctionnels : les fonctionnalités offertes par la brique de document devront correspondre aux attentes des réutilisateurs potentiels. Deux portées, verticale et horizontale, sont généralement utilisées pour décrire ces fonctionnalités :
    • la portée verticale caractérise la réutilisabilité des briques à travers les étapes du cycle de modélisation ou de production. Elle permet de classer les briques de document en fonction du niveau d’abstraction (analyse, conception…),
    • la portée horizontale caractérise la réutilisabilité des briques à travers les domaines de rédaction couverts : domaine technique, conduite de projet, pédagogie, etc. Elle permet de classer les briques de document, en fonction du niveau de leur dépendance du domaine de la rédaction. Nous distinguons trois classes de briques de documents : les briques de document spécifiques à un produit-document ; les briques de document spécifiques à un domaine de documents ; et les briques de document indépendantes de tout domaine d’application. Les deux premières classes présentent généralement un faible taux de réutilisabilité.
3.3.2.2. La qualification des briques de documents
Toutes les briques de documents doivent être qualifiées de manière homogène. La qualification est essentielle pour la classification et la recherche des briques de documents. Elle constitue un moyen d’assurer l’interopérabilité entre applications, si son usage est normalisé. Dans (Crampes et al., 1999), on considère un matériau pédagogique comme pouvant revêtir deux statuts. S’il n’a pas fait l’objet d’une description compatible avec la DTD Karina, il est dans l’état matériau pédagogique originel (MPO). Il faut qu’il soit qualifié par un enseignant auteur à l’aide de la DTD pour être considéré comme un matériau pédagogique qualifié (MPQ). Nous proposons, dans la section 4, un modèle général de qualification des briques de documents, basé sur trois formes distinctes de qualification.
3.3.3. Le composant de document
La définition suivante est inspirée d’une autre définition, proposée pour les biens logiciels (Ezran et al., 1999), que nous avons adaptée au contexte de la réutilisation en ingénierie de document. Nous définissons un composant de document comme un ensemble de briques de documents, qui le représentent à différents niveaux d’abstraction (analyse de besoins, conception de la structure, conception du contenu, balisage et formatage) et qui peuvent être réutilisés d’un produit-document à l’autre. Nous proposons, dans la section 5, un modèle général de composant de document.
3.4. La dimension dynamique
Nous abordons dans cette dimension les niveaux de maturité d’un processus de réutilisation ; les différentes possibilités d’intégration de la réutilisation en ingénierie de document ; les activités principales et les acteurs qui y sont impliqués. Ensuite, nous proposons un cycle de vie, relatif à l’ingénierie de document, spécifique à la réutilisation.
3.4.1. Les niveaux de maturité dans le processus de réutilisation
En vue de mesurer le processus de réutilisation en ingénierie de document, nous adoptons les cinq niveaux de maturité, utilisés par SEI (Software Engineering Institut) (log, 2000). Nous présentons ci-dessous la définition de chaque niveau de maturité avec un exemple lié au contexte d’ingénierie de document :
  • le niveau initial est caractérisé par un processus chaotique. Il s’agit d’une réutilisation non formalisée consistant, par exemple pour un auteur d’un nouveau document Word, à faire des actions copier/coller sur certaines parties qui l’intéressent à partir d’un autre document. La recherche de ces parties dans les documents existants ainsi que leur intégration dans le nouveau document sont complètement à la charge de cet auteur ;
  • le niveau reproductible est caractérisé par un processus artisanal qui dépend beaucoup des individus. Par exemple, lors de la construction d’un nouveau cours, la réutilisation consiste en la récupération de quelques parties : standards, par exemple des en-têtes de documents, ou au contenu général, par exemple une présentation des objectifs de la formation. Ce qui distingue ce niveau du précédent est le fait que les parties, destinées à être réutilisées plusieurs fois, sont stockées dans des fichiers indépendants, qui sont rangés dans des espaces partagés. La réutilisation à ce niveau dépend de l’organisation et de la volonté de chacun. Elle n’est pas déployée uniformément aux auteurs et par conséquent, elle est soumise à peu de contrôle et de planification ;
  • le niveau défini est caractérisé par un processus bien suivi mais essentiellement d’une manière qualitative. En fait, c’est à partir de ce niveau, que les deux activités principales de la réutilisation authoring for reuse et authoring by reuse (section 3.4.3) sont formalisées ;
  • le niveau géré est caractérisé par un processus contrôlé et mesuré. Des métriques (section 5) peuvent être utilisées pour évaluer la réutilisation des briques de document ;
  • le niveau optimisé est caractérisé par l’analyse du processus en vue de l’améliorer. Il s’agit d’un retour d’expérience à mettre au profit de l’évolution du processus. Par exemple, les auteurs experts (section 3.4.4) en pédagogie peuvent rajouter, supprimer ou modifier certaines briques de document, suite à l’analyse du processus de réutilisation, dans un contexte de e-learning.
3.4.2. Intégration de la réutilisation en ingénierie de document
A partir du niveau de maturité « défini » (section 3.4.1), l’intégration du processus de réutilisation, en ingénierie de document, dans le cycle de modélisation ou de production, peut se faire selon deux approches opportunistic reuse ou systematic reuse (Wartik, 1992).
Dans la première approche, l’auteur réutilisateur (section 3.4.4) dispose d’une bibliothèque de briques de documents et de mécanismes pour les rechercher. Il a cependant la responsabilité, d’une part, d’identifier les situations pour lesquelles la réutilisation est pertinente et d’autre part, de choisir les briques adaptées à son problème.
La seconde approche suppose que le processus de modélisation et de production intègre des connaissances définissant les briques de document à réutiliser au regard d’une situation et les façons de les adapter en fonction d’un besoin particulier. Dans cette approche, les activités de la réutilisation (recherche, sélection et adaptation) sont toutes intégrées dans l’activité de modélisation ou de production, simplifiant ainsi le processus de réutilisation. Une telle approche implique une reformulation des activités de modélisation et de production, en ingénierie de document, dans lesquelles l’auteur exprime des besoins et trouve des solutions.
3.4.3. Authoring for reuse et Authoring by reuse
Il est usuel de distinguer, en génie logiciel, deux types d’activités de réutilisation complémentaires appelées l’ingénierie des composants réutilisables (design for reuse) et l’ingénierie de développement par réutilisation (design by reuse) (Fugini et al., 1992) (Mili et al., 1995). Dans le contexte de l’ingénierie de document, nous appelons ces deux types d’activités, respectivement authoring for reuse et authoring by reuse. Le premier type d’activité est concerné par la production de briques de documents réutilisables et met en œuvre des tâches pour leur identification, qualification, représentation et organisation. Le deuxième type d’activité est concerné par des problèmes de recherche et de sélection, d’adaptation et d’intégration de briques de document dans l’activité de modélisation ou de production, en vue de construire des produits-documents.
3.4.4. Acteurs de la réutilisation
Nous distinguons, dans la réutilisation en ingénierie de document, trois catégories d’acteurs : les intervenants, les agis et les experts. On est inspiré de la classification des acteurs, impliqués dans un processus d’aide à la décision (Roy, 1985), où les hommes d’étude désignent les experts :
  • les intervenants sont ceux qui conditionnent directement la réutilisation. Nous les appelons les « auteurs réutilisateurs ». Ils construisent les produits-documents par réutilisation de briques de documents. Ils interviennent dans l’activité authoring by reuse ;
  • les agis sont tous ceux qui, de façon normalement passive, subissent les conséquences de la réutilisation ; laquelle est seulement censée répondre à leurs attentes. Nous scindons cette catégorie en deux :
    • les « autres auteurs », réutilisateurs ou non, qui utilisent un produit-document fabriqué par des auteurs réutilisateurs lors de la construction, par réutilisation ou non, d’un autre produit-document. C’est le cas par exemple, d’un auteur de document qui utilise pour la validation une DTD construite, par réutilisation, par un autre auteur réutilisateur ;
    • les « lecteurs » de documents produits par des auteurs réutilisateurs ;
  • les experts sont ceux qui prennent en charge la réutilisation. Nous les appelons « auteurs experts ». Ils interviennent dans l’activité authoring for reuse. Leur rôle consiste essentiellement à la capitalisation des briques de documents, à la gestion de leur réutilisation, notamment leur persistance et leur évolution (cette tâche relève des niveaux de maturité : géré et optimisé) et enfin, à convaincre les auteurs réutilisateurs à les réutiliser. Les auteurs experts apparaissent en quelque sorte comme des auteurs au second degré. Leur activité les contraint dans bien des cas à introduire des hypothèses volontaristes.
La figure 2, ci-dessus, montre un schéma général de réutilisation en ingénierie de document qui illustre notre approche méthodologique. Les quatre quadrants représentent les quatre activités liées à l’ingénierie de document. Les deux premières, authoring by reuse et authoring for reuse, sont spécifiques à la réutilisation, tandis que les deux autres, reading et authoring, sont générales. Les agis correspondent aux acteurs des ces deux dernières activités. Les flèches utilisées sont commentées dans le tableau 2 ci-dessous.
Figure 2
Schéma général de la réutilisation en ingénierie de document
IMGIMGSchéma général de la réutilisation en ingénierie d...IMGIMF

Tableau 2
Interprétation des flèches de la figure 2
IMGIMGFlèche	Rôle	1	Identification des bri...IMGIMF
Flèche Rôle 1 Identification des briques de document à partir de produits-documents existants 2 Qualification, représentation et organisation des briques de documents 3 Recherche et sélection des briques de documents 4 Adaptation et intégration des briques de documents Utilisation d’un produit-document lors de la construction d’un autre. Ce qui ne 5 correspond pas à un cas de réutilisation. Comme l’utilisation d’une DTD pour produire un document valide ou une feuille de style pour formater un document. 6 Activité de construction, sans réutilisation, d’un produit-document 7 Activité de lecture reading

3.4.5. Un cycle de vie spécifique à la réutilisation
Les activités de modélisation et de production en ingénierie de document sont menées souvent, sans recours à une méthode précise (approche artisanale). Contrairement au génie logiciel, où l’on trouve des processus rigoureux et méthodiques (cycle en cascade ou en V). Nous proposons dans cette section un modèle de cycle de modélisation et de production en ingénierie de document, qui permet d’y introduire la réutilisation. Ce cycle est inspiré de celui en X proposé par (Hodgson, 1991), qui est spécifique au génie logiciel et qui permet d’introduire la réutilisation dans le cycle de développement en V.
La figure 3 représente notre modèle de cycle de vie en pyramide « ∧ ». La partie droite du « ∧ » désigne un cycle en cascade, relatif aux activités de modélisation ou de production en ingénierie de document. La partie gauche correspond aux briques de document qui sont présentées à plusieurs niveaux. L’interaction entre les briques de document et le cycle en cascade se fait via les deux activités authoring for reuse et authoring by reuse.
Figure 3
Cycle de modélisation et de production, spécifique à la réutilisation
IMGIMGCycle de modélisation et de production, spécifique...IMGIMF
Le cycle en cascade est composé de cinq étapes essentielles : analyse des besoins, conception de la structure, conception du contenu, balisage et formatage. Nous présentons ci-dessous chacune de ces étapes, avec prise en compte de la réutilisation (authoring by reuse) :
  • l’étape d’analyse des besoins consiste essentiellement à définir avec précision les objectifs rédactionnels et les préférences, éditoriales et techniques, du produit-document. Il n’y a pas de modèles spécifiques à l’analyse en ingénierie de document. En cette phase, il est conseillé d’aller consulter dans la bibliothèque des briques de document, relatives aux éléments de connaissance (section 3.3.2). Cette consultation permettra de savoir si une analyse pour le même type de produit-document n’a pas été déjà faite. Si c’est le cas, ce qui convient dans le nouveau contexte sera réutilisé après une éventuelle adaptation ;
  • l’étape de conception de la structure consiste à mettre en évidence les différents éléments d’une structure (générique dans le cas de la modélisation et spécifique dans le cas de la production) et la hiérarchie de composition qui les relie. Elle peut utiliser pour cela des modèles conceptuels tel que le modèle Entité Association Etendu EAE (Woelk, 1987). Ce modèle permet une représentation abstraite, indépendante de toute norme et suffisamment générique. Il est particulièrement adapté pour répondre aux besoins de cette phase conceptuelle, puisqu’il permet de mettre en évidence les différents éléments d’une structure et la hiérarchie de composition qui les relie. Si l’étape précédente a réutilisé des briques d’analyse, il est peut-être possible de réutiliser également les briques de structure associées ;
  • l’étape de conception du contenu concerne l’activité de production uniquement. Elle vise à compléter la structure spécifique conçue dans l’étape précédente par le contenu. Elle consiste soit à créer de toute pièce des briques de document (ex nihilo) ou bien à réutiliser celles existantes. Dans ce dernier cas, on doit chercher dans la bibliothèque l’existence de briques de documents, de type « fragment de contenu » structurées ou non structurées, pouvant être réutilisées. Si le fragment est structuré, un retour à l’étape précédente est nécessaire pour réétudier la structure spécifique globale ;
  • l’étape de balisage consiste à traduire la structure conceptuelle du produit-document obtenue dans l’étape 2 et le contenu structuré produit dans l’étape 3 dans un langage de balisage. Plusieurs langages de balisage existent aujourd’hui : SGML, HTML et XML. Le langage XML est généralement choisi pour sa facilité d’implémentation et son interopérabilité avec les autres [1]. La réutilisation dans cette étape consiste à rechercher dans la bibliothèque des fragments balisés, de contenu structuré, ou de structures spécifiques ou génériques, pouvant être réutilisés. Cette réutilisation est plus réaliste et plus facile que dans les étapes précédentes. En effet, le produit-document à construire étant lui même balisé, l’intégration éventuelle des briques de document balisées peut devenir automatique. Cela est d’autant plus vrai quand le langage de balisage utilisé est le même ;
  • l’étape de formatage consiste à mettre en forme, selon une feuille de style, le produit-document balisé, obtenu dans l’étape précédente. Le modèle de feuille de style dépend généralement du langage de balisage utilisé. Par exemple, les feuilles de style XSL sont faites spécialement pour les produits-documents écrits en XML. La réutilisation à ce niveau se limite aux feuilles de style et présente par conséquent peu d’intérêt. Elle est utile dans le cas où la brique de formatage correspond à une brique balisée déjà utilisée dans l’étape précédente.
Bien entendu ce cycle en cascade n’est pas sans retour. Pendant une étape donnée, un besoin de revenir aux étapes précédentes peut se faire sentir. Ce qui engendre une nouvelle itération de certaines étapes. Dans l’activité authoring for reuse, la tâche d’identification consiste à reprendre les différentes étapes du cycle de vie en cascade précitées en vue d’en tirer des parties qui présentent une qualité rédactionnelle et/ou éditoriale, et qui semblent générales. Ces parties, après avoir été qualifiées, constitueront des briques de document, et seront rangées dans la bibliothèque. La partie gauche du « ∧ » représente les cinq types de briques de document qui seront réutilisées durant le cycle de vie de modélisation ou de production, et qui correspondent à des niveaux d’abstraction différents : briques d’analyse, briques de structure, briques de contenu, briques balisées et briques de formatage.
Le tableau 3 montre la correspondance entre cette classification basée sur le niveau d’abstraction des briques de documents et la classification basée sur leur nature (section 3.3.2).

Tableau 3
Correspondance entre classifications de briques de document
IMGIMGNiveau d’abstraction	Nature Briques ...IMGIMF
Niveau d’abstraction Nature Briques d’analyse Eléments de connaissance Fragments conceptuels de structure générique Briques de structure Fragments conceptuels de structure spécifique Fragments conceptuels de contenu structuré Briques de contenu Fragments de contenu non structuré Fragments balisés de structure générique Briques balisées Fragments balisés de structure spécifique Fragments balisés de contenu structuré Briques de formatage Fragments de feuille de style

 
4. Un modèle général de qualification des briques de document
 
 
L’activité de production et de modélisation, par réutilisation, repose sur l’expérience rédactionnelle et éditoriale partagée des auteurs experts et des auteurs réutilisateurs (section 3.4.4). Les premiers supposent que les termes utilisés ont le même sens pour eux et pour les seconds. Cette supposition est dangereuse à cause de l’ambiguïté inhérente aux langages naturels et parce qu’une terminologie standard n’existe pas. Ce qui se traduit souvent par des incompréhensions entre les uns et les autres. Le modèle ASARD (annotations structurées d’aide à la réutilisation des documents), qui constitue une extension et une généralisation de celui présenté dans (Chikh et al., 1999), permet de limiter ces problèmes de communication, en proposant un ensemble d’unités d’annotations structurées.
Une analyse des besoins dans le domaine de la réutilisation, nous a permis d’identifier un certain nombre de catégories d’unités d’annotation. Nous en rappelons d’abord la définition d’une unité d’annotation (UA) ensuite nous en citons quelques catégories (figure 4). Une UA permet à son auteur d’ajouter des métaconnaissances relatives aux connaissances sources. Elle est exprimée par un acte qui exprime ce que les auteurs experts souhaitent rajouter pour aider les auteur réutilisateurs dans une démarche de réutilisation.
Figure 4
Catégories d’annotations relatives à l’aide à la reconstruction
IMGIMGCatégories d’annotations relatives à l’aide à la r...IMGIMF
Une unité d’annotation est un prédicat à cinq arguments. Le nom du prédicat exprime le nom de l’action que fait l’auteur sur l’objet de document en cours d’annotation, comme par exemple, métadécrire un objet de document. Les arguments dépendent de l’unité d’annotation :
  • le premier argument indique l’objet de document cible de l’annotation. Cet objet peut être une brique de document entière ou juste une partie de cette brique, par exemple : un élément d’un fragment de contenu ou un module d’un fragment de structure ;
  • le second argument désigne le moyen de l’action visée par l’annotation : la métadonnée dans la première catégorie, le concept générique ou spécifique dans la seconde, et rien dans la dernière catégorie ;
  • le troisième argument contient le type de l’annotation : le schéma descriptif dans la première catégorie, l’ontologie dans la seconde, et rien dans la dernière ;
  • le quatrième argument indique la valeur de la métadonnée dans la première catégorie, le concept spécifique de la brique de document associé au concept générique dans la seconde catégorie, et rien dans la dernière catégorie ;
  • et enfin, le cinquième argument apporte des explications sur l’annotation et donne des recommandations à prendre en compte lors de la réutilisation.
Ces trois catégories d’annotations correspondent à trois formes de qualification différentes : par les métadonnées, par les ontologies et par les annotations libres (figure 5).
Figure 5
Qualification des briques de documents dans le modèle ASARD
IMGIMGQualification des briques de documents dans le mod...IMGIMF
4.1. La qualification par les métadonnées
Le concept de métadonnées recouvre tout ce qui concerne « des données sur les données ». Accompagner un document de métadonnées est une façon d’enrichir sa sémantique (Quint, 2000). L’indexation est une condition nécessaire pour qu’une solution source soit réutilisable. La qualification par les métadonnées permet d’améliorer les possibilités de recherche traditionnelle, basée souvent sur une « indexation plein-texte en aveugle ». Elle suppose qu’au préalable aient été définies des métadonnées descriptives. Les métadonnées sont définies dans (Amous et al., 2001) comme des fiches descriptives utilisées pour organiser, rassembler, retrouver, conserver l’information et y fournir l’accès.
On définit dans (Michard, 2001) un triplet comme l’association d’une métadonnée, d’une ressource et d’une valeur. La ressource correspond dans le modèle ASARD au premier argument « Objet » de la catégorie « métadécrire ». La métadonnée et sa valeur correspondent respectivement aux second et troisième arguments. L’ensemble des métadonnées, définies et exploitées par une certaine collectivité d’utilisateurs, et des contraintes sur les valeurs possibles de ces métadonnées s’appelle un schéma descriptif. Ces schémas sont soit des descripteurs spécifiques (Chrisment et al., 2000), ou bien des descripteurs déjà établis sous forme de standards ou de recommandations. On trouve dans cette catégorie, entre autres, le Dublin Core [2] et le standard MARC [3] (Machine Readable Cataloging). Le type de schéma-descriptif est fourni par le troisième argument de la catégorie « métadécrire ».
Nous utilisons comme schémas descriptifs de métadonnées pour qualifier les briques de document :
  • le standard Dublin Core (DC) qui est un ensemble d’éléments ayant une sémantique claire et facilement compréhensible par les utilisateurs. Toutes les briques de document peuvent être identifiées de manière homogène par quinze propriétés. Certaines sont relatives au contenu proprement dit de la brique de document (titre, sujet/mots-clés, description, source, langage, relation, couverture), d’autres à la propriété intellectuelle de ce contenu (créateur, éditeur contributeur), et les dernières aux caractéristiques physiques de la brique (date, type, format, identifiant). Le rôle du descripteur (DC) est limité à une recherche de surface des briques de document dans la bibliothèque. Il n’apporte aucune information aux auteurs pour les aider à trouver la brique de document adéquate. Selon le domaine d’application, ce schéma peut être remplacé par un autre standard plus adapté. Nous citons à titre d’exemple le schéma LOM (Learning Object Metadata) que nous utilisons dans le domaine du e-learning et qui sera décrit dans la section 6.2 ;
  • des travaux (Chrisment et al., 2000) ont été menés pour proposer un ensemble de métadonnées spécifiques à chaque type de médias afin de disposer du maximum d’informations relatives au fragment de contenu. Les métadonnées extraites peuvent être génériques, valables pour tout type de données (taille, type, extension…) ou spécifiques à un type de données (texte, audio…). L’extraction des métadonnées est réalisée au moyen de fonctions spécifiques à chaque média. Ces fonctions peuvent être regroupées dans des bibliothèques dédiées à chaque média qui peuvent être complétées par des fonctions issues du domaine public (Amous et al., 2001) ;
  • les métadonnées spécifiques à la réutilisation, qui constituent l’originalité de notre travail de recherche concernant la qualification des briques de documents (Chikh et al., 1999). Elles caractérisent un objet de document (brique de document ou un de ses éléments), et sont utiles pour sa réutilisation. Nous en citons quelques unes : le paramétrage de l’objet de document, son caractère obligatoire ou facultatif, son caractère général ou spécifique, son niveau de confidentialité, ses alternatives, son degré d’importance, etc. :
    • un objet document est dit « paramétré » si son contenu doit être saisi, calculé ou émanant d’une source de données quelconque ;
    • un objet document est considéré comme « général », si son contenu est valable en dehors de son contexte d’utilisation initial, sinon on parle d’objet « spécifique ». Les objets généraux peuvent être reconduits tels qu’ils sont dans les nouveaux produits-documents. Par contre, les objets spécifiques doivent être revus en fonction des données du nouveau contexte de réutilisation ;
    • les objets de documents qui possèdent le caractère « obligatoire », à l’inverse du caractère « facultatif », constituent la partie indispensable. Un objet qui possède le caractère obligatoire est reconduit automatiquement dans le nouveau produit-document. Par contre, un objet facultatif, est repris à la demande des auteurs réutilisateurs ;
    • la « confidentialité » désigne le caractère secret de certains objets de documents. Les objets confidentiels doivent être neutralisés, par remplacement de leur contenu confidentiel avec le texte associé, « texte-explication » ;
    • des alternatives à certains objets de documents peuvent être proposées aux auteurs réutilisateurs, grâce à la métadonnée « alternative », en vue d’augmenter leur marge de manœuvre lors de la réutilisation.
4.2. La qualification par les ontologies
Une représentation sémantique par les ontologies permet de décrire de manière formelle le sens d’une brique de document. La méthode généralement utilisée consiste à faire référence aux concepts contenus dans une ontologie. Le principe d’utilisation d’ontologies pour décrire des fragments de connaissance est très répandu dans la communauté « intelligence artificielle » internationale (Gruber, 1993). Le projet Karina vise à fournir des outils pour permettre à un enseignant d’utiliser le réseau internet pour diffuser ses propres cours et pour utiliser des briques de cours provenant d’autres enseignants ou d’autres sources (Crampes et al., 1999). Il utilise une ontologie du domaine enseigné, désignée par une URI, pour décrire certaines valeurs associées à des éléments de description, comme par exemple la description conceptuelle d’un document ou bien ses prérequis.
De nombreuses ontologies sont actuellement disponibles sur internet comme WordNet (Voorhees, 1998). Elles comprennent une définition des concepts du domaine qu’elles recouvrent et une classification hiérarchique de ces concepts sur la base de la relation « est un sous-type de » et de définitions de relations entre concepts qui constituent la sémantique des concepts. Les concepts génériques ou spécifiques de l’ontologie sont référencés dans le modèle ASARD grâce au second argument de la seconde catégorie.
4.3. La qualification par les annotations libres
Cette dernière forme de qualification vise uniquement à ouvrir un canal de communication, des auteurs experts vers les auteurs réutilisateurs, contenant des explications et des recommandations, concernant la réutilisation des briques de documents dans la construction de nouveaux produits-documents.
L’opération de qualification (et plus généralement l’activité authoring for reuse), nécessite du temps, des moyens et des efforts importants de la part des auteurs experts. Il s’agit d’un investissement stratégique qui sera récompensé, à moyen terme ou à long terme (authoring by reuse), par une meilleure productivité des auteurs réutilisateurs.
 
5. Le modèle général de composant de document
 
 
Dans cette section, nous présentons le modèle MCD (modèle de composant de document), qui est basé sur le travail initial proposé dans (Chikh, 2002). Pour plus de compréhension, nous proposons, dans la figure 6, une représentation en UML du modèle MCD. Ce modèle est composé de deux parties :
  • la connaissance réutilisable est représentée par un ensemble de briques de documents qui peuvent être des briques d’analyse, des briques de structure, des briques de contenu, des briques balisées ou des briques de formatage. Dans le diagramme des classes UML (figure 6), chacun de ces types est représenté par une classe qui est reliée d’une part, par un lien de généralisation à la classe principale « brique de document » et d’autre part, par un lien de spécialisation aux neuf classes décrites dans la section 3.3.2 conformément au tableau 3. La composition récursive associée à la classe « brique de document » traduit la propriété de décomposabilité décrite dans la section 3.3.2.1. Les deux associations « extraite de » et « réutilisée dans » supportent la traçabilité des briques de document. La première permet de connaître les produits-documents à partir desquels les briques de document ont été extraites. La seconde permet de connaître les produits-documents dans lesquels ces briques ont été réutilisées. La composition utilisée entre les classes « entrepôt » et « brique de document » traduit une relation de stockage physique. L’agrégation liant la classe « composant de document » à la classe « brique de document » traduit la définition énoncée dans la section 3.3.3. La qualification des briques de document, par les annotations structurées d’aide à la réutilisation, est représentée par l’association « qualification » ;
  • la connaissance de réutilisation est représentée par un ensemble d’annotations d’aide à la réutilisation permettant trois formes de qualification : par les métadonnées, par les ontologies et par les annotations libres. Dans le diagramme des classes UML (figure 6), chacune de ces formes est représentée par une classe qui est reliée par un lien de généralisation à la classe principale « annotation ». Cette dernière est reliée via une relation d’agrégation à la classe « catalogue ». Les composants sont rassemblés dans des bibliothèques par une relation d’agrégation entre leurs classes respectives. Un catalogue est associé à chaque bibliothèque grâce à l’association « ∈ > ». L’ensemble des briques de documents d’un composant de document peut être vide. Nous parlerons dans ce cas de composant vide. Son rôle consiste à identifier un besoin particulier dans un domaine de documentation précis. Les annotations sont utilisées dans ce cas comme des spécifications de ce besoin. Une brique de document est décrite par des métriques. Il s’agit d’un ensemble d’indicateurs liés au processus de son exploitation dans la construction de nouveaux produits-documents. Nous citons à titre d’exemple : le nombre d’accès à une brique de document, le nombre de fois qu’elle a été effectivement réutilisée, le nombre de fois qu’elle a été modifiée, etc.
Figure 6
Modèle général de composant de document
IMGIMGModèle général de composant de documentIMGIMF
5.1. La connaissance réutilisable : entrepôt
La connaissance réutilisable est représentée par l’ensemble des briques de documents. Elle est organisée selon une approche matérialisée (entrepôt). Contrairement à l’approche virtuelle (par médiateur), où les briques de document ne sont stockées que dans leurs sources d’origine, les briques sont effectivement extraites, intégrées et stockées dans un entrepôt (Bellahcene et al., 2001). Les requêtes des auteurs réutilisateurs sont traitées directement par l’entrepôt sans accéder aux sources. Les avantages d’une telle approche sont l’amélioration du temps de réponse des requêtes et la disponibilité permanente des briques de document.
« Les entrepôts de documents doivent constituer une source d’informations synthétique et homogène, comme c’est déjà le cas pour les entrepôts de données. » (Khrouf et al., 2001). Les briques de document étant des objets complexes de nature différente (des éléments de connaissance, des fragments de document, des fragments de structure générique, des fragments de structure spécifique, des fragments de feuille de style), le modèle de l’entrepôt qui va les contenir doit être assez générique. Nous n’avons pas la prétention d’en proposer un dans cet article. Néanmoins, nous pensons que le modèle utilisé dans (Khrouf et al., 2001) peut être adopté à condition qu’il soit généralisé aux briques de documents de type : éléments de connaissance et fragments de feuilles de style. Aussi nous envisageons, pour le stockage des briques de documents, l’utilisation de plusieurs entrepôts physiques, basés sur le modèle qui sera développé.
5.2. La connaissance de réutilisation : catalogue
La connaissance de réutilisation est représentée par l’ensemble des annotations d’aide à la réutilisation du modèle ASARD, qui sont associées aux briques de documents. Nous appelons catalogue un ensemble d’annotations d’aide à la réutilisation, associé à une seule bibliothèque. Un auteur réutilisateur doit pouvoir parcourir le catalogue afin de consulter la description des briques de documents.
Un prototype de gestion des annotations, contenues dans les catalogues, est en voie de finalisation. Il est développé selon une approche procédurale utilisant une API basée sur le modèle DOM [4]. Les annotations sont représentées en XML et sont valides par rapport à une DTD (Chikh, 2003). Cela nous permet d’exercer un bien meilleur contrôle sur les annotations d’aide à la réutilisation. Par ailleurs, nous proposons le langage RDFS5 pour la description de l’ontologie et les métadonnées ; et RDFS [5] pour la description des annotations de type « métadécrire » et « référencer-concept ». Ce dernier choix permet de rendre explicites les relations sémantiques qui existent entre ces deux types d’annotations et les concepts et les métadonnées qui leurs sont associés.
 
6. Application au e-learning
 
 
Dans cette section nous montrons l’application de notre approche méthodologique de réutilisation (section 2) au e-learning. Il s’agit d’une aide à la construction de produits pédagogiques basée sur la réutilisation des briques pédagogiques.
Nous supposons que pour la construction d’un nouveau produit pédagogique, les enseignants seraient susceptibles d’être plus intéressés par la reprise de briques de document existantes, produites dans le cadre de cours similaires. En effet, il est inutile de démarrer « à zéro », alors qu’il est possible de reprendre certaines parties des cours existants et les adapter au nouveau contexte. Par ailleurs, nous supposons que les produits pédagogiques, écrits dans le cadre de cours appartenant à un même domaine et une même formation, utilisent des contenus et des structures plus ou moins similaires.
Bien entendu, des études empiriques sont nécessaires pour valider ces deux hypothèses. Si nos suppositions se confirment, nous pourrions affirmer, d’une part, que cette réutilisation permettrait d’améliorer (retour d’expérience) et de généraliser (partage de savoir-faire) la qualité des produits pédagogiques et, d’autre part, augmenter la productivité des enseignants/auteurs. Nous pensons ainsi qu’une aide efficace dans la construction de produits pédagogiques peut être apportée à ces enseignants en proposant une approche de réutilisation.
6.1. Application des deux dimensions statique et dynamique
Les tableaux 4 et 5 ci-dessous illustrent respectivement l’application de la dimension statique et de la dimension dynamique de notre approche. Ils rappellent, dans la première colonne, les éléments fondamentaux de notre approche et montrent, dans la seconde, leur application au e-learning. Les éléments pour lesquels cette application ne présente aucune particularité ne sont pas présentés.

Tableau 4
Application de la dimension de produit au e-learning
IMGIMGDimension statique	Application au e-...IMGIMF
Dimension statique Application au e-learning Problème source Il s’agit du contexte originel de développement des briques pédagogiques qui peut ne pas être pédagogique. En effet, ce qui confère à une brique le statut de brique pédagogique susceptible d’être utilisée dans un produit pédagogique n’est pas sa qualité d’être originellement pédagogique, mais le fait d’avoir été qualifiée. Ceci permet d’intégrer dans le produit pédagogique, des briques de documents qui n’ont pas originellement un statut pédagogique, comme la description d’un produit ou la configuration d’un matériel. Elément Exemple : un élément de connaissance qui contient les objectifs de connaissance pédagogiques d’un cours sur un langage donné. Exemple : une introduction, un exercice, un exemple, un axiome, Fragment de contenu une démonstration mathématique… Fragment de structure Exemple : la structure générique de QCM ou de TP… générique Nous utilisons à la place du schéma Dublin Core (section 4.1), La qualification par les le schéma LOM spécifique aux ressources pédagogiques métadonnées (section 6.2). La qualification par les Nous préconisons l’utilisation de deux ontologies relatives ontologies respectivement au domaine enseigné et à la pédagogie.


Tableau 5
Application de la dimension de processus au e-learning
IMGIMGDimension dynamique	Application au e...IMGIMF
Dimension dynamique Application au e-learning Auteurs réutilisateurs Ce sont les auteurs de produits pédagogiques qui réutilisent des briques pédagogiques existantes dans leur activité de modélisation ou de production authoring by reuse. Selon les cas, les auteurs peuvent être ou non des enseignants. Auteurs experts Ce sont des auteurs très qualifiés (enseignants expérimentés) qui sont chargés du authoring for reuse. Lecteurs Ce sont les apprenants qui vont utiliser, dans le cadre de leurs activités d’apprentissage, les supports pédagogiques via une plate-forme de e-learning.

6.2. Qualification pédagogique par les métadonnées de LOM
Dans le domaine du e-learning, les travaux de normalisation les plus importants concernent les métadonnées pédagogiques. L’objectif de cette normalisation est de faciliter la réutilisation, la production des supports pédagogiques numériques étant difficile (Duval, 2001a). Nous substituons au schéma descriptif Dublin Core, décrit dans la section 4.1, le modèle LOM [6] (Learning Object Metada) pour qualifier les briques pédagogiques. Ce modèle est basé sur le travail initial du projet ARIADNE, qui avait proposé dès 1995 une recommandation pour les métadonnées pédagogiques (Duval et al., 2001b). Le modèle LOM offre un ensemble minimal de caractéristiques indispensables pour gérer les objets pédagogiques. Il considère qu’un objet pédagogique est « toute entité, sur un support numérique ou non (informatique), pouvant être utilisée pour l’apprentissage, l’enseignement ou la formation ». Le tableau 6 présente une synthèse des neuf catégories de descripteurs qui composent le modèle LOM.

Tableau 6
Les catégories de descripteur du modèle LOM
IMGIMGCatégorie	Rôle	La description généra...IMGIMF
Catégorie Rôle La description générale Caractéristiques générales : identifiant de l’objet, titre, description, langues, mots-clés, étendue de la ressource, type de structure, niveau de ganularité… Le cycle de révision Liste complète des modifications ou cycle de révision, historique et état courant de l’objet pédagogique… Les métadonnées Schéma ou spécification utilisés Les informations techniques Exigences techniques en termes de navigateur ou de système d’exploitation, type de données ou format, taille, localisation physique, installation et durée… La partie pédagogique Type (exercice, simulation, questionnaire), le niveau d’interactivité, à qui s’adresse la ressource, la tranche d’âge de la population cible… Type (exercice, simulation, questionnaire), le niveau d’interactivité, à qui s’adresse la ressource, la tranche d’âge de la population cible… Droits et éventuellement le coût L’aspect relationnel Relations ou liens avec d’autres objets pédagogiques en précisant le genre de relation (« …est requis par… », « …est une partie de … ») Les annotations Toute annotation ou commentaire d’ordre pédagogique La classification Localisation de la ressource dans un système de classification

 
7. Conclusion
 
 
La réutilisation en ingénierie de document, en général et en e-learning plus particulièrement, est un nouvel axe de recherche. Nous avons vu que l’état de l’art en la matière souffre essentiellement du manque de méthodologie. Nous avons défini dans cet article une approche méthodologique qui constitue le cadre formel et qui permet de définir la réutilisation en ingénierie de document et de l’aborder selon deux dimensions : statique et dynamique. La première est relative aux objets manipulés, et la seconde est relative aux activités et acteurs impliqués. Nous avons ensuite proposé deux modèles sous-jacents. Le premier, baptisé ASARD, prend en charge la représentation, sous forme d’annotations d’aide à la réutilisation, des connaissances de réutilisation. Le second, baptisé MCD et englobant le premier modèle, prend en charge la représentation en UML des composants de documents. Une application au e-learning est enfin réalisée, en vue d’illustrer cette nouvelle approche. Ce travail de recherche est une contribution à la définition future d’un environnement technique de réutilisation en ingénierie de document. Ce dernier sera composé essentiellement de deux modules. Le premier prendra en charge l’activité authoring for reuse et sera utilisé par les auteurs experts. Le second prendra en charge l’activité authoring by reuse et sera utilisé par les auteurs réutilisateurs. La réalisation d’un prototype de cet environnement permettra de valider l’approche méthodologique et les deux modèles 608 sous-jacents.
 
Remerciements
 
L’auteur remercie M.F. Barthet, Professeur à l’UT1, pour la direction de cette recherche, C. Vanoirbeek de l’EPFL pour son encouragement et M. Boughanem, Professeur à l’IRIT, pour ses précieux conseils.
 
BIBLIOGRAPHIE
 
·  Alaya N., Aide à la rédaction de documents structurés fondée sur la réutilisation des connaissances, Thèse de doctorat en informatique, Université de Nantes, 1996.
·  Amous I., Chrisment C., Sèdes F. « Etendre une approche méthodologique pour la réingénierie des sites web », Ingénierie des systèmes d’information, vol. 6, n° 3, 2001, p. 119-144.
·  Bellahcene Z., Baril X., « XML et les systèmes d’intégration de données », Ingénierie des systèmes d’information, vol. 6, n° 3, 2001, p. 11-32.
·  Biggerstaff T., Richter C., Reusability Framework, Assessment, and Directions, in Software Reusability, ACM Press, 1987.
·  Boulier D., « Les choix techniques sont des choix pédagogiques : les dimensions multiples d’une expérience de formation à distance », Sciences et techniques éducatives, n° 8, 2001, p. 275-32.
·  Chabert-Ranwez S., Composition automatique de documents hypermédia adaptatifs à partir d’ontologies et de requêtes intentionnelles de l’utilisateur, Thèse de doctorat en informatique, Université de Montpellier II, 2000.
·  Chikh A., Said T., « Annotations Structurées d’Aide à la Reconstruction de Documents, le modèle ASARD », Actes de la conférence internationale sur le document électronique CIDE’99, 5-7 juillet 1999, Paris, Editions Europia, p. 205-218.
·  Chikh A., « Vers une méthodologie de réutilisation de document », International Symposium On Programming System ISPS’01, 12-14 mai 2001, Alger, p. 303-308.
·  Chikh A., « Réutilisation de documents en génie logiciel - Le modèle de composant de document (MCD) », Actes de la conférence internationale sur le document électronique CIDE’02, 20-23 octobre 2002, Tunis, p. 17-35.
·  Chikh A., « Construction de cours par réutilisation de briques pédagogiques. Une DTD pour les composants pédagogiques », paraîtra dans les actes de la conférence internationale sur les technologies de l’information et des télécommunications SETIT’03, 17-21 mars 2003, Tunis.
·  Chrisment C., Sedes F., « XML et document multimédia », Conférence invitée dans Document Forum, 2 novembre 2000, Lyon.
·  Com, « Elearning – Penser l’éducation de demain », Communication de la commission des communautés européennes COM’2001, 28 mars 2001.
·  Coudert S., Le Gall P., « Cadre de spécifications hiérarchiques orienté vers la réutilisation », RSTI – Technique et Science Informatique, vol. 21, n° 1, 2002, p. 97-125.
·  Coulange B., Réutilisation du logiciel, Collection : Méthodes Informatiques et Pratique des Systèmes, Paris, Editions Masson, 1996.
·  Crampes M., Bayart L., Gelly A., Uny P., « Spécification et proposition d’une DTD pour la qualification de briques pédagogiques adaptatifs », Sciences et techniques éducatives, vol. 6, n° 2, 1999, p. 343-374.
·  Decouchant D., Quint V., Vatton I., « L’édition coopérative de documents avec Griffon. », Actes IHM’92, 30 novembre au 2 décembre 1992, Paris, p. 117-129.
·  Dessus P., « Aides informatisées à la production d’écrits – une revue de la littérature »Sciences et techniques éducatives, n° 8, 2001, p. 413-433.
·  Duval E., « Normalisation des techniques éducatives », Actes du cinquième colloque Hypermédias et Apprentissages, Avril 2001, Grenoble, p. 25-34.
·  Duval E. et al., « The ARIADNE Knowledge Pool System », Communications of the ACM, vol. 44, n° 5, 2001, p. 73-78. www. acm. org/ pubs/ citations/ journals/ cacm/ 2001-44-5/ p72-duval/
·  Ellis C.A., Gibbs S.J., and Rein G.L., « Groupware, some issues and experiences. » In Communications of the ACM, vol. 34, no. 1, 1991, p. 38-58.
·  Ezran M., Morisio M., Tully C., Réutilisation logicielle – Guide pratique et retours d’expériences, Paris, Editions Eyrolles, 1999.
·  Fugini M. G., Pernici B., Specification Reuse in Conceptual Modeling, Databases, Case, an integrated View of Informaion Systems Development, Editions Wiley, 1992.
·  Gruber T.R., « Toward principles for the design of ontologies used for knowledge sharing », International Workshop on Formal Ontology, Mars 1993.
·  Hodgson R., « The X-model: a process model for object-oriented software development », Actes de génie logiciel et ses applications, 1991, Toulouse.
·  Karsenty A., GroupDesign : un collecticiel synchrone pour l’édition partagée de documents, Thèse de doctorat en informatique, Université de Paris-Sud Orsay, 1994.
·  Khrouf K., Soulé-Dupuy C., Zurfluh G., « Exploitation d’une mémoire d’entreprise à partir d’entrepôts textuels », Ingénierie des systèmes d’information, vol. 6, n° 3, 2001, p. 87-117.
·  Lehtonen M., Petit R., Heinonen O., Lindén G., « A dynamic user interface for document assembly », New York, ACM Press, p. 134-141.
·  Levy D. « Document reuse and document systems », Electronic publishing, vol. 6, n° 4, 1993, p. 339-348.
·  Log, « Les paradigmes du génie logiciel » www. cours. polymtl. ca/ log2000/ rsp-02. pdf
·  Malvache P., Eichenbaum C., Prieur P., « La maîtrise du retour d’expérience avec la méthode REX », Performances Humaines & Techniques, n° 69, 1994, p. 6-13.
·  Maurice-Demourioux M., Une méthodologie d’aide à la conception de systèmes d’information fondée sur la réutilisation, Thèse de doctorat en informatique, Université de Paris-Dauphine, 1998.
·  Michard A., « XML langage et applications », Paris, Editions Eyrolles, 2001.
·  Michel C., Rouissi S., « Etude de l’organisation et caractérisation de l’information pédagogique pour construire des documents hypermédias adaptatifs diffusés sur le Web », Actes de la conférence internationale sur le document électronique CIDE’02, 20-23 Octobre 2002, Tunis, p. 153-167.
·  Mili H., Mili F., Mili A., « Reusing Software : Issues and Research Directions », IEEE Transcations on Software Engineering, vol. 21, n° 6, 1995.
·  Mühlhäuser M., Hauber R., Kopetzky T., « Typing concepts for the Web as a basis for reuse », http:// www. mel. dit. csiro. au/ vercous/ REUSE/ pos9/ index. html, 1999.
·  Nanard M., Nanard J., « MacWeb, un outil pour élaborer des documents », Actes duWorkshop on Object-Oriented Document Manipulation WOODMAN’89, Rennes, mai 1989, Edition Bigre, n° 63-64, p. 18-29.
·  Nanard M., Kahn P., « Pushing reuse in hypermedia design: Golden rules, design patterns and generic templates », Actes de la conférence ACM sur les hypertextes HTX’98, juin 1998, Pitsburg, Editions ACM.
·  Nkambou R., Modélisation des connaissances de la matière dans un système tutoriel intelligent, modèles, outils et applications, Thèse de doctorat en informatique, Université de Montréal, 1996.
·  Paradis F., Vercoustre A-M., Hills B., « Reuse of linked documents through virtual document prescriptions », In : EP98, Saint-Malo, 1-4 April 1998.
·  Paradis F., Vercoustre A-M., Hills B., « A Virtual Document Interpreter for Reuse of Information », In : EP98, Saint-Malo, 1-4 April 1998.
·  Perron L., « La réutilisation de cas : une problématique commune à l’intelligence artificielle et à l’ergonomie cognitive, mais des points de vue différents », Ingénierie des connaissances : évolutions récentes et nouveaux défis, Edition Eyrolles, 2000, p. 501-513.
·  Priestley M., « DITA XML: a reuse by reference architecture for technical documentation », Annual ACM conference on systems documentation, ACM Press, 2001, p. 152-156.
·  Quint V., « Edition de documents structurés », le traitement électronique du document, Paris, Editions ADBS, 1994, p. 11-48.
·  Quint V., « Les nouvelles technologies du Web », Technique et Science Informatique, vol. 19, n° 1-2-3, 2000, p. 423-430.
·  Rekik Y., Modélisation et manipulation des documents structurés : une approche modulaire, flexible et évolutive, Thèse de doctorat en informatique, EPFL, 2001.
·  Rekik Y., Vanoirbeek C., Falquet G., Nerima L., « Reusing dynamic document fragments through virtual documents: key issue in document engineering », Proceedings of the Workshop Documents Virtuels personnalisables in the 11th Francophone Conference on Human Machine Interaction IHM’99, November 1999, Montpellier.
·  Reynaud C., Tort F., « Diriger la réutilisation de composants à l’aide d’ontologies », Ingénierie des connaissances : évolutions récentes et nouveaux défis, Edition Eyrolles, 2000, p. 59-74.
·  Richez M-A., Propositions pour la conception et la mise en œuvre d’un système d’aide à l’élaboration et au partage de documents composites, Thèse de doctorat en informatique, INSA de Lyon, 1996.
·  Roy B., Méthodologie multicritère d’aide à la décision, Paris, Editions Economica, 1985.
·  Sedes F., Bases documentaires – Hyperbases : Proposition d’un modèle générique et contribution à la spécification d’un langage pour l’intégration et la manipulation d’informations semi-structurées, HDR, UPS Toulouse 3, 1998.
·  Semmak F., Réutilisation de composants de domaine dans la conception des systèmes d’information, Thèse de doctorat en informatique, Université de Paris I, 1998.
·  Vercoustre A-M., Paradis F., « A descriptive language for information object reuse through virtual documents », In : EP98, Saint-Malo, 1-4 April 1998.
·  Visser W., « Etudes en ergonomie cognitive sur la réutilisation en conception : quelles leçons pour le raisonnement à partir de cas », Revue d’intelligence artificielle, vol. 13, 1999, p. 129-154.
·  Voorhees E., « Using WordNet for text retrieval », Wordnet: an electronic lexical database language speech and communication, Cambridge, MIT Press, 1998, p. 285-303.
·  Wartik S., Prieto-Diaz R., « Criteria for comparing domain analysis approaches », International journal of software engineering and knowledge engineering, vol. 2, n° 3, 1992, p. 403-431.
·  Woelk D., Kim W., « Multimedia Information Management in an object-oriented Database System », Proc. of the 13th VLDB Conference, Brighton, 1987, p. 319-329.
 
NOTES
 
[1]Voir http:// www. w3. org/ TR/ REC-xml
[2]Voir http:// dublincore. org/
[3]gopher://marvel.loc.gov./00/.listarch/usmarc/1998
[4]Voir http:// www. w3. org/ TR/ DOM-Level-2
[5]Voir http:// www. w3. org/ TR/ rdf-schema
[6]Voir http:// ltsc. ieee. org
© Cairn 2007 Vie privée | Conditions d’utilisation | Conditions générales de vente
À propos | Éditeurs | Bibliothèques | Aide à la navigation |