Document numérique
Lavoisier

I.S.B.N.sans
180 pages

p. 99 à 114
doi: en cours

Veille sur la revue
Veille sur l'auteur
Vous consultez

Volume 6 2002/1-2

2002 Document numérique

Vers le concept de document sémantique

Eric Bataille IRIN – Institut de Recherche en Informatique de Nantes2, rue de la Houssinière, BP 92208, F-44322 Nantes cedex 03LIUM, Université du Maine, Institut d’Informatique Claude ChappeAve Olivier Messiaen, F-72085 Le Mans cedex 9 Mourad Oussalah IRIN – Institut de Recherche en Informatique de Nantes2, rue de la Houssinière, BP 92208, F-44322 Nantes cedex 03 Pierre Tchounikine LIUM, Université du Maine, Institut d’Informatique Claude ChappeAve Olivier Messiaen, F-72085 Le Mans cedex 9
L’avènement des nouvelles technologies de l’information et de la communication (NTIC) s’accompagne du passage sur support numérique de beaucoup de fonds documentaires. Ainsi, on assiste progressivement à la numérisation des documents de travail de toute nature : dossiers médicaux, dossiers pédagogiques, documentations techniques, etc. Mais comment s’assurer que ce changement de paradigme profite aux lecteurs et aux auteurs de documents ? A ce propos, nous nous intéressons à la modélisation et à l’exploitation de documents et de dossiers numériques en garantissant une valeur ajoutée à leur version numérique par rapport à leur homologue papier : valeur ajoutée pour le lecteur, qui doit disposer d’outils sémantiques pour naviguer plus efficacement vers ce qui l’intéresse en fonction de sa tâche de lecture ; valeur ajoutée pour l’auteur, qui doit pouvoir produire de nouvelles ressources par réutilisation de certaines déjà existantes et être assuré d’une gestion efficace de l’évolution de ses productions. Pour répondre à ces attentes, nous proposons une approche ontologique et orientée objet fondée sur le concept central de relation sémantique.Mots-clés : document numérique, dossier numérique, ontologie, approche orientée objet, relations sémantiques, structures de documents. The growing part of the New Technologies of Information and Communication (NTIC) comes along with the passage on numeric support of many documentary capitals. So, we attend gradually the digitalization of working documents of all kinds: medical files, educational files, technical documentations, etc. But how make sure that this change of paradigm benefits the readers and the authors of documents? On this matter, we are interested in the modeling and in the exploitation of documents and numeric files by guaranteeing an added value to their numeric version with regard to their paper homologue: added value for the reader, who has to have semantic tools to navigate more effectively towards what interests him according to his task of reading; added value for the author, who must be able to produce new resources by re-use of some already existing and be assured by an effective management of the evolution of its productions. To answer these expectations, we propose an ontological and object-oriented approach based on the semantic relation concept.Keywords : numeric document, numeric file, ontology, object-oriented approach, semantic relations, structures of documents.
 
1. Introduction
 
 
1.1. Problématique et motivations
Dans le domaine documentaire, le support papier, avec l’avènement du web et des nouvelles technologies de l’information et de la communication (NTIC), est aujourd’hui suppléé par le support numérique. Il est légitime de se pencher sur les possibilités qu’offre ce récent support pour la rédaction et la lecture de fonds documentaires. A ce propos, nous nous intéressons aux dossiers. Un dossier est un ensemble de documents hétérogènes, cohérents, accessibles à différents utilisateurs, et susceptibles d’évoluer dans le temps. Les documents d’un même dossier ont chacun un rôle particulier et figurent ensemble pour rendre compte d’un objectif global. Des relations implicites existent donc entre les documents d’un même dossier pour signifier le rôle que chacun d’eux joue : rôle vis-à-vis du but global du dossier et rôle vis-à-vis des autres documents du dossier. Nous nous intéressons à la modélisation de dossiers numériques incluant une description explicite de ces relations. Nous souhaitons faire de ces relations un moyen d’approcher la sémantique des documents constituant un dossier et permettre :
  • de rendre la consultation d’un dossier numérique plus confortable que celle de son homologue papier, en soutenant le lecteur pour qu’il accède, en fonction de sa tâche de lecture, aux informations pertinentes ;
  • de gérer l’évolution des documents constituant les dossiers, en rendant possible le versionnement des documents et le traitement automatique de ses répercussions ;
  • de favoriser la réutilisation des documents composants de dossiers, pour créer de nouveaux composants et de nouveaux dossiers.
1.2. Approche et méthodologie
Nous proposons un processus de modélisation et d’exploitation sémantiques de documents et de dossier numériques par l’usage de trois outils conceptuels :
  • l’approche ontologique, pour modéliser les documents des dossiers numériques en incluant une description de toutes les données s’y rapportant ;
  • les relations sémantiques, pour :
    • rendre explicite la sémantique des liens entre les documents des dossiers,
    • permettre le versionnement des documents,
    • produire de nouveaux documents composants de dossiers à partir d’autres déjà existants ;
  • le support orienté objet, pour :
    • permettre le versionnement des documents et la gestion de l’évolution des dossiers ;
    • abstraire et hiérarchiser les composants de modélisation, et ainsi faciliter leur réutilisation.
Dans cet article, nous présentons l’approche ontologique : en quoi elle consiste, des exemples d’ontologies normalisées pour décrire des documents, et en quoi l’approche nous intéresse dans nos travaux. Nous montrons ensuite les différents rôles que nous souhaitons accorder aux relations sémantiques, comment nous représentons et employons ce concept, puis nous présentons les différents acteurs qui participent à la conception et à l’exploitation de documents. Nous concluons en dressant un bilan positionnant notre travail vis-à-vis de ceux existants dans le domaine et mettant en évidence les perspectives de continuation.
 
2. Approche ontologique
 
 
2.1. Définition d’une ontologie
Le dictionnaire Larousse définit une ontologie comme « l’étude de l’être en tant qu’être, de l’être en soi ». En fonction des disciplines, cette définition est nuancée ou précisée. D’un point de vue informatique, beaucoup de définitions ont été proposées (Bourdeau et al., 1999 ; Fox et al., 1995 ; Gruber, 1992 ; Gruber, 1993) ; la plus souvent citée est sans doute celle de (Gruber, 1993), qui désigne une ontologie comme une spécification explicite d’une conceptualisation. Ainsi, l’approche ontologique, aujourd’hui couramment utilisée en ingénierie des connaissances, consiste à définir des notions et des relations utiles pour modéliser un domaine.
2.2. Exemples d’ontologies normalisées pour la description de documents
La donnée d’informations relatives aux documents est aujourd’hui d’actualité pour la recherche efficace de ressources sur un réseau comme l’internet. Il s’avère nécessaire d’employer un langage commun de description pour donner une meilleure portée d’utilisation aux documents décrits. Certaines ontologies, constituant des « métadonnées » c’est-à-dire des données sur les données, tendent déjà à devenir des standards ; parmi elles on peut citer le Dublin Core [1], constitué de quinze éléments de description de ressources quelconques en ligne, ou encore l’IEEE LOM [2], qui reprend quelques primitives de description proches de celle du Dublin Core mais qui est ciblé vers la description explicite de documents pédagogiques. La figure 1 présente succinctement les catégories de descripteurs qui composent la norme IEEE LOM.
Figure 1
Principales catégories de descripteurs de la norme IEEE LOM
IMGIMGPrincipales catégories de descripteurs de la norme...IMGIMF
2.3. Proposition pour mieux décrire la sémantique des documents
Nous utilisons l’approche ontologique pour définir l’ensemble des informations relatives aux documents prenant part dans les dossiers numériques : informations sur le type des documents, sur leurs auteurs, sur leurs conditions d’usage, sur l’intérêt de leur consultation, sur le contexte dans lequel ils peuvent être employés, sur la sémantique des rapports qu’ils entretiennent avec d’autres documents, etc.
Bien que les catégories de descripteurs que proposent les ontologies normalisées de documents semblent exhaustives, nous pensons qu’il est possible d’enrichir leur expressivité sémantique. Nous nous intéressons particulièrement à leur rubrique « Relation » : celle-ci permet de définir un rapport entre documents par l’intermédiaire de relations orientées comme « FaitPartieDe », « EstVersionDe », « EstFormatDe », « Référence », « EstBaséSur », « Nécessite », par exemple. Cependant, seuls les intitulés de ces relations apportent une sémantique sur le type de rapport déclaré entre des documents. Nous proposons de modéliser les documents d’un dossier d’un type particulier à l’aide de l’ontologie normalisée appropriée pour laquelle nous accordons une sémantique explicite aux relations que celle-ci met à disposition. Nous proposons également de nouvelles relations pour traduire le sens des rapports entre les documents d’un dossier dans des contextes particuliers, et ce en précisant la signification des relations proposées au sein de l’ontologie normalisée empruntée, ainsi que de nouvelles relations utiles pour versionner les documents et en produire de nouveaux par réutilisation de ceux existants.
 
3. Utilisation des relations sémantiques dans une ontologie de documents
 
 
3.1. Modèle générique d’une relation sémantique
L’approche que nous adoptons consiste à réifier le concept de relation sémantique : nous proposons un modèle générique de relation sémantique incluant son état et son comportement, exprimés en tant que propriétés. Il détermine un langage commun pour décrire n’importe quelle relation : celles proposées dans une ontologie normalisée de documents, des spécialisations de celles-ci, ou encore d’autres que les ontologies normalisées ne prévoient pas (par exemple des relations comme « relation d’héritage », « relation de réutilisation », etc.). Les primitives ontologiques du modèle que nous proposons sont les suivantes :
  • une relation sémantique est un ensemble de propriétés ;
  • une propriété est soit une propriété-attribut, soit une propriété-opération ;
  • une propriété-attribut est un couple <attribut, domaine de valeurs> ou une combinaison (à l’aide des opérateurs et, ou, non) de plusieurs propriétés-attributs ;
  • une propriété-opération est un couple <opération, traitement>.
Une propriété est l’essence même d’une relation sémantique. Les propriétés de type propriété-attribut décrivent l’état d’une relation sémantique. Nous identifions dans quelques travaux de référence sur les relations sémantiques (Chaffin et al., 1987 ; Oussalah et al., 1997 ; Storey, 1993) celles partagées par toutes les relations sémantiques. Elles concernent :
  • les attributs algébriques, qui définissent l’état interne d’une relation. Ils concernent des propriétés comme la réflexivité, la symétrie, l’antisymétrie ou la transitivité d’une relation, ainsi que les notions de relation d’ordre et de relation d’équivalence qui peuvent en être déduites ;
  • les attributs fonctionnels, qui définissent l’état d’une relation vis-à-vis des objets qu’elle met en jeu. Ils permettent ainsi de définir la cardinalité d’une relation, la notion d’ordre (qui n’a pas la même signification que la notion de relation d’ordre) à prendre en compte ou non pour les objets mis en jeu, ainsi que trois autres notions définies dans (Oussalah et al., 1997) :
    • exclusivité/partage : cette notion renseigne sur la faculté donnée à un objet mis en relation d’être impliqué ou non dans d’autres relations,
    • dépendance/indépendance : dans une relation « X relation Y », la notion de dépendance exprime que la destruction de X entraîne la destruction de Y,
    • prédominance/non-prédominance : par symétrie avec la notion précédente, la prédominance dans une relation « X relation Y » exprime que la destruction de Y entraîne la destruction de X ;
  • les attributs de liaison, qui décrivent la nature des objets mis en relation ;
  • les attributs de propagation, qui déterminent la façon dont une relation transmet les attributs d’un objet à son (ou ses) correspondant(s), dans un graphe d’objets et de relations (Rumbaugh, 1988). Dans une conception orientée objet, le mécanisme de propagation des attributs allège la définition des objets et la renforce en la dotant d’un dispositif d’inférence. Quatre paramètres entrent en jeu :
    • la nature de la propagation : la propagation peut concerner soit la valeur d’un attribut, soit, si celui-ci ne figure pas dans la description de l’objet récepteur, l’attribut en lui-même ainsi que sa valeur,
    • le sens de la propagation : la propagation d’un attribut peut se faire unilatéralement, auquel cas il est nécessaire de spécifier dans quel sens, ou bien bilatéralement,
    • le type de la propagation : la propagation des attributs peut être soit totale soit sélective, selon que tous les attributs ou seulement certains d’entre eux, spécifiés, soient diffusés,
    • la transitivité de la propagation : la propagation peut être définie comme transitive ou non, selon que l’on veuille ou non la faire se répercuter dans un réseau de relations.
A ces types de propriété-attribut couramment référencés nous ajoutons les attributs descriptifs, qui renseignent sur les possibilités qu’accorde ou non une relation sémantique pour agir sur l’état ou le comportement des entités qu’elle met en jeu. Parmi ces attributs figurent entre autres ajouter_propriétés, détruire_propriétés, renommer_propriétés, redéfinir_propriétés (ou masquer_ propriétés) ; ils sont valués par une expression booléenne.
Les propriétés de type propriété-opération décrivent le comportement d’une relation sémantique. Nous distinguons deux catégories d’opérations :
  • les opérations de gestion, qui permettent de créer, de détruire ou de modifier une relation ou une entité mise en tant qu’extrémité d’une relation ;
  • les opérations d’exploitation, qui permettent d’associer à certaines relations un comportement particulier visant à extraire des informations en rapport avec les objets qu’elles mettent directement en jeu dans un réseau d’objets et de relations. Ces opérations seront destinées à guider un lecteur pour rendre sa lecture plus efficace.
La figure 2 résume cette description des attributs en présentant notre modèle générique d’une relation sémantique.
Figure 2
Modèle générique d’une relation sémantique
IMGIMGModèle générique d’une relation sémantiqueIMGIMF
3.2. Catégorisation des relations sémantiques
Nous distinguons deux types de relations sémantiques pour mettre en évidence les deux rôles principaux que ce concept va jouer :
  • les relations sémantiques d’ordre logique et d’ordre hypermédia : elles sont destinées à définir la structure d’un document. Nous précisons ci-dessous ce que nous entendons par cette structure ;
  • les relations sémantiques de dérivations : elles sont destinées à engendrer un concept (document ou relation sémantique) à partir d’un autre déjà existant ; par exemple les relations de réutilisation, d’héritage, de point de vue, de versionnement, etc. Ces relations permettent de décrire d’une part un panel de composants de documents répondant à des besoins particuliers, et d’autre part de nouvelles relations sémantiques (par exemple, la relation sémantique de spécialisation peut s’appliquer sur la relation sémantique de réutilisation pour engendrer une nouvelle relation de réutilisation, ciblée vers un besoin particulier).
La figure 3 résume cette distinction des types de relations sémantiques.
Figure 3
Typologie des relations sémantiques
IMGIMGTypologie des relations sémantiquesIMGIMF
3.3. Les relations sémantiques vues sous différents niveaux d’abstraction
On propose d’examiner les relations sémantiques en fonction de leur généricité. Nous parlerons alors de relations sémantiques génériques et de relations sémantiques contextualisées. Une relation sémantique générique décrit les caractéristiques d’un rapport entre des entités indépendantes de tout domaine. Une relation sémantique contextualisée est une instance de relation sémantique générique. Elle hérite donc de tous les traits de sémantique de sa relation mère, mais sa sémantique est redéfinie pour rendre compte d’une signification particulière.
Nous nous intéressons à l’identification de relations sémantiques génériques permettant, par des spécialisations, de dériver des relations contextualisées appropriées à la description de documents et de la sémantique de leurs rapports.
3.4. Les relations sémantiques pour structurer les documents
Les relations sémantiques constituent un support pour définir les structures des documents. Si les travaux en ingénierie documentaire ont identifié au moins quatre dimensions pour un document numérique (Roisin, 1999), nous nous concentrons sur deux d’entre elles : la dimension logique et la dimension hypermédia. Ainsi, nous modélisons ces deux dimensions d’un document en définissant une structure de document comme un graphe mettant en jeu des composants documents reliés par des relations sémantiques contextualisées.
Les relations sémantiques contextualisées prenant part dans les structures sont celles proposées dans les ontologies normalisées de documents, ou bien ces relations ajustées dans leur sémantique, ou encore de nouvelles relations rendues disponibles en supplément de celles des ontologies normalisées. Toutes sont décrites d’une part par une relation générique mère qui leur est attribuée et d’autre part par un ensemble de propriétés énoncées dans le modèle de la figure 2. Ce faisant, nous catégorisons les relations par la relation générique mère à laquelle elles sont rattachées et nous décrivons la sémantique des relations avec une granularité plus fine que ce que proposent les ontologies normalisées.
3.5. Conventions adoptées
Nous définissons un document sémantique comme un document modélisé par une ontologie de documents pourvue d’un descripteur « Relation » proposant des relations sémantiques réifiées à l’aide du modèle de la figure 2.
On représente alors un dossier numérique comme un document sémantique de haut niveau (c’est-à-dire dont les composants sont eux-mêmes des documents sémantiques) où ressort une cohérence dans les descriptions de ses composants (cohérence dans les notions qui décrivent les composants, qui peuvent être, par exemple, communes ou complémentaires).
Par la suite, nous ramènerons donc la conception et l’exploitation des dossiers numériques à celle de tout document sémantique (que nous appellerons parfois plus simplement document).
 
4. Démarche pour la conception et l’exploitation de documents sémantiques
 
 
4.1. Présentation des acteurs
Nous considérons quatre classes d’acteurs prenant part à la conception de documents sémantiques : le constructeur de l’infrastructure (CI), le constructeur de l’ontologie de documents (COD), le constructeur des structures de documents (CSD), et le constructeur de documents (CD). Enfin, l’utilisateur de documents (UD) représente la classe d’acteurs qui exploitent les documents.
4.2. Rôle du CI
A l’aide du modèle générique de relation sémantique, le CI réifie des relations sémantiques génériques telles que celles présentées sur la figure 4. Ces relations génériques sont destinées à être déclarées comme relations mères des relations proposées dans les ontologies normalisées de description de documents. Elles permettent également de définir une sémantique de base à de nouvelles relations destinées à être ajoutées à celles proposées dans une ontologie normalisée.
Figure 4
Extrait des relations sémantiques génériques produites par le CI
IMGIMGExtrait des relations sémantiques génériques produ...IMGIMF
4.3. Rôle du COD
A partir d’une ontologie normalisée renforcée en expressivité au niveau de son descripteur « Relation », le COD conçoit des composants de documents, au sens de « briques élémentaires » de documents dans (Delestre, 2000). Par exemple, l’IEEE LOM propose les composants de documents de type Exercice, Simulation, Questionnaire, Diagramme, Figure, Graphique, Index, Table des matières, Examen, Auto-évaluation, etc. Le COD décrit donc des composants conformes à ces types et décrit explicitement des relations sémantiques contextualisées pouvant les lier. Pour cela, il décrit les relations proposées dans l’ontologie normalisée comme des instances de relations sémantiques génériques réifiées par le CI, et il ajuste leur sémantique à l’aide du modèle de la figure 2. Par exemple, la relation « EstBaséSur », proposée dans l’IEEE LOM, peut être définie comme une instance de la relation générique d’ordre logique « relation d’association » ; elle hérite donc de ses propriétés, et peut être ajustée dans sa sémantique en spécialisant certains attributs ou en décrivant des opérations spécifiques d’exploitation ou de gestion.
Le COD peut aussi ajouter des relations sémantiques contextualisées pour compléter l’ensemble des rapports qui peuvent être définis entre des composants documents. Les relations intéressantes à ajouter sont principalement celles qui permettent de faire évoluer les documents ou de favoriser leur réutilisation, c’est-à-dire les relations de dérivation. Ainsi, les relations comme « relation de versionnement » (parfois proposée, comme dans l’IEEE LOM, mais non réifiée), « relation d’héritage », « relation de spécialisation », « relation de réutilisation » s’avèrent intéressantes. Le modèle doit permettre de définir leurs comportements propres, notamment au travers des opérations de gestion : par exemple, pour la relation de versionnement, le modèle doit permettre de définir comment une entité mise en jeu peut être versionnée, quels sont les attributs la décrivant qui sont modifiés, quel type de propagation des attributs est instauré, etc.
4.4. Rôle du CSD
Le rôle du CSD consiste à produire des documents génériques, c’est-à-dire des documents dotés d’au moins une structure.
Pour associer une structure à un document générique, le CSD sélectionne des composants puis déclare des relations sémantiques contextualisées de dérivations et/ou d’ordre logique (respectivement d’ordre hypermédia) entre ces composants. Au niveau du CSD, les composants en question peuvent désigner :
  • des composants construits par le COD à partir des types proposés dans les ontologies normalisées ; par exemple, dans le contexte de documents pédagogiques, des exercices, des questionnaires, des figures, etc. ;
  • des documents génériques déjà existants, donc des graphes en eux-mêmes réutilisés à ce niveau et obtenus au départ par agencement de composants types produits par le COD ; par exemple, des exposés, des cours, des publications, etc.
Le CSD peut réitérer ce procédé de façon à définir pour chaque document générique un ensemble de structures.
Pour illustrer nos propos, considérons l’exemple suivant :
  • le CSD souhaite créer un document générique, nommé Cours Enseignement Pluridisciplinaire EP4, destiné à figurer un modèle de document de cours. Nous montrons sur la figure 6 une structure qu’il associe à ce document ;
  • le CSD définit son document générique à partir des composants Cours Maths M4, Cours Physique P4, tous deux proposés au préalable par le COD, et à partir de documents génériques déjà existants signalés sur la figure 6 comme étant des documents génériques par le fait que leurs identifiants sont soulignés ;
  • le CSD définit une structure à son document générique en déclarant des relations sémantiques contextualisées entre ces composants ;
  • le CSD peut ensuite réitérer ce procédé, en sélectionnant un nouvel ensemble de composants et en déclarant de nouvelles relations entre ceux-ci, définissant ainsi une nouvelle structure pour son document générique.
Le CSD n’assigne pas de structure particulière aux nœuds de ses structures correspondant à des documents génériques (nœuds aux identifiants soulignés sur la figure 5) : en cela, son document est polymorphe et est destiné à être instancié pour prendre ultérieurement une forme unique et bien définie. C’est l’acteur suivant, le CD, qui instanciera un document générique pour donner à l’instance obtenue une forme déterminée répondant à ses besoins.
Figure 5
Exemple de la représentation d’un document générique
IMGIMGExemple de la représentation d’un document génériq...IMGIMF
4.5. Rôle du CD
Le CD termine la phase de conception de documents en produisant des instances de documents à partir des documents génériques décrits par le CSD. Pour cela, sa tâche consiste à sélectionner un document générique, puis à fixer la structure de chacun des composants y figurant qui correspondent en eux-mêmes à des documents génériques. Il peut ensuite personnaliser son instance de document en déclarant de nouvelles relations sémantiques contextualisées entre les composants. La figure 6 présente une instance de document qui pourrait être obtenue à partir du document générique de la figure 5.
Figure 6
Exemple d’une instance de document issue d’un document générique
IMGIMGExemple d’une instance de document issue d’un docu...IMGIMF
Le CD décrit chacun des composants apparaissant dans les structures choisies, jusqu’à décrire les ressources physiques (texte, son, image, vidéo, etc.) qu’il apparie à ces composants pour définir son document unique. Son document est alors validé ; il peut en outre le visualiser sous des points de vue particuliers, obtenus en laissant apparaître seulement un certain type de relations sémantiques, afin de s’assurer de la cohérence de son document. Par exemple, pour un document à caractère pédagogique, le CD peut vérifier la cohérence pédagogique ou médiatique d’un parcours dans le document, ou encore examiner la complétude des éléments d’un cours par rapport à un programme complet d’enseignement.
Pour faire profiter au mieux le lecteur de son document, le CD peut définir des scénarios d’utilisation, c’est-à-dire des parcours qu’il préconise pour répondre à des tâches de lecture particulières en suivant tel ou tel type d’hyperliens, c’est-à-dire tel ou tel type de relation sémantique apparaissant dans les structures. Par exemple, ces tâches peuvent consister en :
  • une navigation efficace dans un hyperdocument selon une démarche pédagogique, avec appréhension successive et logique des différentes notions d’un cours ;
  • une navigation efficace dans un dossier médical, pour par exemple effectuer un rapide contrôle de l’état de santé d’un patient, ou un contrôle plus approfondi ;
  • une navigation efficace dans une documentation technique pour parer à une panne identifiée.
4.6. Rôle de l’UD
L’UD est l’acteur qui doit bénéficier des aspects sémantiques modélisés au sein des relations de la structure des documents. Son rôle consiste donc à interagir avec les documents et activer les opérations d’exploitation associées aux relations sémantiques. Celles-ci doivent lui permettre de formuler des requêtes pour accéder efficacement à des informations données ou pour vérifier certaines propriétés des documents. L’UD peut donc figurer un lecteur souhaitant être assisté dans sa navigation ou bien un rédacteur de documents cherchant des composants réutilisables appropriés à ses besoins ou s’assurant de la cohérence de ses productions. Les résultats des requêtes sont déterminés par le système qui exploite les structures des documents, d’une part en examinant les nœuds (composants de documents) et d’autre part en inférant des connaissances sur ces composants en fonction des propriétés accordées aux relations sémantiques qui les lient dans les structures. Parmi les types de requêtes ou de fonctionnalités possibles, citons :
  • la navigation dans un document ou dans un ensemble de documents en suivant un type donné de relation sémantique, pour que le lecteur se dirige efficacement vers ce qui l’intéresse : les parties se rapportant à une notion particulière, les parties liées à une autre selon un lien particulier, etc. ;
  • la mise à disposition de vues sur un document : vue logique, vue hypermédia, ou d’autres correspondant à un sous-ensemble de relations sémantiques parmi celles des structures du document ;
  • la recherche de documents conçus par réutilisation ou par spécialisation d’un autre, ou par composition d’autres ;
  • la recherche de documents conformes à un type de structure spécifié ;
  • la visualisation des liens et leurs significations entre plusieurs documents.
D’autres types d’opérations d’exploitation sont à envisager. L’UD peut également optimiser sa navigation en profitant des scénarios d’utilisation qui lui ont été préparés pour le soutenir dans la tâche de lecture qu’il s’est assignée.
 
5. Conclusion
 
 
Nous proposons un nouveau mode de conception de documents rendant explicite la sémantique des liens entre composants de documents. Fondé sur un modèle de relations sémantiques et sur une approche ontologique, il distingue différentes classes d’acteurs rédacteurs, permettant à chacun d’eux d’intervenir selon ses compétences et favorisant le partage et la réutilisation des notions constituant le contenu des documents. Il permet également d’associer des sémantiques variables à une même relation, ce qui se traduit par des hyperliens ayant un comportement différent menant à des informations précisément décrites. Il permet enfin de créer des scénarios d’utilisation pour optimiser la navigation des lecteurs en fonction des tâches qu’ils peuvent souhaiter accomplir en parcourant un document.
Tandis que certains travaux s’intéressent à d’autres aspects des documents électroniques, tels que leur dimension temporelle (Layaïda, 1997 ; Roisin, 1999 ; projet OPERA [3]) ou leur génération dynamique en fonction des souhaits du lecteur (Delestre, 2000), nous approchons pour notre part la sémantique des rapports entre documents ou entre composants de documents, thématique encore peu étudiée à notre connaissance si ce n’est pour le « web sémantique » (Broekstra et al., 2000). Cet aspect sémantique que le support numérique autorise à décrire contribue à justifier le passage d’un dossier de sa version papier vers sa version numérique.
Les perspectives de travail sont diverses ; elles concernent entre autres :
  • la mise en évidence d’opérations d’exploitation pertinentes pour le lecteur au sein du modèle de relations sémantiques ;
  • la mise en œuvre de l’architecture du processus de modélisation et d’exploitation de documents et l’implémentation d’un prototype avec les technologies RDF/XML ;
  • la mise à disposition d’un moyen de composer (au sens mathématique du terme) les relations sémantiques entre elles pour en dériver de nouvelles plus élaborées ;
  • la possibilité de s’inscrire dans le courant ADL (Garan et al., 1997), pour considérer un document comme un ensemble de composants aux caractéristiques déjà bien identifiées, voire pour proposer de nouvelles contributions.
 
BIBLIOGRAPHIE
 
·  Bourdeau J., Chen W., Hayashi Y., Ikeda M., Lai J., Mizoguchi R., Seta K., “An ontology, more than a shared vocabulary”, Workshop on Ontologies for intelligent Educational Systems, 9th International Conference on Artificial Intelligence in Education, AI-ED’99, Le Mans, France, July 19-23, 1999, www. ei. sanken. osaka-u. ac. jp/ aied99-onto. html
·  Broekstra J., Decker S., Erdmann M., Fensel D., Horrocks I., Klein M., Melnik S., Van Harmelen F., “The Semantic Web – on the respective Roles of XML and RDF”, IEEE Internet Computing, vol. 4 (5), Sept./Oct. 2000, p. 63-74, www. ontoknowledge. org/ oil/ downl/ IEEE00. pdf.
·  Chaffin R., Herrmann D., Winston M.E., “A taxonomy of Part-Whole relations”, Cognitive Science, 11:417-444, 1987.
·  Delestre N., 2000, Metadyne, un hypermédia adaptatif dynamique pour l’enseignement, Thèse de doctorat, INSA de Rouen. 2000.
·  Fox M. S., Grüninger M., “Methodology for the design and evaluation of ontologies”, Workshop on Basic Ontological Issues in Knowledge Sharing, IJCAI, Montréal Québec, Canada, 1995.
·  Garan D., Monroe R., Wile D., “ACME: An Architecture Description Interchange Language”, Proceedings of CASCON97, 1997, http:// www-2. cs. cmu. edu/ afs/ cs/ project/ able/ www/ paper_abstracts/ acme-esec97. html
·  Gruber T. R., “A translation Approach to portable ontology specification”, Knowledge Acquisition, vol. 5, n° 2, p. 199-220 (1993).
·  Gruber T. R., Ontolingua: A mechanism to support portable ontologies, Knowledge Systems Laboratory Technical Report KSL-91-66, Stanford University, version 3.0, CA (1992), http:// www-ksl. stanford. edu/ knowledge-sharing/ papers/ index. html#ontolingua-long
·  Layaïda N., Madeus : un système d’édition et de présentation de documents structurés multimédia, Thèse de doctorat, Université Joseph Fourier, juin 1997.
·  Oussalah M. et al., Ingénierie objet : concepts, techniques et méthodes, Intereditions, 1997.
·  Roisin C., Documents structurés multimédia, Habilitation à diriger des recherches, Institut National Polytechnique de Grenoble, septembre 1999.
·  Rumbaugh J., “Controlling propagation of operations using attributes on relations”, ACM OOPSLA’88 Proceedings, Special Issue of SIGPLAN Notices, p. 285-296. San Diego, CA, 1988.
·  Schreiber A.Th., Van Heijst G., Wielinga B.J., “Using explicit ontologies in KBS development”, International Journal of Human-Computer Studies, 45, p. 183-292, 1997.
·  Storey V.C., “Understanding semantic relationships”, VLDB Journal, 2, 455-488 (1993), Fred. J. Maryanski, Editor.
 
NOTES
 
[1]Voir http:// dublincore. org/
[2]Voir http:// www. ltsc. ieee. org/
[3]Bibliographie en ligne du projet OPERA, INRIA Rhône-Alpes, France : http:// www. inrialpes. fr/ pub_opera. html
© Cairn 2007 Vie privée | Conditions d’utilisation | Conditions générales de vente
À propos | Éditeurs | Bibliothèques | Aide à la navigation | Plan du site | Raccourcis
[1]
Voir http:// dublincore. org/ Suite de la note...
[2]
Voir http:// www. ltsc. ieee. org/ Suite de la note...
[3]
Bibliographie en ligne du projet OPERA, INRIA Rhône-Alpes, ...
[suite] Suite de la note...
Principales catégories de descripteurs de la norme IEEE LOM
Modèle générique d’une relation sémantique
Typologie des relations sémantiques
Extrait des relations sémantiques génériques produites par le CI
Exemple de la représentation d’un document générique
Exemple d’une instance de document issue d’un document générique