Document numérique
Lavoisier

I.S.B.N.2746220232
152 pages

p. 85 à 104
doi: en cours

Veille sur la revue
Veille sur l'auteur
Vous consultez

Volume 10 2007/2

Analyse multidimensionnelle de documents via des dimensions OLAP

Franck Ravat Olivier Teste Ronan Tournier
Avec l’émergence de formats de données semi-structurés (tels que XML), le stockage de documents dans un entrepôt centralisé est apparu de façon naturelle comme une adaptation des entrepôts de données. De nos jours, les systèmes OLAP (On-Line Analytical Processing) font face à une part grandissante de données non numériques. Cet article présente un environnement pour l’analyse multidimensionnelle de données textuelles dans un environnement OLAP. La structure, les métadonnées et le contenu des documents orientés texte sont transposés en sujets d’analyse (faits) et en axes d’analyse (dimensions) au sein d’un schéma en étoile modifié. Ceci permet de plus amples possibilités d’analyses multidimensionnelles. Cet environnement permet à un utilisateur d’avoir une vision détaillée au sein d’une collection de documents.Mots-clés : document numérique, XML, OLAP, entrepôt de données, entrepôt de documents, analyse multidimensionnelle. With the emergence of semi-structured data format (such as XML), the storage of documents in centralized facilities has slowly appeared as a natural adaptation of data warehousing technology. Nowadays, OLAP (On-Line Analytical Processing) systems face growing non-numeric data. This paper presents a framework for the multidimensional analysis of textual data in an OLAP sense. Document structure, document meta-data and document contents are converted into subjects of analysis (facts) and analysis axes (dimensions) within an adapted star schema. This allows greater multidimensional analysis possibilities. This framework allows a user to gain insight within a collection of documents.Keywords : digital document, XML, OLAP, data warehouse, document warehouse, multidimensional analysis.
• Introduction
— Contexte et problématique : entrepôts de données et de documents
— État de l’art
— Objectifs et contributions
• Modèle multidimensionnel conceptuel
— Définition formelle
— Différents types de mesures
— A données spéciales, dimensions spéciales
— Exemple
• Modèle logique
— Modèle logique multidimensionnel
— Exemple de données
• Analyse multidimensionnelle de données textuelles
— Agrégation de données textuelle
— Exemple d’analyse
• Conclusion
• 6. Bibliographie


© Cairn 2007 Vie privée | Conditions d’utilisation | Conditions générales de vente
À propos | Éditeurs | Bibliothèques | Aide à la navigation | Plan du site | Raccourcis