Analyse multidimensionnelle de documents via des dimensions OLAP
Franck Ravat
Olivier Teste
Ronan Tournier
Avec l’émergence de formats de données semi-structurés (tels que XML), le stockage de documents dans un entrepôt centralisé est apparu de façon naturelle comme une adaptation des entrepôts de données. De nos jours, les systèmes OLAP (On-Line Analytical Processing) font face à une part grandissante de données non numériques. Cet article présente un environnement pour l’analyse multidimensionnelle de données textuelles dans un environnement OLAP. La structure, les métadonnées et le contenu des documents orientés texte sont transposés en sujets d’analyse (faits) et en axes d’analyse (dimensions) au sein d’un schéma en étoile modifié. Ceci permet de plus amples possibilités d’analyses multidimensionnelles. Cet environnement permet à un utilisateur d’avoir une vision détaillée au sein d’une collection de documents.Mots-clés :
document numérique, XML, OLAP, entrepôt de données, entrepôt de documents, analyse multidimensionnelle.
With the emergence of semi-structured data format (such as XML), the storage of documents in centralized facilities has slowly appeared as a natural adaptation of data warehousing technology. Nowadays, OLAP (On-Line Analytical Processing) systems face growing non-numeric data. This paper presents a framework for the multidimensional analysis of textual data in an OLAP sense. Document structure, document meta-data and document contents are converted into subjects of analysis (facts) and analysis axes (dimensions) within an adapted star schema. This allows greater multidimensional analysis possibilities. This framework allows a user to gain insight within a collection of documents.Keywords :
digital document, XML, OLAP, data warehouse, document warehouse, multidimensional analysis.
• Introduction
— Contexte et problématique : entrepôts de données et de documents
— État de l’art
— Objectifs et contributions
• Modèle multidimensionnel conceptuel
— Définition formelle
— Différents types de mesures
— A données spéciales, dimensions spéciales
— Exemple
• Modèle logique
— Modèle logique multidimensionnel
— Exemple de données
• Analyse multidimensionnelle de données textuelles
— Agrégation de données textuelle
— Exemple d’analyse
• Conclusion
• 6. Bibliographie