Construction incrémentale d’une ontologie par analyse du texte et de la structure des documents
François Role
Guillaume Rousse
BIOTIM est un projet dont l’objectif est de concevoir des méthodes génériques d’analyse automatique de masses de données regroupant textes et images pour acquérir une sur-couche sémantique commune et, à partir de ce premier résultat, développer des méthodes génériques d’interrogation plurimodale des données ainsi structurées. Dans le cadre de ce projet, nous présentons une expérimentation destinée à améliorer le processus d’acquisition de connaissances grâce à une exploitation simultanée de la structure et du contenu des documents. En particulier, nous montrons comment élaborer une ontologie intermédiaire dans le domaine de la flore tropicale (famille des orchidées) et comment cette ontologie intermédiaire peut contribuer à l’obtention d’une ontologie complète du domaine.Mots-clés :
structure logique, ontologie, OWL, traitement automatique du langage naturel, acquisition de connaissances, botanique.
BIOTIM is a project to design generic methods for the automatic analysis of large amounts of texts and images in order to acquire a common semantic layer and, building upon this initial result, to develop generic methods for a multi-modal examination of the structured data obtained. As part of this project we present an experiment aimed at improving the knowledge acquisition process by exploiting simultaneously both the structure and textual content of documents. In particular, we show how to build an intermediary ontology in the field of exotic flowers (orchidae family) and how this intermediary ontology represents an incremental step in in the building of a complete domain ontology.Keywords :
logical structure, ontologies, OWL, natural language processing, knowledge acquisition, botanics.
• Objectifs et motivations
• Présentation du projet BIOTIM
— Objectifs du projet
— Caractéristiques des corpus utilisés
— Premiers essais d’analyse du contenu textuel
• Vers un processus d’extraction incrémental et multisource
— Choix du formalisme cible
— Construction d’une hiérarchie de classes OWL à partir de la structure logique
— Coopération entre structure logique et traitements morpho-syntaxiques
— Coopération entre traitements syntaxiques et ressources conceptuelles
• Conclusion
• 5. Bibliographie