Accueil Revues Revue Numéro Résumé

I2D – Information, données & documents

2016/2 (Volume 53)


ALERTES EMAIL - REVUE I2D – Information, données & documents

Votre alerte a bien été prise en compte.

Vous recevrez un email à chaque nouvelle parution d'un numéro de cette revue.

Fermer

Article précédent Pages 70 - 79 Article suivant

Résumé

Français

[étude] L’usage du traitement automatique des langues pour la classification et l’annotation documentaire reste aujourd’hui un rêve plus qu’une réalité. Pourtant, plus que jamais, les organisations font face à de grandes difficultés dans la gestion de leurs documents. Les vocabulaires contrôlés permettent certes d’organiser les contenus, mais toutes les organisations ne disposent pas de ressources suffisantes pour en implémenter. Au travers d’une étude de cas dans le secteur pharmaceutique, les auteurs de cet article, Raphaël HUBAIN, Seth van HOOLAND et Ruben VERBORGH, démontrent comment un établissement de taille réduite peut concevoir un vocabulaire contrôlé et indexer sémantiquement ses contenus et ce, sans dépendance vis-à-vis d’un fournisseur de logiciel grâce à des outils open source. Les données d’évaluation sont mises à disposition afin d’appliquer la méthodologie à d’autres domaines d’application.

English

Automatic classification, dream or reality? A critical analysis of how text mining is used to design controlled vocabularies Using automatic language processing for classifying and annotating is today still more a dream than reality. Nevertheless, more than ever, organizations have to deal with the great difficulty of document management. Controlled vocabularies may help with organizing content, but not all organizations have sufficient resources to implement these. In a case study in the pharmaceutical sector, our authors Raphaël Hubain, Seth van Hooland and Ruben Verborgh, show how a relatively small company can design a controlled vocabulary and semantically index its contents. With open source tools, there is little need to depend on a software provider. Assessment data are available for applying the methodology to other sectors of activity.

Español

Clasificación automatizada: ¿sueño o realidad? Análisis crítico del uso del «text mining» para la concepción de vocabularios controlados El uso del tratamiento automático de las lenguas para la clasificación y la anotación documental aún es un sueño hoy en día más que una realidad. Sin embargo, más que nunca, las organizaciones se enfrentan a grandes dificultades en la gestión de sus documentos. Los vocabularios controlados permiten la organización de los contenidos, pero todas las organizaciones no disponen de los recursos suficientes para implementarlos. A través de un estudio del sector farmacéutico, los autores de este artículo, Raphaël Hubain, Seth van Hooland y Ruben Verborgh, demuestran cómo una institución pequeña puede concebir un vocabulario controlado e indexar semánticamente sus contenidos y sin depender de un proveedor de software gracias a herramientas «open source». Los datos de evaluación se hacen accesibles para aplicar la metodología a otros ámbitos de aplicación.

Deutsch

Automatische Klassifizierung: Traum oder Wirklichkeit? Eine kritische Analyse des Text Mining zur Erstellung von kontrollierten Vokabularen Die Nutzung der automatischen Verarbeitung der Sprachen zur Klassifikation und dokumentarischen Annotation ist heute noch ein Traum, der grösser als die Wirklichkeit ist. Und doch haben Unternehmen mehr als je zuvor Probleme, ihre Dokumente zu managen. Kontrollierte Vokabulare ermöglichen es zwar, Inhalte zu organisieren, doch nicht alle Organisationen verfügen über die Ressourcen, sie einzuführen. Anhand einer Fallstudie im Bereich der Pharmazie zeigen die Zautoen dieses Aufsatzes, wie ein nicht sehr grosses Unternehmen ein kontrolliertes Vokabular erstellen und seine Inhalte semantisch indexierten kann, und das Dank Open-Source-Tools ohne Abhängigkeit von einem Softwareanbieter. Die Autoren stellen die Evaluierungskriterien zur Verfügung, um die Methodologie auch auf andere Bereich anzuwenden.

Plan de l'article

  1. 1 - Question de recherche
    1. Méthodologie
    2. Structure
  2. 2 - État de l’art
    1. Gestion documentaire des organisations
    2. Paradigme et limites de la recherche full text
    3. L’alternative des vocabulaires contrôlés
      1. Arbitrage coûts-bénéfices
      2. Souffle nouveau venu du Linked data
    4. Le text mining et son utilisation dans le domaine documentaire
      1. Construction de taxonomie : extraction des termes et relations
      2. Analyse documentaire : annotation sémantique de documents
  3. 3 - Étude de cas dans l’industrie biopharmaceutique
    1. Contexte
    2. Méthodologie
      1. Phase préparatoire
      2. Phase d’extraction terminologique
      3. Phase de structuration des termes
    3. Évaluation des résultats
  4. 4 - Conclusions

© 2010-2014 Cairn.info
back to top
Feedback