Document numérique
Lavoisier

I.S.B.N.sans
108 pages

p. 43 à 60
doi: en cours

Veille sur la revue
Veille sur l'auteur
Vous consultez

Volume 9 2006/1

Calcul de pertinence basée sur la proximité pour la recherche d’information

Annabelle Mercier Michel Beigbeder
Le domaine de la recherche d’information, bien connu à travers les moteurs de recherche sur le web, utilise différents modèles comme le modèle booléen, le modèle vectoriel et la recherche de passage. D’autres approches prenant en compte la proximité des termes de la requête retrouvés dans les documents ont aussi prouvé leur efficacité. Dans ce contexte, nous posons l’hypothèse suivante : plus les termes de la requête se retrouvent proches (et ceci le plus grand nombre de fois) dans un document alors plus ce document doit être positionné en tête de la liste des réponses retournée par le système de recherche d’information. Tout d’abord, nous rappelons les diverses approches liées à notre recherche, ensuite nous proposons une méthode de calcul de pertinence basée sur la proximité floue – en chaque endroit du texte d’un document nous attribuons un degré de proximité floue à la requête – puis, nous montrons que notre méthode peut simuler le comportement des méthodes classiques. Avant de conclure, nous présentons les résultats des expériences ménées sur la collection CLEF 2004.Mots-clés : logique floue, proximité des termes, recherche d’information. Based on the idea that the closer the query terms are in a document, the more relevant this document is, we propose an information retrieval method based on a fuzzy proximity degree of term occurrences to compute document relevance to a query. Our model is able to deal with Boolean queries, but contrary to the traditional extensions of the basic Boolean information retrieval model, it does not explicitly use a proximity operator. A single parameter allows to control the proximity degree required. We demonstrate that our model can reproduce the behaviour of the classical coordination level, vector and boolean models. Then, before conclusion, we report some experiments on the CLEF 2004 test collection for french and we present the results.Keywords : fuzzy information retrieval, term proximity.
• Introduction
• Etat de l’art
• Pertinence basée sur la proximité
— Zone d’influence d’une occurrence de terme
— Proximité floue aux occurrences d’un terme
— Proximité floue à une requête
— Attribution du score
• Intégration des modèles classiques
— Niveau de coordination et modèle vectoriel
— Modèle booléen
• Expérimentations
— Outils et collection de test utilisés
— Construction des requêtes
— Construction des listes de réponses
— Résultats
• Conclusion
• 7. Bibliographie


© Cairn 2007 Vie privée | Conditions d’utilisation | Conditions générales de vente
À propos | Éditeurs | Bibliothèques | Aide à la navigation | Plan du site | Raccourcis