Document numérique
Lavoisier

I.S.B.N.sans
230 pages

p. 45 à 64
doi: en cours

Veille sur la revue
Veille sur l'auteur
Vous consultez

Volume 5 2001/3-4

2001 Document numérique

Expérimentation d’une approche coopérative et multipoint de vue de la construction et de l’exploitation de catalogues commerciaux « actifs »

Jean-Pierre Cahier Manuel Zacklad Laboratoire Technologie de la coopérationpour l’innovation et le changement organisationnel (Tech-CICO)Université de Technologie de Troyes (UTT)12, rue Marie Curie – BP 2060F-10010 Troyes cedex
Les approches du web Sémantique apparaissent prometteuses pour mieux maîtriser l’organisation de grands ensembles de documents numériques commerciaux. Nous proposons pour cela la notion de catalogue commercial « actif », construit et exploité à partir d’une multiplicité de points de vue. Notre hypothèse est que pour ce type de collection de documents électroniques, l’utilisation de structures en réseaux sémantiques, en s’appuyant sur des approches d’ingénierie des connaissances, donne de meilleurs résultats par rapport aux systèmes à classifications monopoint de vue.Mots-clés : documents commerciaux, catalogues multifournisseurs, coopération, ontologies, web sémantique, points de vue. Semantic web approachs could be useful to better organize big sets of numeric commercial documents. We propose for that purpose a solution of “active” catalogue, build and exploited using multiple viewpoints. We assume that, for this type of collection of electronic documents, semantic network structures built with the help of Knowledge Engineering approachs, lead to better results than the classification systems using only one point of view.Keywords : Business Documents, MarketPlace Catalogues, Cooperative Work, Ontologies, Semantic Web, Viewpoints.
 
1. Introduction
 
 
Les catalogues électroniques comparatifs sont un type de documents commerciaux électroniques que des fournisseurs parfois concurrents mettent à la disposition de leurs clients sur internet pour qu’ils achètent leurs produits. De même que de nombreux systèmes de place de marché sur internet, ces catalogues agrègent les documents commerciaux élémentaires dans des ensembles multifournisseurs, référençant au total jusqu’à des centaines de milliers de produits. Ils s’accompagnent d’un degré élevé de complexité dans les pratiques attenantes, aussi bien de la part des fournisseurs que de la part des acheteurs.
Pour les fournisseurs, les catalogues posent des problèmes de classement de leurs articles et de valorisation de leurs propriétés, au milieu de nombreux articles concurrents et dans des structures sémantiques prédéfinies souvent rigides. Pour les acheteurs, ces catalogues électroniques ne sont pas optimaux pour le repérage des produits et la comparaison de leurs caractéristiques. Parmi les multiples informations relatives au produit, telles qu’elles apparaissent de façon explicite ou implicite, structurée ou non structurée, dans les documents commerciaux descriptifs, on ne peut complètement prédire lesquelles vont constituer des critères de référencement ou de recherche déterminants pour ces différents acteurs.
Le document commercial gagne donc à être considéré et classé selon de multiples points de vue. Pour le catalogue que nous avons étudié en exemple dans le domaine de la vente de produits de formation continue, nous avons réalisé une ontologie multipoint de vues avec l’aide d’experts. Pour sa formalisation, nous nous sommes tournés vers les techniques du web sémantique [BER 98] qui offrent des technologies normalisées pour la représentation de structures informationnelles complexes sur internet. En particulier nous nous sommes appuyés dans notre expérimentation sur la norme Topic Map [ISO 01].
De plus, les places de marché virtuelles [NIE 00], [PEN 01] s’appuyant sur des catalogues multifournisseurs, se prêtent souvent mal à une administration centralisée des ontologies, d’autant plus que le document, comme le catalogue, sont pris dans des processus complexes de coopération. Les concepteurs de ces systèmes en ligne sont donc amenés à accorder une place croissante aux modalités collaboratives par lesquelles les fournisseurs peuvent jouer un rôle actif dans le référencement de leurs offres, contribuant à un cadre d’administration, plus décentralisé, de la sémantique du catalogue.
Pour étudier les processus de coopération entre fournisseurs, puis entre fournisseurs et clients, à travers une place de marché, nous avons défini le cadre conceptuel de la « place de marché à base de connaissances » (KBM, pour Knowledge-Based Marketplace) [CAH 02]. Dans cet article, nous proposons une première opérationalisation de certaines fonctionnalités d’une place de marché à base de connaissances à l’aide de la notion de « catalogue actif ». Elle nous permettra de commencer à définir des expérimentations de certaines modalités de coopération se déroulant à travers ce dispositif.
Le concept de document actif ou de collection active de document est issue de travaux dans les domaines de l’ingénierie de la connaissance, de la recherche d’informations, et de la gestion documentaire. Dans le domaine de la conception [BOY 01] utilise la notion document « actif » pour souligner le fait qu’ils sont enrichis de façon itérative et coopérative tout au long du cycle de développement d’un artefact. D’autres auteurs ont cherché à représenter et traiter des collections actives de documents basées sur des gabarits exploitant des relations sémantiques, collections pouvant par exemple, être automatiquement (activement) mises à jour en cas de mise à disposition d’une nouvelle version d’un document [KO 01].
Dans le prolongement de ces travaux, un catalogue commercial actif est à considérer avant tout comme portant des contenus d’information technico-commerciale lisibles et structurables selon de multiples points de vue, étant donc « actif » dans les deux sens du termes, collectivement mis à jour et diversement accessible selon la problématique de l’utilisateur. Ces multiples points de vue correspondent notamment aux divers rôles et activités, de repérage et de coopération que les acteurs concernés (fournisseurs, clients, concepteurs et administrateurs des catalogues numériques) déploient par rapport aux catalogues, dans le cadre des processus les mettant en relation.
L’hypothèse que nous souhaitons vérifier dans l’expérimentation à venir est que, pour une collection donnée de documents commerciaux multifournisseurs impliquant la confrontation d’ontologies différentes, l’utilisation de structures en réseaux sémantiques (basés dans notre cas sur l’approche XML Topic Map) i) donne de meilleurs résultats avec des catalogues « actifs », comparés aux systèmes à classifications « plates » ou aux organisations hiérarchiques établies d’un seul point de vue, et ii) que ces résultats sont encore améliorés lorsque la conception des structures sémantiques multipoints de vue s’appuie sur des attributs heuristiques élaborés dans une approche d’ingénierie des connaissances.
 
2. « Le catalogue actif » : un réseau sémantique pour une représentation multipoint de vue cohérente d’une collection de documents commerciaux
 
 
Le problème de la conception des catalogues multifournisseurs est tout d’abord marqué par l’évolution rapide de l’offre et de la demande dans le contexte des systèmes d’informations. Certaines applications « e-business » – catalogues dynamiques s’adaptant au profil de l’acheteur, places de marché présentant des offres concurrentes sur internet – impliquent une importante sophistication dans la présentation, la mise en œuvre et la gestion du contenu des collections de documents commerciaux ou technico-commerciaux. Chacun d’eux comporte des informations variées comme le nom de l’article, son prix, ses labels de qualité, sa photo, ses spécifications techniques ou ses délais de disponibilité. Composé dynamiquement, le document traduit en temps réel une description composite de l’article proposé à la vente. Il regroupe des informations, souvent distribuées physiquement sur internet et agrégeant plus ou moins dynamiquement des éléments issus de bases de textes, de bases de données et d’applications informatiques de gestion du back-office de chaque fournisseur (outils de gestion de la documentation produit, gestion de données techniques, progiciels de gestion intégré).
2.1. Du document au catalogue
Comme le montre la figure 1, il nous semble nécessaire de bien distinguer entre deux niveaux d’agrégation de l’information commerciale : d’une part le niveau du document commercial, correspondant à l’ensemble des informations et descriptions de contenu particulières à un article donné d’un fournisseur, et d’autre part le niveau du catalogue qui met l’accent sur la structure d’une collection de documents. A ce second niveau, le catalogue réalise suivant les cas l’agrégation des documents commerciaux d’un même fournisseur (catalogue monofournisseur) ou de plusieurs fournisseurs (catalogue multifournisseur, place de marché), sachant qu’un fournisseur a en général intérêt à participer à plusieurs places de marché.
Figure 1
Les différents niveaux d’agrégation de l’information commerciale et apport des standards d’annotation du web sémantique
IMGIMGLes différents niveaux d’agrégation de l’informati...IMGIMF
Suivant que l’on s’intéresse au niveau du document ou de la collection, on est amené à situer respectivement l’explicitation des ontologies entre deux pôles extrêmes, avec d’un côté les termes et concepts qui sont purement repérables à partir du documents lui-même, et de l’autre les concepts du domaine, formulables par exemple par un expert du domaine, et qui peuvent être complètement absents des documents. Cependant, il est clair qu’il existe entre les deux types d’ontologies des relations et une certaine complémentarité, notamment du point de vue méthodologique. Dans un catalogue « actif », une partie de la structure du domaine peut en effet être induite par l’expert en examinant un document unique selon de multiples points de vue, comme nous l’avons fait dans cette étude en utilisant une méthode de type « tri de cartes » (voir section 3).
En première analyse, les technologies du web sémantique utilisables semblent proposer des angles d’approche différents suivant que l’on s’intéresse aux documents considérés comme ressources – on mettra l’accent sur des métadonnées partie intégrantes du document comme avec RDF ou Dublin Core – ou aux catalogues, pour lesquels des représentations par Topic Maps présentent plusieurs avantages. Elles proposent notamment un mode de structuration des sujets abordés, qui est à la fois indépendant des ressources documentaires et moins contraignant pour la modélisation du réseau sémantique [CAU 02].
En effet, les Topic Maps constituent un standard de notation qui permet de définir des vues multiples et concurrentes d’un ensemble d’information. La nature structurelle de ces vues n’est pas contrainte : elles peuvent traduire une approche orientée objet, ou encore relationnelle, hiérarchique, ordonnée, non ordonnée, ou une quelconque combinaison de celles-ci. Les Topic Maps, qui disposent de plus d’une représentation XML, la spécification XTM [XTM 01] définie par le consortium indépendant Topic Maps.Org, semblent adaptées à nos objectifs comme nous le montrons dans [CAU 02].
2.2. Du multipoint de vue au multiexpert
Du point de vue de l’ingénierie des connaissances, et en particulier des travaux sur les ontologies (telles qu’elles sont définies dans [BAC 00] et [GUA 99]), les catalogues multifournisseurs relèvent d’une problématique à la fois multipoint de vue et multiexpert [CAH 02].
Dès qu’ils atteignent des volumes et des complexités importants, les catalogues monofournisseur sont souvent envisagés avec des représentations multipoints de vue, tout en continuant à relever d’une approche unifiée du point de vue terminologique (que l’on qualifierait en ingénierie de connaissances de « monoexpert », puisque le contexte monoentreprise procure en général une normalisation du vocabulaire, pour les noms d’article, leurs propriétés, etc.). Il n’en est pas de même des catalogues multifournisseurs et des places de marché, où chaque acteur aux côtés des autres a besoin de continuer à employer sa propre terminologie (ce qui conduit pour ces catalogues à une approche à la fois multipoint de vue et multiexpert). Etudiés sous l’angle de l’ingénierie des connaissances, les catalogues nécessitent une coconstruction par de très nombreux acteurs détenteurs d’expertises complémentaires.
La prise en compte combinée des problématiques multipoint de vue et multiexpert est une voie possible pour tenter de répondre au problème, crucial pour les coopérations considérées, de la diversité des ontologies dont les agents sont porteurs dans différents contextes. Le problème de la cohabitation d’ontologies concurrentes a par exemple été abordé en ingénierie des connaissances [FEN 00], [DIE 97], [CAS 00], [HUR 98], [EUZ 95], [RIB 99], ainsi qu’en travail coopératif assisté par ordinateur (TCAO ou CSCW) [SIM 00]. Ces travaux contribuent indirectement à éclairer une caractéristique centrale des catalogues multifournisseurs qui sont, par nécessité, des systèmes ouverts acceptant, voire visant une pluralité de dénominations des ressources et de leurs propriétés identifiantes ou qualifiantes.
2.3. Le point de vue syntaxique
Il est aussi intéressant de considérer les façons concrètes dont sont réalisés les catalogues multifournisseurs sur internet. Si l’on considère les architectures logicielles et les systèmes d’informations qui les supportent, de très nombreuses solutions sont mises en œuvre, pour constituer, composer automatiquement, agréger des solutions distribuées, maintenir et exploiter les catalogues mono ou multifournisseurs à partir des informations de base [DAN 01]. Ces dernières sont par exemple les données de spécifications techniques, de prix ou de délais, de disponibilité des articles, issues des bases de données de nomenclatures ou de progiciels de gestion intégrée (PGI ou ERP) des fournisseurs ou de leurs sous-traitants.
Dès ce niveau d’analyse, qui relève du point de vue syntaxique, en considérant la majorité des catalogues électroniques actuels, les documents commerciaux et les catalogues apparaissent pris dans des processus complexes. Ils sont construits de façon de plus en plus dynamique et résultent de collaborations diverses impliquant concepteurs et utilisateurs. Le standard XML s’est rapidement généralisé dans ce domaine, et les données issues des systèmes de gestion, de même que les photos et les textes, sont en général maintenus à la source, de façon à maintenir la cohérence, à éviter les tâches redondantes et à faciliter l’agrégation de descriptions dans le cas de catalogues multifournisseurs. Toutes ces informations sont prises dans un ensemble complexe de processus de gestion, supposant l’interopérabilité entre les systèmes d’informations de multiples départements et entreprises concernées par un produit donné.
Par exemple, dans une optique de diffusion « multicanaux » de l’information commerciale, les mêmes informations de base ou les mêmes documents commerciaux vont servir à constituer à la fois des catalogues papier s’adressant à des populations ciblées, des catalogues en ligne, des versions lisibles sur des téléphones ou des assistants portables, etc., en même temps qu’à travers des standards sectoriels plus ou moins développés (tels que RosettaNet), le fournisseur va participer aux catalogues multifournisseurs d’une ou plusieurs places de marché.
Dans le contexte de notre étude, nous ne nous intéressons que de façon secondaire à ces aspects syntaxiques et à la mise en œuvre des systèmes d’informations nécessaires à ce niveau, en préférant nous concentrer dans la suite sur les deux autres niveaux de sémiotisation des contenus sur le web [BAC 02] : le système sémantique et le système d’usages. Il nous semble nécessaire en effet de poser, de façon séparée par rapport au niveau syntaxique, la question du cadre dans lequel les informations commerciales prennent sens, par rapport aux acteurs, aux activités et aux coopérations qui mettent ces informations en jeu.
2.4. Le catalogue actif, support des activités collaboratives multifournissseurs
L’activité coopérative apparaît donc particulièrement importante dans les applications de catalogues multifournisseurs sur internet. Elle a en particulier pour résultat la coconstruction des catalogues, en réunissant les efforts de fournisseurs différents, par ailleurs concurrents, proposant des produits voisins qu’ils souhaitent valoriser et différencier dans un cadre d’intercompréhension commun. Une coopération s’engage, conduisant parfois à structurer la base de documents selon des organisations sémantiques sophistiquées, tentant de prendre en compte la variabilité ou les conflits entre les ontologies des différents fournisseurs.
Dans ce contexte, les technologies de web sémantique devraient faciliter la recherche et la comparaison par l’acheteur dans les catalogues multifournisseurs, ce qui est aujourd’hui un point crucial dans la réussite des systèmes de places de marché, dont les plus grands regroupent couramment des milliers de fournisseurs et des centaines de milliers d’articles.
De plus, les collections de documents commerciaux sont confrontées à l’apparition continuelle de nouveaux types de produits – avec en corollaire l’incomplétude chronique et l’obsolescence rapide des classifications permettant de se repérer dans les domaines concernés. En conséquence, dans les dispositifs multifournisseurs, une partie des processus collaboratifs entre offreurs vise l’évolution permanente et consensuelle des classifications liées aux articles.
En ce sens, les collections de documents commerciaux illustrent la notion de collections « actives » de documents proposée par In-Young Ko et al. [KO 01] qui s’appuie sur les travaux récents de John Sowa [SOW 00]. En effet, une collection de documents commerciaux, dont on doit distinguer les aspects « contenus » et les aspects « structure », est confrontée sur le versant structure à la nécessité d’enrichir et de modifier en permanence sa représentation sémantique d’ensemble, à la fois d’un point de vue diachronique et synchronique : d’une part parce que le domaine de métier d’un catalogue évolue, et d’autre part parce que toute modification d’un document par l’un des fournisseurs, ajoutant par exemple un nouvel article, une nouvelle propriété ou une nouvelle façon de les décrire ou de les utiliser, est susceptible de toucher la structure sémantique de l’ensemble, ce qui se traduit dans le réseau des classifications. Ainsi, le document commercial, accompagné des médiations humaines et informatiques nécessaires, devient un vecteur actif de l’évolution de la structure sémantique à multiples points de vue, que nous dénommons « catalogue commercial actif ».
2.5. Les documents actifs au service d’une implémentation du modèle KBM
Ces observations mettent en lumière les dimensions cognitives de la coopération autour des catalogues multifournisseurs qui ont commencé à être représenté dans le modèle de coopération « place de marché à base de connaissances » (KBM, pour Knowledge-Based Marketplace) [CAH 02]. Dans cette démarche, nous explorons en particulier les déterminants cognitifs de la construction et de l’exploitation, par les concepteurs et les utilisateurs, des documents commerciaux en ligne synthétisant la description des ressources proposées à l’échange. Les dispositifs de coopération prévus, s’appuyant sur le catalogue multifournisseur, présentent l’avantage de servir de support pour les dimensions relationnelles et épistémiques [ZAC 00] des interactions : en aidant l’utilisateur à comparer, à réunir des informations ou à consulter l’avis d’autres utilisateurs, le client peut, par exemple, évaluer l’influence de la crédibilité de son fournisseur (dimension relationnelle) ou l’influence des critères de description des articles (dimension épistémique).
Une KBM représente à la fois un modèle de coordination client-fournisseur, un espace partagé et la confrontation de multiples classifications permettant d’accéder au produit. C’est un espace de coopération favorisant l’harmonisation des représentations sémantiques des différents acteurs. Si un client veut transmettre un message, au(x) fournisseur(s) ou à ses pairs (« bouche à oreille », post-it…) concernant une recommandation ou un dysfonctionnement associés à une propriété d’un produit, il est important que le dispositif de structuration sémantique lui permette d’identifier à quel endroit il va coller le post-it en question, et permette aux autres intéressés de retrouver ce message.
Le catalogue commercial actif tel que défini plus haut permet d’opérationnaliser certaines facettes du modèle KMB que nous souhaitons étudier expérimentalement.
 
3. La problématique appliquée à un domaine
 
 
La constitution d’un catalogue commercial actif à des fins d’étude expérimentale du modèle KBM a été effectuée à partir d’un jeu d’essai réaliste. Cet exemple a été prélevé dans le domaine des places de marché de services, en s’inspirant d’une base réunissant l’offre concurrente de nombreux organismes de formations pour informaticiens. Ce dispositif est conçu pour étudier les activités de fournisseurs et de clients coopérant à travers le catalogue. Le montage de ce dispositif, qui s’inspire d’une base de donnée réelle, nous a aussi conduit à analyser certaines difficultés rencontrées par les utilisateurs et administrateurs, révélatrices de problèmes des fournisseurs et clients participant aux places de marché actuelles.
La source, pour le catalogue agrégé dont nous nous sommes inspirés, est très volumineuse : 600 mots-clés, 500 thèmes de formation, 1 500 organismes de toutes tailles, soit 18 000 modules de formation répertoriés, tous dans le domaine informatique. Il a donc été nécessaire de procéder à l’extraction/aménagement d’un jeu d’essai de taille plus manipulable. Dans la suite, les modélisations et expérimentations effectuées porteront sur un sous-ensemble d’une centaine de stages dans le domaine des formations à XML et à Java.
3.1. Le type de domaine considéré
Le domaine considéré présente un large spectre et une grande variabilité des produits d’un fournisseur à l’autre, ainsi qu’une grande évolutivité, puisqu’environ un tiers des thématiques de stages de formation, dans le domaine des compétences informatiques, se renouvelle chaque année. De plus, le profil de la collection de documents considérée est de celles qui rendent très difficile le développement d’une ontologie complète de toutes les connaissances nécessaires, par exemple tous les facteurs (thématiques de contenu et d’usage, critères économiques, pédagogiques, d’agenda, connaissances de sens commun…), que pourrait utiliser un acheteur pour prendre une décision.
Dans ce type de secteur commercial, il est donc hors de question de chercher à développer sur tous ces aspects une approche d’ontologie formelle visant l’exhaustivité et sur laquelle des mécanismes d’inférences largement automatisés seraient le moyen principal de recherche d’information. Alors que cette démarche peut sans doute être envisagée par certains pour d’autres domaines (tels que l’accès à la documentation de disciplines scientifiques ou médicales), nous sommes ici dans un domaine où le caractère particulièrement actif, ouvert et évolutif des collections de documents oblige à rechercher des solutions différentes, ne serait-ce que pour des raisons de coût de développement de la structure sémantique, qui doit évoluer fréquemment pour remplir efficacement son rôle auprès des utilisateurs.
3.2. Les coopérations concernant le catalogue
L’étude du domaine a fourni l’occasion d’inventorier les divers processus et coopérations à partir desquels les utilisateurs (fournisseurs et clients) étaient amenés à interagir avec le système sémantique du catalogue commercial actif. La figure 2 inventorie un certain nombre des formes concrètes que prend la collaboration, dans le cas du catalogue commercial actif de la KBM prise en exemple.
Figure 2
Exemples de coopérations et d’interactions cognitives portant sur le catalogue commercial actif de l’application KBM étudiée, dans le domaine de la formation
IMGIMGExemples de coopérations et d’interactions cogniti...IMGIMF
3.3. Les différentes façons d’utiliser l’information commerciale
L’exemple du catalogue commercial actif de formation étudié nous a aussi permis d’illustrer et d’envisager la comparaison expérimentale des différentes voies possibles pour utiliser l’information commerciale.
De multiples informations relatives au produit apparaissent de façon explicite ou implicite dans ces documents descriptifs sources, parmi lesquels on ne peut complètement prédire à l’avance lesquelles vont constituer des critères de référencement ou de recherche déterminants pour un utilisateur particulier. Par exemple (figure 3), une page de catalogue amène dans le texte des informations sur les prix, le calendrier, le contenu, le plan et la progression du stage, ainsi que des informations sur le type de métier ou de projet auxquels vont servir les compétences enseignées. De la sorte, le texte peut être, par exemple, regardé avec un point de vue de contenus thématiques (les matières enseignées, les niveaux prérequis ou atteints, par exemple « savoir programmer en Java »), ou de finalité métier du stage (« savoir développer un site web »), ou selon un point de vue très opérationnel lié à un outil précis (« développer en Java avec Jbuilder »), autant de points de vue qui sont en général mélangés dans les textes descriptifs.
Figure 3
L’exemple d’un document source
IMGIMGL’exemple d’un document sourceIMGIMF
Une page de catalogue peut aussi comporter sous forme d’icône ou de logo des indications de label (d’éditeur de logiciels, d’organisme certificateur) qui apportent une information sur la qualité, l’approche pédagogique ou la notoriété de l’organisme de formation. Ou encore, des schémas vont résumer la situation du stage dans un cursus plus complet, comme lorsque le stage suppose en prérequis une compétence ou l’antériorité d’un autre stage (sanctionnée éventuellement par un niveau certifié).
3.4. Attributs standard et attributs heuristiques
Dans la définition d’un produit nous effectuons une distinction entre des attributs standards et des attributs heuristiques. Les premiers correspondent à des propriétés triviales du produit (s’agissant d’un stage de formation : sa date, son libellé, sa durée, son prix…). Les seconds correspondent à des propriétés plus dépendantes des connaissances du domaine et qui peuvent avoir un caractère plus « subjectif » (un indicateur de notoriété, le but de la formation, les métiers auxquels elle destine les stagiaires, une appréciation de rapport qualité/prix…). A partir de valeurs similaires pour le même attribut on peut regrouper les produits dans différentes classes. Chaque point de vue est basé sur un attribut standard ou heuristique dont les valeurs permettent de constituer les classes.
A un premier stade, dans la pratique de beaucoup de catalogues multifournisseurs, les classifications triviales – effectuées sans analyse du domaine selon plusieurs points de vue – s’appuient sur des attributs standards et parfois sur certains attributs heuristiques mal maîtrisés du point de vue sémantique. Censés résumer les principales caractéristiques des outils, ces attributs ont été dégagés plus ou moins arbitrairement ou habilement par une opération d’analyse, effectuée en général à un moment donné par un gestionnaire du catalogue, ou un analyste informaticien. Cela pose des problèmes dans le cas d’applications, comme celle que nous traitons, où l’évolution et la variabilité du domaine et des critères sont importants.
La figure 4 (ci-dessous) donne quelques exemples de stages répertoriés dans notre application et d’une partie des attributs considérés pour les décrire après un traitement des catalogues. Une telle représentation se révèle bien adaptée pour les requêtes portant sur ces attributs, et par contre inadaptée si l’utilisateur se pose des questions qui n’ont pas été prévues au moment de la conception des attributs.
Figure 4
Quelques produits de la KBM exemple (sur le thème « Java »)
IMGIMGQuelques produits de la KBM exemple (sur le thème ...IMGIMF
Dans la pratique, une tâche courante sur le catalogue, comme l’identification d’un jeu de stages thématiquement convenable, se révèle en général très sensible à l’acheteur et au contexte, et rarement simpliste. Par exemple, ce n’est pas parce que l’acheteur cherche un stage « pour développer en Java pour des applications B to B », qu’il va mécaniquement n’évaluer que le stage de la liste qui se rapproche beaucoup de son besoin de par son libellé. Un catalogue actif doit par contre apporter des solutions à cette variabilité des requêtes et à leur sensibilité au contexte, en permettant de réellement restituer la richesse des documents sources en termes d’interrogation multipoint de vue.
3.5. Comment rechercher l’information ?
Dans le cas pris en exemple, si on considère l’information technico-commerciale dans le document source, une approche de recherche envisageable est celle des moteurs de recherche « plein texte », qui présente certains avantages pratiques mais qui a l’inconvénient, notamment du point de vue de la coopération, de correspondre à une approche d’ontologie non pensée, chaotique ou en explosion combinatoire.
Au contraire, le dégagement d’un tableau d’attributs, comme évoqué précédemment, correspond à une recherche selon un référentiel de classement unique imposé : il aboutit à un système de classement très incomplet ou arbitraire, résultat par exemple d’une approche pragmatique ou d’une expertise académique, ayant un rapport lointain avec la richesse sémantique du corpus d’origine et le contenu des requêtes réelles. La figure 5 illustre le cas d’un tel référentiel de classement imposé et monolithique, effectivement employé dans le cas d’un catalogue multifournisseur « non actif ». Par la force des choses, différents points de vue se trouvent mélangés et comme « aplatis » sur une seule dimension hiérarchique, les classifications thématiques se mélangeant par exemple aux vues par métier ou aux informations promotionnelles contingentes (catégorie « les incontournables »).
Figure 5
Cas d’un référentiel de classement imposé et monolithique dans le domaine exemple
IMGIMGCas d’un référentiel de classement imposé et monol...IMGIMF
Il est donc nécessaire d’envisager une classification basée sur de multiples index cherchant à répondre aux besoins des utilisateurs, de type Yahoo. Le problème avec ce multi-index est qu’en l’absence d’une méthodologie adaptée, le nombre de classes possibles est potentiellement en nombre infini (toutes les facettes qui permettent de voir l’objet). Ces systèmes sont souvent dans la pratique inadaptés au besoin de l’utilisateur et confinés d’un point de vue sémantique. Cela justifie de faire intervenir une démarche d’ingénierie des connaissances pour guider la conception de systèmes multi-index mieux adaptés.
3.6. L’approche par « ontologie experte » du domaine
L’approche suivie a été une approche par « ontologie experte », où des attributs heuristiques ont été dégagés avec un expert du domaine commercial étudié (figure 6). L’ontologie experte du domaine ainsi mise en évidence a servi de base à la structuration par points de vue multiples. Nous avons étudié l’activité et le cheminement d’un expert en position d’acheteur.
Figure 6
Exemple d’attributs heuristiques déterminés par l’expert dans l’étude du processus d’achat
IMGIMGExemple d’attributs heuristiques déterminés par l’...IMGIMF
La méthode d’acquisition des connaissances qui a été utilisée à cette étape a donc consisté à faire émerger les attributs heuristiques en travaillant avec l’expert confronté au catalogue, selon une méthode inspirée du « tri de carte ». Dans le contexte de cet article, l’un des auteurs connaissant le domaine a joué le rôle de l’expert.
Cette méthode a permis de mettre en évidence différentes classifications pertinentes pour un même concept de « stage » selon le point de vue que l’expert adopte ou recommande. Le catalogue a ainsi été analysé suivant un mode multipoint de vue et monoexpert. Le stage de formation participe à des vues différentes, suivant que l’on privilégie la thématique, le calendrier (dates et durée), le coût ou le facteur qualité/notoriété. Par exemple, s’intéressant au critère de la thématique, l’expert propose plusieurs façons d’accéder aux stages de la KBM, suivant des points de vue par notion (N) ou par but (B), pour lesquels il effectue à chaque fois un classement des instances d’un échantillon (figure 7).
Figure 7
Les classes des points de vue « par notions » et « par buts » selon l’expert classés à l’aide de la méthode du « tri de cartes »
IMGIMGLes classes des points de vue « par notions » et «...IMGIMF
 
4. Problématique des expériences préparées
 
 
En considérant l’information sur les produits telle qu’elle apparaît dans les documents commerciaux descriptifs ou dans des attributs censés résumer leurs caractéristiques sur une place de marché, nous avons donc passé en revue et analysé quelques lacunes des approches de recherche aujourd’hui utilisées : moteur « plein texte », référentiel de classement imposé et monolithique, formes de classification basées sur de multiples index avec ou sans intervention de méthode d’ingénierie de connaissances.
La classification selon de multiples perspectives concurrentes proposée par l’expert sert notamment à dériver une structure de navigation dans les produits. Mais il est nécessaire de vérifier si celle-ci apporte une amélioration de la recherche d’informations, et de quelle façon.
Plus précisément, l’hypothèse à vérifier est que, pour une collection donnée de documents commerciaux multifournisseurs, l’utilisation de structures en réseaux sémantiques donne de meilleurs résultats par rapport aux systèmes à classifications monopoint de vue, et que ces résultats sont encore améliorés lorsque la conception des structures sémantiques multipoints de vue s’appuie sur des approches d’ingénierie des connaissances, considérées au stade actuel de notre étude sous l’angle d’une monoexpertise (l’implantation dans le système « d’ontologies expertes »).
Pour vérifier cette double hypothèse, nous avons conçu trois catalogues numériques multifournisseurs dont deux catalogues commerciaux actifs. Ces sites ont le même contenu, mais présentent diverses formes de structuration sémantique. Pour cette expérimentation en laboratoire, l’approche consiste à mobiliser différents groupes d’étudiants en tant qu’utilisateurs du catalogue soumis à différentes consignes. Leur performance, nombre et pertinence des résultats, est mesurée pour les trois types de structuration sémantique expérimentées. Par exemple, une consigne données aux utilisateurs sur les différents sites peut exprimer une demande de la forme : « Pour un projet en technologies web, avec UML, Java, Java Beans, trouvez une formation au développement en Java, pour un programmeur qui connaît déjà bien la programmation objet mais pas du tout Java. »
Il s’agit de comparer, dans l’exécution de ces consignes, plusieurs approches :
  1. l’approche avec référentiel unique imposé évoquée précédemment ;
  2. des approches basées sur des catalogues actifs exploitant les différents points de vue de l’ontologie experte et offrant donc à l’utilisateur différentes modalités de navigation dans le réseau sémantique, notamment :
  3. organisation dominante du catalogue actif « par hiérarchies »,
  4. organisation dominante du catalogue actif « par associations ».
L’enjeu de la comparaison entre 1) et 2) est de valider en termes de nombre et de pertinence des articles sélectionnés la supériorité des approches par catalogue actif.
L’enjeu des comparaisons entre 2a) et 2b) est davantage qualitatif : étant donné un même réseau sémantique, intégrant de multiples points de vue, déterminer les meilleures structures de navigation en fonction du contexte d’usage. La mise en évidence des modalités de structuration d’un catalogue selon les problématiques et besoins de ses utilisateurs est essentielle pour sa conception. Elle peut notamment faciliter l’adaptation du catalogue aux changements de contexte ou d’utilisateur, en mettant en avant différents modes de navigation dans le réseau sémantique.
 
5. Nécessité d’un modèle de représentation de connaissances plus approfondi pour valider nos hypothèses
 
 
Ces considérations sur l’explicitation de la relation entre la structure du catalogue actif et le contexte d’usage nous ont incités à prendre le temps d’élaborer un modèle de représentation de connaissances qui soit adapté à ce problème. Ce cadre de modélisation des représentations doit permettre de décrire et rendre compte des rapports entre plusieurs organisations de concepts, notamment celles qui sont présumées chez le sujet confronté au catalogue, celles qui sont proposées dans le catalogue, ainsi que les formes intermédiaires apparaissant dynamiquement dans le scénario d’interaction.
L’objectif de rigueur scientifique de l’expérimentation préparée nous conduit également à cette démarche : la modélisation de certaine composantes de la représentation mentale supposée des participants est nécessaire si l’on veut effectivement tenter de prédire a priori la valeur ajoutée offerte par les diverses structures d’organisation sémantique et interpréter ensuite les écarts de l’expérience par rapport à la prévision.
Nous travaillons actuellement à une modélisation de la représentation des connaissances adaptée à ces problèmes, dans le cadre du web sémantique et particulièrement des Topic Maps. Cette approche devrait nous permettre de mieux maîtriser les interactions cognitives liées d’une part, aux consignes de recherche imposées aux participants à l’expérience, et d’autre part à leur navigation dans le catalogue à travers les structures sémantiques proposées. Ce modèle de représentation des connaissances devrait aussi permettre de mieux comprendre comment un participant à l’expérience est amené à établir des passerelles entre ses représentations sémantiques et celles du système, de façon à apparier sa propre représentation avec celle du catalogue. Dans un premier temps, ce modèle est esquissé, sur un cas très épuré et abstrait de collection de documents selon une organisation multipoint de vue, minimisant les risques de biais liés aux connaissances antérieures des sujets.
 
6. Conclusion
 
 
En attendant de pouvoir fournir une validation expérimentale de nos hypothèses par la comparaison des performances de recherche, la modélisation de notre domaine exemple nous a permis de mettre en évidence, d’un point de vue pragmatique, un certain bien-fondé de notre approche par catalogue actif.
Les attributs heuristiques qui la sous-tendent peuvent effectivement être dégagés à travers une approche d’ingénierie des connaissances, considérée au stade actuel de notre étude, sous l’angle d’une monoexpertise (l’implantation dans le système d’une ontologie experte). A ce stade, l’étude à en effet montré la possibilité de réalisation d’une telle approche. En termes de méthodologie, dans un catalogue « actif », la structure du domaine peut être induite et rendue explicite par l’expert en examinant les documents selon de multiples points de vue.
De nombreux points restent à approfondir. En particulier l’expérimentation qui est en cours de préparation devrait permettre de mieux maîtriser les principes de structuration sémantique de documents selon les problématiques et besoins des utilisateurs. Elles devraient permettre de valider la supériorité des catalogues actifs, tout en précisant sous quelles conditions et de quelles façon une approche d’ingénierie de connaissance peut être mise à profit pour conforter ce résultat.
Dans une phase ultérieure, nous souhaiterions intégrer une dimension de multiexpertise, plus adaptée avec les problèmes de confrontation d’ontologies qui nous sont apparus décisifs dans le cas des catalogues multifournisseurs. La détermination de la structuration optimale d’un catalogue dans un contexte donné est aussi la clé d’une meilleure performance de la coopération entre les acteurs concernés par les applications utilisant des catalogues en ligne : entre fournisseurs, entre clients, ou entre fournisseurs et clients, ainsi que les problématiques de gestion dynamique des classifications multipoints de vue quand le domaine ou les offres évoluent rapidement. D’une meilleure structuration des collections de documents, assurée par les catalogues actifs, peut résulter une meilleure intercompréhension entre les acteurs coopérant autour de ces catalogues.
 
BIBLIOGRAPHIE
 
·  [BAC 00] Bachimont B., « Engagement sémantique et engagement ontologique : conception et réalisation d’ontologies en ingénierie des connaissances ». In J. Charlet, M. Zacklad, G. Kassel et D. Bourigault, éditeurs, Ingénierie des connaissances : évolutions récentes et nouveaux défis. Eyrolles, Paris, 2000.
·  [BAC 02] Bachimont B., « Normes et langages documentaires et informatiques », Actes Séminaire Phiteco-Costech, Université de Technologie de Compiègne, 22 janvier 2002.
·  [BER 98] Berners-Lee T., Semantic Web Roadmap. World Wide Web Consortium (W3C), 1998 http ://w3.org/DesignIssues/Semantic.html
·  [BOY 01] « Contextualisation des connaissances et gestion de documents actifs de conception », chap. 4, p. 71-90, in [ZAC 01].
·  [CAH 02] Cahier J.-P., Zacklad M, « Approche cognitive de la co-construction d’un catalogue multipoint de vue et multiexperts », Actes de la Conférence Extraction et Gestion des Connaissances EGC 2002, Montpellier du 21 au 23 janvier 2002, p. 221-226, Hermes.
·  [CAU 02] Caussanel J, Cahier J.-P., Zacklad M., Charlet J., Les Topic Maps sont-ils un bon candidat pour l’ingénierie du Web sémantique ?, Conférence Ingénierie des Connaissances IC2002, Rouen Mai 2002.
·  [CAS 00] Castelfranchi C., Conflicts Ontology, Computational Conflicts : conflict modelling for distributed intelligent system, Muller H.J., Dieng R., Springer, (2000).
·  [DAN 01] Gestion de catalogues web : « L’avenir du B-to-B est chez le fournisseur », interview de Sherif Danish (société Saqqara), par Jean-Pierre Cahier, in Le Monde informatique, n° 900, 15 juin 2001, p. 32-33.
·  [DIE 97] Dieng R., Comparison of Conceptual Graphs for Modelling Knowledge of Multiple Experts : Application to Traffic Accident Analysis, Rapport de recherche INRIA n° 3161, avril 1997.
·  [EUZ 95] Euzenat J., “Building consensual knowledge bases : context and architecture”, in Nicolaas Mars (éd.), Actes 2nd international conference on building and sharing very large-scale knowledge bases, Enschede (NL), (10-13 avril) 1995) IOS press, Amsterdam (NL), p. 143-155, 1995 ftp ://ftp.inrialpes.fr/pub/sherpa/publications/euzenat95a.ps.gz
·  [FEN 00] Fensel D. “Ontologies : a Silver Bullet for Knowledge management and Electronic Commerce”, ed. Springer, 2000.
·  [GUA 99] Guarino N., “Semantic matching : formal ontological distinctions for information organization, extraction and integration”. In M.T. Pazienza, éditeur, Summer School on Information extraction, Frascati, Italy, 1999, Springer Verlag.
·  [HUR 98] Hurwitz S.M., Interoperable Infrastructures for Distributed Electronic Commerce, http :// www. ontology. org/ main/ papers/ csc-ont-eng. html
·  [ISO 01] International Organization for Standardization, ISO/IEC 13250, Information Technology-SGML Applications-Topic Maps, Geneva : ISO, 1999.
·  [KO 01] Ko I.-Y., Neches R., Yao K.-T., “Semantically-Based Active Document Collection Templates for Web Information Management Systems”, Linköping Electronic Articles in Computer and Information Science, ISSN 1401-9841, Vol. 6, 2001, n° 008, http :// www. ep. liu. se/ ea/ cis/ 2001/ 008/
·  [NIE 00], Nieuwbourg P., D’Hondt H., Places de marché sur Internet, nouvelles règles pour le commerce du XXIe siècle, Editions BNTP, ISBN 2-9515654-0-2.
·  [PEN 01] Pensel J.-L., « Les places de marché virtuelles, l’accès à de nouveaux outils transactionnels », Actes du 6ème colloque de l’AIM, p. 97-110, Nantes, 7 au 9 juin 2001.
·  [RIB 99] Ribière M., Représentation et gestion de multiples points de vue dans le formalisme des graphes conceptuels, Thèse de Doctorat de l’Université de Nice – Sophia Antipolis, Paris, avril 1999.
·  [SIM 00] Simone C., Unifying or reconciling when constructing Organisational Memory ? Some Open Issue, extended version of ECAI 2000 Workshop on KM/OM.
·  [SOW 00] Sowa J.F., Knowledge Representation : Logical, Philosophical, and Computational Foundations, Brooks Cole Publishing Co., Pacific Grove, Ca, 2000.
·  [XTM 01] XML Topic Maps (XTM) 1.0, TopicMaps.Org Specification, 2001. http :// www. topicmaps. org/ xtm/ 1. 0
·  [ZAC 00] Zacklad M., « La Théorie des transactions intellectuelles, une approche gestionnaire et cognitive pour le traitement du COS », Intellectica, vol. 30, n° 1, 2000, p. 195-222.
·  [ZAC 01] Zacklad M., Grundstein M. & al, Management des Connaissances, Modèles d’entreprise et applications, Editions Hermes Science, 2001.
© Cairn 2007 Vie privée | Conditions d’utilisation | Conditions générales de vente
À propos | Éditeurs | Bibliothèques | Aide à la navigation | Plan du site | Raccourcis
Les différents niveaux d’agrégation de l’information commerciale et apport des standards d’annotati...
[suite]
Exemples de coopérations et d’interactions cognitives portant sur le catalogue commercial actif de ...
[suite]
L’exemple d’un document source
Quelques produits de la KBM exemple (sur le thème « Java »)
Cas d’un référentiel de classement imposé et monolithique dans le domaine exemple
Exemple d’attributs heuristiques déterminés par l’expert dans l’étude du processus d’achat
Les classes des points de vue « par notions » et « par buts » selon l’expert classés à l’aide de la...
[suite]