Accueil Revues Revue Numéro Article

Documentaliste-Sciences de l'Information

2003/1 (Vol. 40)

  • Pages : 60
  • DOI : 10.3917/docsi.401.0029
  • Éditeur : A.D.B.S.

ALERTES EMAIL - REVUE Documentaliste-Sciences de l'Information

Votre alerte a bien été prise en compte.

Vous recevrez un email à chaque nouvelle parution d'un numéro de cette revue.

Fermer

Article précédent Pages 29 - 32 Article suivant
1

LES SYSTEMES ASSURANT UNE VEILLE efficace sur le web et les autres composantes d’Internet viennent s’ajouter à la panoplie déjà bien fournie des veilleurs. Beaucoup d’entre eux ont testé des solutions et des outils simples et peu onéreux. Parallèlement, des sociétés proposent, dans d’autres gammes de prix, des solutions beaucoup plus élaborées pour à la fois rechercher des informations sur Internet et les traiter. L’offre s’étoffe et se complexifie sans qu’aucun système, cependant, n’ait encore fait de percée fulgurante.

2

Quinze mois après la première journée organisée sur ce thème par SCIP France, cette manifestation a permis de découvrir les nouveautés dans ce domaine mais aussi d’entendre les points de vue d’usagers et de consultants spécialisés qui ont comparé les différents outils.

Les fonctionnalités

3

Un panorama des grandes fonctionnalités à mettre en œuvre dans une démarche de veille automatisée, présenté par Sylvie Dalbin et Armelle Thomas, a permis d’identifier les technologies les plus fréquemment offertes par les éditeurs de ces outils et qui ont toutes en commun un objectif qualitatif :

  • analyse de données et exploitation statistique, pour mettre en relief des liens entre des mots, des séquences ou des documents ;

  • traitements linguistiques et sémantiques, qui permettent d’enrichir les représentations des textes et des requêtes ;

  • reconnaissance des formes et réseaux de neurones ;

  • classification automatique, pour organiser et mettre en valeur des contenus ;

  • schématisation et cartographie pour une représentation visuelle et synthétique de l’information ;

  • modélisation des problématiques du décideur pour l’aider dans sa décision, une préoccupation plus récente.

Les évolutions

4

De quelles évolutions majeures, d’un point de vue « techniciste » puis sur le plan des usages, les outils de veille ont-ils bénéficié ces dernières années ?

5

Sur le plan technique d’abord, les efforts se sont particulièrement portés sur un certain nombre de fonctions. La classification automatique (clusterisation), séduisante au premier abord mais qui n’est cependant pas une solution miracle. Le monitoring/tracking (logiciels permettant de cerner le profil du visiteur d’un site), un marché en pleine expansion mais encore immature, avec une grande disparité entre les produits. Les services web en mode ASP ou sur poste, au choix. La normalisation a priori ou a posteriori (structuration des documents avec des métadonnées ou balisage ultérieur ; le langage XML a ici un rôle important à jouer). Le nécessaire rapprochement entre data mining et text mining (techniques d’analyse qui s’appuient sur des méthodes statistiques pour identifier des corrélations entre les documents et en extraire de la « connaissance »).

Quelques points de méthode

Le changement induit dans une organisation par les outils avancés de veille est souvent sous-estimé, selon Pierre Batel, de la société Thales. Pourtant, le recours à ces outils peut multiplier par dix l’efficacité de l’outil ou de l’unité de veille. Cinq projets différents qu’il a pilotés lui ont permis de mesurer précisément le temps gagné en utilisant ces outils : le temps consacré à la collecte des informations passe de 29 % à 4 %, celui de la catégorisation de 21 % à 4 % et celui de la diffusion de 18 % à 4 %. Ce bénéfice peut alors être investi par le veilleur dans des tâches plus « intelligentes ».

La réticence à l’introduction de nouveaux outils et donc à de nouvelles habitudes de travail est cependant un phénomène courant dans les entreprises. Il est donc recommandé de respecter quelques points de méthode pour mener à bien ce type de projet.

Trois phases sont ainsi proposées : commencer par une étude d’opportunité et de faisabilité (à partir de l’existant) pour élaborer un diagnostic et des recommandations ; réaliser ensuite des projets pilotes afin de mutualiser les initiatives et de favoriser une appropriation collective de la culture de veille ; intégrer enfin la solution retenue à l’architecture globale du système d’information.

Les principales difficultés sont essentiellement liées à la communication sur le projet : veiller à la cohérence des messages, écouter ses interlocuteurs pour comprendre comment ils conçoivent leur rôle, poser les bonnes questions… Une attitude d’écoute et de disponibilité qui ne pourra qu’encourager une conduite réussie du changement.

6

Les tendances que l’on a pu récemment observer sur le plan des usages sont les suivantes : un équilibrage semble s’esquisser entre les techniques pull et push ; la médiation humaine reste essentielle dans l’appropriation des outils par les utilisateurs et se doit d’être transparente (en ce qui concerne par exemple le traitement des contenus ou le paramétrage des outils) ; les portails s’orientent vers l’intégration à la fois des données et des applicatifs utiles ; une synergie apparaît entre veille et knowledge management ; une évolution timide s’amorce vers des outils paramétrés pour des usages précis.

Les produits

7

Aperto libro. Alogic, société de gestion de contenus, propose un atelier logiciel complet de production et d’exploitation d’« infogemmes », informations porteuses de connaissance qu’une capture instantanée permet de conserver en mémoire et d’utiliser à bon escient. Hautement personnalisée, cette série logicielle est composée d’outils offrant de nombreuses fonctions : l’acquisition d’informations (texte, image, toute source, tout format) par des moteurs de recherche sémantique ; la production d’« infogemmes » par l’interrogation, sous forme de requêtes personnalisées en langage naturel, de grandes masses d’informations, et fondée sur un moteur de recherche couplant technologie sémantique et indexation en texte intégral ; le traitement et l’exploitation de ces informations (classification automatique, diffusion, résumés, constitution de dossiers thématiques, etc.). Les applications de ce produit sont nombreuses : observatoire des concurrents, interprétation du contenu des courriels et des curriculum vitae, par exemple, station de travail du journaliste, portail d’accès à l’information mutualisée d’une entreprise, suivi de l’image de marque d’une entreprise – toutes applications reposant sur la recherche d’un profil.

8

Digimind Evolution est une plate-forme qui permet une gestion modulaire de la veille stratégique. Au cours de la première étape d’un tel projet, une liste des sources électroniques (sites web, listes de diffusion, forums de discussion, bases de données, etc.) à surveiller sera établie et constituera le socle du dispositif de veille, cette plate-forme ne travaillant pas sur tout le web mais uniquement sur des sources précisées. La création d’agents de surveillance permet une veille efficace sur tous les supports sélectionnés : toute nouveauté affectant une page web ou un site est ainsi repérée, les messages échangés au sein des forums de discussion sont analysés… Mais la surveillance de sites comporte un inconvénient majeur : on peut être très vite submergé par les alertes si un site est souvent mis à jour avec chaque fois beaucoup de modifications. Digimind Evolution contourne cette difficulté en assurant la sélection des nouveautés pour n’alerter l’usager que lorsque c’est vraiment nécessaire.

9

Tous les outils utiles à la diffusion sélective des informations de veille ou des analyses sont intégrés au système : diffusion d’alertes par courriel sur les informations validées ou provenant des agents de surveillance, réalisation de synthèses au format papier ou HTML.

10

La souplesse de l’architecture permet à l’utilisateur de choisir les modules adaptés à ses besoins, quitte à en ajouter de nouveaux au fur et à mesure de l’évolution de son dispositif de veille.

11

Webprodipper et Kartoo. Proposé par le société Pertimm, Webprodipper est un service ASP de veille automatisée sur le web professionnel fondé sur Pertimm (le nom de ce moteur de recherche a été forgé par contraction des adjectifs « pertinent » et « immédiat ») qui utilise les dernières avancées technologiques en matière de sémiotique interactive et de sémantique dynamique. Cet outil de veille professionnelle fournit l’ensemble des possibilités suivantes : recherche en langage naturel ; recherche par mots clés et expressions, par concepts sémantiques et synonymes ; recherche contextuelle ; recherche multilingue (six langues européennes) ; hyperliens sur les paragraphes et/ou les mots pertinents. L’utilisateur peut définir simplement et rapidement les concepts nécessaires à sa veille. Il réduit ainsi considérablement le bruit et le silence sur des sources aussi hétérogènes que celles qu’offre le web.

Pour en savoir plus : sites web des produits cités

Aperto libro <www. alogic. fr>

Arisem <www. arisem. com>

Autonomy <www. autonomy. com>

Digimind Evolution <www. digimind. fr>

Kaliwatch <www. kalimagroup. com>

Kartoo <www. kartoo. net>

Verity K2 <www. verity. fr>

Webprodipper <www. webprodipper. com>

12

Kartoo est un métamoteur de recherche sur Internet dont une des particularités est la représentation graphique des résultats obtenus. Les sites trouvés sont représentés à l’écran par des symboles plus ou moins gros en fonction de leur pertinence. Entre les noms de ces sites s’inscrivent des thèmes voisins qui permettent de préciser la recherche. Kartoo sert de vitrine à ses promoteurs mais l’entreprise développe trois axes métier : recherche d’information, gestion des connaissances et veille. Ainsi, elle propose depuis peu une solution de veille monoposte en mode ASP.

13

La conjugaison des outils Webprodipper et Kartoo (recherche sémantique et cartographie) a été mise en œuvre au CNRS, qui ne compte pas moins de 800 sites web et de 1.600 laboratoires. Le but de cette double application était d’identifier des compétences transverses et de bien connaître les champs d’étude des différents laboratoires. L’association des deux techniques a permis d’établir une cartographie des sites pertinents lors d’une recherche et de mettre en valeur les relations entre eux.

14

Verity K2 est une infrastructure logicielle de recherche et de catégorisation produite par l’éditeur de logiciels Verity pour les portails d’entreprise et les sites Internet. Fondée sur une architecture multi-tiers, Verity K2 permet de rechercher et d’organiser l’information grâce à des fonctionnalités de catégorisation et de classification automatiques. Elle permet également de mieux partager et exploiter la connaissance stockée dans les entreprises grâce aux techniques de « réseaux sociaux » : cette approche consiste à mettre en relation des personnes ayant les mêmes centres d’intérêt grâce à des fonctionnalités prenant en compte le comportement des individus entre eux ainsi que leur activité : création, modifications de documents, recherches, etc. L’objectif étant de faire évoluer la connaissance de cette communauté et de favoriser une interactivité étendue entre les individus pour exploiter le capital « connaissances » de l’entreprise.

15

Les principales fonctionnalités de Verity K2 sont les suivantes :

  • classification intelligente, qui associe la rapidité du classement automatique par le système à l’efficacité de l’intelligence humaine ;

  • recherche paramétrique, qui facilite la recherche sur une combinaison d’informations structurées et non structurées ;

  • indexation : le système indexe en parallèle les multiples sources de données textuelles (courriels, bases de données, sites Web, etc.) et permet de référencer automatiquement les nouveaux documents « entrants » ;

  • recherche fédératrice : cette fonctionnalité fusionne et catégorise les résultats issus des recherches sur les index Verity et sur les index de sources d’information Internet ;

  • réseaux sociaux, appellation qui recouvre plusieurs fonctionnalités : classement adaptatif des documents selon leur cote de popularité ou selon des notes attribuées par les usagers, recommandation de documents et d’experts, gestion de communautés ;

  • sécurité avancée et accès unifié à l’information : la liste de résultats est filtrée afin de ne présenter à l’utilisateur que les documents auxquels il dispose des droits d’accès.

Arisem, spécialiste du knowledge management. Cette solution autorise une démarche globale, simple et progressive de gestion des connaissances à travers trois types de projets : mise en œuvre de systèmes de competitive intelligence (veille technologique, concurrentielle, stratégique ou d’image de marque), organisation et diffusion des fonds documentaires dans l’intranet, création d’espaces de travail collaboratif et gestion des réseaux d’experts. Elle veut apporter des réponses concrètes aux problèmes rencontrés par les entreprises aujourd’hui : gestion de volumes croissants d’information interne et externe, traitement et exploitation des informations multilingues, partage et exploitation de toute la connaissance dans l’entreprise.

16

La société Alcatel a retenu la solution Arisem pour plusieurs raisons : la recherche simultanée Internet/intranet/banques de données internes ; l’analyse sémantique, outil donnant des résultats de meilleure qualité que le full text ou les mots clés ; la catégorisation qui ajoute de la pertinence et de la précision aux résultats. Après un an d’utilisation, le constat est très favorable : réduction du temps de recherche, non-nécessité de réunir l’information dans une seule base, diffusion ciblée, sécurité modulable pour limiter l’accès à certaines informations ou certains sites, flexibilité qui permet une adaptation constante aux besoins des utilisateurs.

17

Ce projet de système de knowledge management a mis en évidence l’importance de l’accompagnement dans la conduite du changement. Une bonne organisation associée à un outil performant, garant de la cohérence d’un projet de KM, s’avère indispensable pour évoluer vers un véritable système d’aide à la décision.

18

Kaliwatch. Kalima (Knowledge Acquisition and LIngware Management Applications), entreprise issue à la fois de Thales et d’IBM, propose avec Kaliwatch un produit original qui utilise simultanément la statistique avancée et la sémantique. Couplant ces approches mathématique (pour la structuration et la mise en évidence des corrélations) et linguistique (description des textes et mise en valeur des différentes dimensions du discours), les solutions de Kalima permettent de trouver, synthétiser et faire émerger du sens à partir de grandes quantités d’informations non structurées (text mining). Elles donnent ainsi une vision globale de tous les documents sélectionnés, en rendant possibles l’extraction d’informations précises, leur mise en corrélation avec d’autres données, leur adressage aux bons destinataires en temps voulu ; en permettant de mettre en relation les personnes qui travaillent sur des sujets proches, en mettant en évidence le lien entre eux. L’objectif est, par la fourniture des outils et méthodes appropriés au veilleur, de déplacer la valeur ajoutée par ce dernier de la recherche vers l’analyse.

19

Ces technologies peuvent être utilisées pour des applications de CRM (gestion de la relation client), de la veille technologique ou encore la gestion de contenus d’informations classiques.

20

Autonomy. Autonomy Corporation est l’un des principaux fournisseurs de logiciels d’infrastructure pour l’entreprise. Son principe consiste en l’extraction de concepts, fondée sur la reconnaissance des formes et élaborée à partir de deux théories mathématiques, en vue d’indexer ou de classer des informations textuelles non structurées avant de les rendre accessibles par le biais de l’arborescence ou du moteur de recherche d’un portail interne ou externe, par exemple.

21

Le module de recherche permet de retrouver des documents en fonction de requêtes saisies en texte intégral puis mises en rapport avec des documents contenant des concepts connexes (qui peuvent être des chaînes de caractères, des expressions ou des groupes de mots).

22

Parmi les points forts d’Autonomy : la mise en relation des collaborateurs d’une entreprise travaillant sur des projets similaires au sein de différents départements ; la gestion, la création et la mise à jour automatiques des profils d’utilisateurs ; la visualisation des informations (organisation par code couleur donnant des informations géographiques et quantitatives) ; un système d’alerte performant.

Entre promesses et réalité

23

Si l’intérêt de ces différents outils paraît évident, un certain décalage existe entre ce qu’ils promettent et ce qu’ils apportent réellement sur le terrain.

24

La complexité croissante du marché des contenus, par exemple, amplifie la gestion des doublons (sources et données), toujours mal résolue par les outils proposés. Dans tous les cas, une bonne sélection des sources, à effectuer après une identification précise des besoins, reste une étape essentielle dans tout système de veille. L’évaluation et la description de sites web ne font pas l’objet de solutions satisfaisantes. Quant à l’ergonomie des systèmes (saisie, accès), elle laisse encore à désirer mais devrait évoluer.

25

Les techniques et outils présentés fonctionnent bien surtout pour des usages très ciblés et pointus et peuvent apporter dans certains cas une réelle valeur ajoutée ; mais ils restent cependant très spécialisés, très difficiles à mettre en œuvre, et ne conviennent pas forcément aux besoins réels des usagers. Qui attendent essentiellement une automatisation des tâches fastidieuses et consommatrices de temps pour laisser leur intelligence s’exercer pleinement.

26

Un certain nombre de critères objectifs peuvent cependant guider le futur utilisateur dans ses choix. Ces critères seront la présence ou non de thésaurus, la possibilité d’intégrer d’autres produits, la richesse des fonctionnalités documentaires, la gestion du risque projet, l’intégration informatique alors que la tendance était jusqu’ici à une standardisation en intranet.

Résumé

Français

Une journée d’étude organisée à Paris le 10 décembre 2002 par l’Association française pour la promotion de l’intelligence économique (SCIP France) proposait de faire le point sur les récents développements de l’offre en France d’outils avancés de veille sur Internet. Des présentations de produits et des témoignages d’utilisateurs ont accompagné des exposés plus généraux sur les évolutions des fonctionnalités des outils de traitement de l’information et sur les changements induits dans les organisations par le recours à ces outils.

Plan de l'article

  1. Les fonctionnalités
  2. Les évolutions
  3. Les produits
  4. Entre promesses et réalité

Pour citer cet article

Ferchaud Bernadette, « Journée d'étude SCIP France.  Les outils avancés de veille sur Internet», Documentaliste-Sciences de l'Information 1/2003 (Vol. 40) , p. 29-32
URL : www.cairn.info/revue-documentaliste-sciences-de-l-information-2003-1-page-29.htm.
DOI : 10.3917/docsi.401.0029.


Article précédent Pages 29 - 32 Article suivant
© 2010-2014 Cairn.info
back to top
Feedback