Accueil Revues Revue Numéro Article

Documentaliste-Sciences de l'Information

2013/2 (Vol. 50)

  • Pages : 78
  • DOI : 10.3917/docsi.502.0010
  • Éditeur : A.D.B.S.

ALERTES EMAIL - REVUE Documentaliste-Sciences de l'Information

Votre alerte a bien été prise en compte.

Vous recevrez un email à chaque nouvelle parution d'un numéro de cette revue.

Fermer

Article précédent Pages 10 - 15 Article suivant

Le BOFIP-Impôts : un dispositif pour mettre du droit en ligne

1

Données. Comment sécuriser la publication d’un commentaire opposable à la loi dans le BO des finances publiques - section impôts ? Comment s’assurer de retrouver tous les commentaires ? Comment publier un corpus harmonisé tant sur le fond que sur la forme et le conserver de manière consolidée et cohérente ? Pour relever ces défis, il a fallu trouver des réponses techniques à plusieurs questions juridiques.

2

En septembre 2012, le Bulletin officiel des finances publiques-Impôts (BOFIP-Impôts) était mis en ligne [1][1] www.bofip.impots.gouv.fr. Une application informatique intégrée a été conçue pour répondre aux spécifications d’une documentation juridique opposable [2][2] http://www.legifrance.gouv.fr/affichCodeArticle.do?idArticle=LEGIARTI000020052213&cidTexte=LEGITEXT000006069583... reposant sur une vision intégrée de la norme fiscale. Parallèlement au chantier informatique, un chantier rédactionnel consolidait et actualisait les commentaires existants. De 50 000 pages de sources doctrinales fiscales initiales, on en a obtenu 35 000 réparties en 5 000 documents. Cette opération a représenté 100 années/homme de travail réalisées par 200 personnes pendant 18 mois. L’intégration dans l’application informatique a nécessité plusieurs tâches documentaires (contrôle des formats, liens hypertextes, indexation, mise à jour du plan, etc.).

3

Deux préoccupations avaient guidé les concepteurs du projet :

  • le maintien de l’unité globale du fond et donc de la cohérence de la doctrine, allant au-delà des sources communes et des actualités propres à lier entre eux des documents doctrinaux ;

  • le service rendu à l’utilisateur en s’assurant qu’un agent ou un contribuable puisse aisément récupérer une doctrine exhaustive et de qualité sur un dispositif ou un régime.

Sept principes éditoriaux

4

Exhaustivité. Toute la doctrine opposable car les positions de l’administration sur des questions de droit sont opposables, y compris lorsqu’elles contreviennent à la loi si elles sont favorables au contribuable.

5

Opposabilité. La doctrine relie en amont la loi et la jurisprudence et en aval la documentation non opposable. La loi fiscale est commentée pour informer les contribuables et les agents du réseau des nouveautés et des positions de l’administration. Les commentaires non opposables (tels que guides, formulaires, notices, précis) sont publiés sur impots.gouv.fr.

6

Droit positif[3][3] Ensemble des règles juridiques en vigueur.. Les commentaires sur le droit positif impliquent l’absence de stratification des dispositifs au sein de chaque document et la prise en compte de la dimension temporelle par un versionnage des documents (en stock) et des documents Actualités (en flux). Ils indiquent la date d’application d’une mesure, si celle-ci est abrogée, et offrent une vision chronologique.

7

Structuration. Chaque document doctrinal est la pièce d’un puzzle commun, sans doublon et avec des documents partagés, qui reste cohérent dans une arborescence organisée autour de notions juridiques et non directement liée à l’organisation administrative d’auteurs dont les intérêts sont parfois divergents.

8

Homogénéité. Bien que la base soit mise à jour par 300 contributeurs, les documents respectent une harmonie des formes et des règles rédactionnelles grâce à des formulaires de rédaction, un format unique, une feuille de styles non modifiable, des consignes, un processus de validation avant publication, etc.

9

Unicité. Les liens de citation entre documents, les versions, les métadonnées permettent de connaître l’ensemble des commentaires, sans doublon.

10

Convivialité. Des outils pour aider l’utilisateur (expert ou non) : recherche simple avec différents ni-veaux de langage et des résultats triables (selon des filtres appelés facettes, choisis pour leur pertinence métier (bénéficiaire, affectataire, etc.), à une date donnée ; recherche avancée ; recherche par une source du droit ; recherche par le plan de classement.

Sept types de documents

11

La consolidation prend appui sur diverses relations : des citations (renvois entre deux documents), des relations organiques (un commentaire et son annexe), logiques (via les Actualités pour constituer des ensembles cohérents et actualisés), hiérarchiques, chronologiques et vers des documents externes.

12

Le plan de classement adapté, stable, signifiant et commun à tous les métiers fiscaux. Respectant la tradition éditoriale juridique, il s’adapte au contexte technique (gestion dans un CMS, consolidation au fil de l’eau, recherche à facettes, etc.). Une nouvelle arborescence a été conçue autour d’un format standardisé. Le nombre de séries a été étendu autour d’un axe unique : le critère juridico-fiscal (le type d’impôt, la cédule, la procédure). Les axes de structuration non retenus sont portés par des facettes (type de contribuables, d’affectataires) et les répétitions remplacées par des liens hypertextes entre les documents de la base.

13

Les documents « enfant », unités documentaires de base de l’exposé de la doctrine fiscale, sont autonomes (logiques, identifiés, signés, datés) mais reliés entre eux par le plan de classement et des liens de citation. Chaque document doctrinal qui a au maximum 10 pages est découpé en subdivisions internes (3 à 6 niveaux auxquels s’ajoutent des numéros de paragraphes, vestiges d’une pratique du secteur juridique).

14

Le document « parent » permet au rédacteur de structurer son travail et au lecteur de se repérer. Il a une fonction de synthèse (annoncer les contenus des documents enfant) et d’orientation vers une autre partie de la base.

15

Le document « annexe » (barèmes, formulaires, modèles, etc.), autonome, peut concerner plusieurs documents maître auxquels il se rattache par un lien organique (bijectif et versionné).

16

Le document « actualité » recense de manière exhaustive et précise les différents documents affectés (créés, modifiés ou fermés) par le commentaire.

17

Le dossier d’affaire reprend les activités réalisées par l’application commune : identifier les groupes de documents à relier ; intégrer/ numériser les documents ; repérer leur localisation dans la base ; établir/typer/contrôler les liens ; contrôler/faire évoluer les référentiels communs ; organiser le visa, la signature, la mise en ligne simultanée d’un ensemble de documents. Il contient la liste des documents créés, modifiés ou fermés, l’actualité, le bon à publier, la mention de documents utiles.

18

Le bon à publier (BAP), document papier qui, pour chaque lot documentaire, liste les documents à publier, porte la signature du cadre délégué. À l’original sont adjoints après publication les documents imprimés du site (en version comparée) et l’ensemble est conservé par le bureau métier pilote dans un lieu sécurisé pour être soumis au juge en cas de contentieux.

Les ponts entre la base et son environnement

19

Les identifiants. Chaque document doit être trouvé et cité par des identifiants qui unissent et discriminent. L’application génère des identificateurs uniques propres aux catégories de documents et non modifiables manuellement, visibles dans l’URL. Le titre est suffisamment complet pour que le document soit repéré et cité hors de la base BOFIP-Impôts. Le plus court possible, il va du général au particulier, discriminant, différent et distinguant, ainsi que signifiant pour le lecteur.

20

Des liens vers les sources du droit. La cible est mentionnée avec précision pour être retrouvable et citable à la fois sur l’écran navigable et sur papier.

21

Les actualités. Elles répondent à des injonctions contradictoires : commenter au plus vite pour ne pas laisser les usagers dans l’imprécision de la loi parce que le système de documents versionnés rend visibles les écarts entre la loi et la doctrine, mettre en exergue ce qui est nouveau sans noyer les usagers et accroître le sentiment d’instabilité de la norme applicable.

22

Les métadonnées. Pour un tri par facettes, on a retenu les séries puis les divisions du plan de classe-ment, le canevas fiscal, la source du droit commentée, la nature du contenu du lot documentaire, la catégorie des usagers ou des affectataires. Les métadonnées « catégories socio-professionnelles » et « territoire » ont été écartées car non correctement valorisées. La métadonnée « mots-clefs » pour surpondérer en recherche a été difficile à mettre en œuvre faute de vocabulaire fiscal préexistant et d’une fonctionnalité applicative dédiée à l’indexation. Toutes les métadonnées contenant des valeurs « dates » sont hautement impactées par l’application du droit positif, la date étant le fait générateur ou la conséquence d’autres fonctionnalités applicatives.

23

Le moteur. L’index qui se construit à chaque sauvegarde d’une nouvelle version d’un document porte sur le contenu textuel (titre, métadonnées, contenu) mais pas sur les images. Plusieurs filtres sont mis en œuvre : StandardFilter supprime les « s » à la fin des mots et les points des acronymes, LowerCaseFilter met tous les mots en minuscules, ExactFilter recherche sur les mots exacts, StopFilter supprime les mots non signifiants, FrenchStemFilter lemmatise en langue française. La recherche ne se fait pas sur l’ensemble du site mais uniquement sur le titre du document, un type d’annexe (barèmes, formulaires), une version publiée à une date passée, les actualités. La recherche avancée est limitée à des requêtes préétablies partiellement personnalisables (recherche par proximité et avec expansion sémantique). Le système trie les résultats par pertinence décroissante (titre, puis métadonnées, texte du document). Pour éviter le silence, on a enrichi le pro-cessus de recherche d’un dictionnaire des équivalents, constitué à partir de sources diverses.?•

24

Version complète : Jocelyn PIERRE, « Mettre en ligne du droit : l’expérience BOFIP-Impôts, des réponses informatiques à des questions juridiques ». À paraître dans la Revue générale du droit, chronique « Informatique juridique », 2013 http://www.revuegeneraledudroit.eu/

25

Jocelyn Pierre

Une plate-forme collaborative pour l’enrichissement sémantique

26

Outil. La société TEMIS, éditeur du logiciel d’enrichissement sémantique Luxid®, souhaitait doter son écosystème d’une plateforme communautaire. C’est chose faite depuis le lancement en février 2013 de la Luxid® Community. Découverte de cette expérience originale.

27

Luxid® Community est à la fois un portail communautaire et une initiative prise pour faciliter l’accès aux technologies d’extraction d’information. Daniel Mayer, VP Marketing de TEMIS, nous en expose les principales caractéristiques.

Pouvez-vous nous présenter l’activité de TEMIS ?

28

TEMIS [4][4] http://www.temis.com/fr intervient dans toutes les applications de gestion de l’information en entreprise. Nos clients, généralement des gestionnaires de contenu en charge de portails, de moteurs de recherche, d’applications métier ou de gestion des connaissances, mais aussi analystes et décideurs, font face à un développement exponentiel de leurs contenus non structurés : documents PDF, rapports, pages web, messages email, etc. Notre plateforme Luxid® exploite les technologies de traitement automatisé du langage pour lire toute forme de textes et en extraire les éléments d’intérêt en lien, par exemple, avec la terminologie métier. Ces éléments peuvent alors être exploités comme donnée en tant que telle ou comme métadonnée documentaire.

29

Pour réaliser ces opérations, Luxid® s’appuie notamment sur des automates d’extraction d’information que nous appelons Skill Cartridges®. Celles-ci permettent d’appliquer au contenu des grilles d’analyse thématique ou applicative et de se focaliser sur les dimensions qui intéressent plus particulièrement l’utilisateur : opinions exprimées sur tel ou tel aspect d’un produit, molécules ou effets secondaires d’un médicament, relations entre sociétés dans l’intelligence économique, etc.

Quels avantages tire-t-on d’une utilisation de Luxid® ?

30

Le bénéfice immédiat est lié à l’automatisation de cette tâche d’extraction. Elle dispense les collaborateurs de l’entreprise utilisatrice d’une opération laborieuse de contribution de métadonnées documentaires et leur permet de se focaliser sur des tâches à plus forte valeur ajoutée. L’extraction peut aussi être pilotée par la taxonomie ou la terminologie métier, ce qui garantit la cohérence des métadonnées.

31

Dans un deuxième temps, ces métadonnées peuvent être utilisées pour faciliter la navigation dans les contenus (mécanisme de facettes, fonctions « documents similaires », etc.), pour automatiser des tâches de gestion documentaire (classification et routage automatique) ou des processus métier (alertes, déclenchement de tâches, etc.).

32

Quand elles sont utilisées comme donnée, les informations extraites deviennent analysables comme toute donnée structurée, par exemple dans le cadre d’applications d’analyse de réseaux sociaux, de voix du client, de découverte scientifique, etc. Dans un contexte d’hyper croissance des contenus non structurés, Luxid® permet ainsi aux organisations de mieux structurer ces contenus pour mieux les gérer et mieux les valoriser.

Qu’a de particulier le portail Luxid® Community, par rapport à ce qui se fait ailleurs dans votre marché ?

33

À notre connaissance, il n’existe pas dans notre domaine de portail directement comparable. Nous combinons en effet trois logiques d’habitude distinctes.

34

• Le partage d’expertise. C’est celle qui anime la plupart des communautés d’utilisateurs. Nous avons constaté que si les technologies de traitement automatisé du langage séduisaient de plus en plus d’entreprises, les savoir-faire associés restaient pour l’instant inégalement répartis. Or, nos clients et nos partenaires font partie de ceux qui connaissent le mieux ces technologies ainsi que les processus associés. Il y avait un bénéfice évident à mettre ces utilisateurs chevronnés en contact avec les nouveaux utilisateurs afin qu’ils puissent facilement découvrir les bonnes pratiques du secteur, accéder à des contenus didactiques pour exploiter nos technologies et, plus généralement, bénéficier de synergies collectives.

35

• Le besoin croissant d’interopérabilité des contenus. Nous sommes convaincus que les phénomènes de Linked Data (ou web de données) et d’Open Data vont marquer durablement le secteur. Ils dépassent largement le secteur public car les éditeurs commerciaux se sont engagés depuis longtemps dans la publication en ligne de données et de contenus. Pour les organisations qui sauront les exploiter, ces data représenteront de véritables mines de connaissance. Mais, pour les utiliser, il faut parvenir à aligner leurs descriptions sur des taxonomies et des identifiants communs, standardisés, partagés. Et pour aligner des ressources provenant d’organisations différentes, il est vital que ces organisations puissent se parler. La seconde ambition de Luxid® Community, c’est donc d’être un espace de mise en relation, de discussion et d’alignement mutuel.

36

• Une place de marché où l’on peut échanger des composants pertinents pour l’extraction (par exemple un vocabulaire contrôlé, une taxonomie, une Skill Cartridge® métier voire même un corpus de documents). C’est peu ou prou la même logique de co-création de valeur en écosystème que l’on trouve autour de l’Appstore d’Apple. L’idée est d’une part d’offrir aux utilisateurs de la plateforme Luxid® des composants prêts à l’emploi qui soient pertinents pour leurs domaines et d’autre part de mettre en place les conditions pour que des concepteurs – le plus souvent des experts métier – puissent monétiser leur expertise.

Qui va utiliser ce nouvel espace ?

37

Ce seront principalement les utilisateurs de Luxid® mais aussi tous les partenaires de TEMIS d’une manière plus large. Parmi ceux-ci, on retrouve trois catégories principales : les intégrateurs système qui se sont formés à notre plateforme et sont à même de la déployer au sein des systèmes d’information de leurs clients ; des experts métier qui ont une connaissance très spécialisée de l’organisation de l’information dans un secteur particulier (automobile, énergie, juridique, etc.) et qui peuvent aider les clients de leur secteur à structurer leurs actifs informationnels ; les chercheurs qui peuvent nous aider à progresser dans la performance des technologies de traitement automatisé du langage.

Que trouve-on très concrètement dans le portail ?

38

Le portail offre cinq fonctions principales. « Meet » permet de créer une page de profil individuel et institutionnel grâce à laquelle on peut présenter ses activités et ses savoir-faire. Avec « Learn », on apprendra à se servir du logiciel Luxid®. Sans se substituer à une véritable formation, ces contenus (souvent au format vidéo) permettent de prendre en main la plateforme et de découvrir rapidement les fonctions de base.

39

Les fonctions « Discuss » et « Improve » offrent des forums de discussion où les membres échangent sur des sujets de leurs choix (difficultés techniques, cas d’usage, intégration avec d’autres briques techniques, etc.) ou proposent des axes d’amélioration de la plateforme Luxid®. Avec « Download » et « Marketplace », on téléchargera les mises à jour logicielles ainsi que des composants complémentaires.

Quelles synergies pensez-vous que cette plateforme va déclencher ?

40

Nous voyons d’ores et déjà deux formes de synergie prendre forme. Ce sont tout d’abord des projets collaboratifs qui naissent entre des membres qui ont en commun leur industrie (par exemple le secteur automobile) ou leur cas d’usage (par exemple l’analyse des verbatims clients). Travailler collectivement sur de tels projets permet souvent aux collaborateurs d’en diviser les coûts et les risques, de mieux couvrir leur domaine et d’en accélérer la réalisation.

41

La seconde synergie, évidente, consiste en un partage avec les autres membres d’un composant pertinent pour l’extraction. Cela peut être par exemple un vocabulaire contrôlé, une taxonomie, une Skill Cartridge® métier voire même un corpus de documents. Nous nous attendons également à ce que se mettent en place des synergies qui dépasseront le cadre que nous imaginons actuellement ; il faudra alors certainement que la plateforme évolue !

Comment incitez-vous à utiliser ces nouvelles fonctions ?

42

Nous avons conçu deux accélérateurs spécifiques. Le premier est une licence Luxid® gratuite, concédée aux Platform Partners, les experts métier qui souhaitent développer un composant d’extraction basé sur leur expertise métier. Le second est la mise à disposition, au sein de la Luxid Community, de nos Skill Cartridge® Frameworks sous la licence libre CC-BY [5][5] http://creativecommons.org/licenses/by/3.0/fr. Ceci permet à l’ensemble des membres de développer des extracteurs compatibles avec Luxid® et de les distribuer indépendamment, que ce soit sous licence commerciale ou sous licence gratuite, avec la seule obligation de faire référence à TEMIS comme créateur initial. Lorsqu’un membre souhaite commercialiser une Skill Cartridge® sur le portail Luxid® Community conformément au modèle des Appstores actuels, il conserve 70 % du revenu correspondant.

Et si l’on veut tester Luxid® Community ?

43

C’est très simple, il suffit de se connecter à notre serveur [6][6] http://community.temis.com. Une partie du portail est en accès libre. Pour accéder à la partie privée, il suffit de demander un compte (« sign up »).

44

Daniel Mayer

45

Propos recueillis par Michèle Battisti

Open et Linked Data dans la sphère culturelle

46

Focus. Serait-ce la fin des silos culturels ? Dans un contexte d’ouverture juridique (une révision de la directive européenne sur la réutilisation des informations du secteur public), politique (mouvement en faveur de l’Open Data), technique (Linked Data), culturel lors d’une conférence organisée par le GFII.

47

La valeur est désormais dans le lien : illustration par une journée d’étude du GFII [7][7] http://www.gfii.fr/fr/document/journee-d-etude-du-... consacrée aux apports du web des données.

48

Le droit serait-il un obstacle ? Ne dispose-t-on pas d’une loi sur la réutilisation des informations publiques ? Cette loi où les redevances à acquitter sont des cas exceptionnels dûment contrôlés n’est-elle pas en phase avec l’Open Data pour qui les données sont librement réutilisables, même à des fins commerciales ? Mais lorsqu’il s’agit d’établissements culturels, ceux-ci peuvent définir librement les conditions de réutilisation de leurs données, un régime vague qui se traduit par un paysage flou et des contentieux. Pourquoi la culture a-t-elle une place particulière dans la politique d’ouverture des données ? Pourquoi les établissements qui ouvrent leurs données en France sont-ils si rares ? Pourquoi les rapports officiels sont-ils contradictoires ? [8][8] La culture ne figure pas dans les 6 jeux de données...

Des producteurs

49

La donnée est un « trésor » pour la Bibliothèque nationale de France (BNF) dont les catalogues s’exposent sur le web de données pour le plus grand bénéfice des tiers et de la BNF. La donnée, c’est un enjeu en termes de visibilité mais aussi de cohérence pour les catalogues et les ressources. Liée à d’autres données, elle enrichit les sources disponibles, évite les doublons, permet de se concentrer sur sa valeur ajoutée et de multiplier les applications. Rien de « magique » bien sûr dans cette opération qui nécessite une maîtrise technique, économique et juridique. « Le Linked Data n’est qu’un hub » et le catalogage se poursuit, valorisant ainsi « un métier qui doute ».

50

On a rappelé aussi ce qu’est le web de données qui met l’accent sur le lien [9][9] http://fr.slideshare.net/rjw et ses enjeux très forts en terme de visibilité pour les bibliothèques. Toutefois, ce changement de dimension pour le catalogage, qui lie des ressources à des concepts et qui offre des perspectives excitantes, n’est peut-être pas une révolution mais n’en reste pas moins une évolution radicale et rapide.

51

La donnée, c’est ce qui permet à une institution (ici Radio France) de devenir un acteur culturel majeur. Pour ceci, il faut disposer de référentiels communs pour obtenir des données harmonisées. Tel est l’enjeu et non des moindres. Il faut aussi définir la granularité nécessaire pour une flexibilité adaptée à tout support et à tout usage, bâtir une gouvernance des données pour des processus de production des données et d’alimentation des flux ad hoc, porter une attention aux données externes (Wikipédia, souvent cité, mais d’autres aussi) qui nourrissent désormais les usages internes. Des enjeux où on conviendra que les documentalistes joueront sans peine un rôle majeur.

52

Toujours pour répondre à un souci de visibilité, partant du principe que les données qui ne sont pas en ligne n’existent pas et qu’elles n’ont de valeur que lorsqu’elles sont réutilisées, le musée national du Danemark a organisé un Hackathon [10][10] http://en.wikipedia.org/wiki/Hackathon+http://fr.s... ou 24 heures accordées à des bénévoles pour bâtir des produits et services attirants à partir des données du musée. Une expérience certes réussie, mais sans doute à poursuivre et élargir pour changer définitivement la vision des musées.

53

Conquérir un public très large, tel est l’apport souligné par la Cité de la musique. En associant des données de natures différentes, produites en interne ou par d’autres organisations, le web de données lui permet d’avoir une approche pédagogique plus fine des œuvres. Il lui permet aussi de mieux répondre à ses besoins internes : organisation d’expositions, de concerts, de ventes (vidéo en pay per view, par exemple), etc. Plus de silos : toute donnée est susceptible d’être liée à d’autres, créant ainsi des liens entre des activités et des métiers qui dialoguaient rarement auparavant. Créer de telles passerelles impose de simplifier certes l’approche en matière de données mais attire de nouveaux publics qui les enrichiront à leur tour. Plus de fragmentation non plus de l’offre numérique des publics et des usages préjudiciable à l’image d’une institution. Le web de données rend un établissement plus attractif, l’occasion d’adopter un marketing culturel différent : plus simple, moins élitiste mais de qualité.

Des utilisateurs

54

La donnée représente de réels enjeux commerciaux. C’est ce qu’illustre, entre autres, la recherche généalogique où des services proposés par des acteurs du secteur privé amorceraient un cercle vertueux : répondre aux attentes d’un public en suscitant l’intérêt pour les archives. Seule exigence : des licences gratuites ou à un coût raisonnable et un service payant pour assurer un nécessaire retour sur investissement.

55

Datalift [11][11] http://datalift.org/-http://owni.fr/2010/07/07/dat... est un outil qui a été créé pour normaliser des données brutes non structurées et faciliter leur connexion dans le web des données. C’est ce qui fut présenté, avec un cas pratique réalisé à partir des fichiers de l’IGN et de l’Insee.

56

Un panel de projets prometteurs fut aussi détaillé : faire parler le web de données avec Vocal Apps [12][12] http://vocal-apps.com/-http://www.izipedia.com/ind... qui utilise Wikipédia et Dbpédia pour répondre à des questions factuelles lorsque l’usage de l’écran n’est pas possible ; Sémanticpédia [13][13] http://www.semanticpedia.org ou lorsque le web sémantique, le ministère de la Culture, Inria et les projets de Wikimédia se mettent au service des langues parlées de France ; Hda Lab [14][14] http://hdalab.iri-research.org/hdalab pour des ressources en histoire de l’art qui s’appuie sur des contributeurs externes, des tags sémantiques pour une indexation riche reliée à Dbpédia et Wikipédia [15][15] B. SAJUS. « Le tagging sémantique du corpus histoire....

57

Doit-on ouvrir les données pour les mutualiser ? La question ne se pose plus ; c’est une nécessité. De telles perspectives, qui modifient indéniablement le travail des professionnels de l’information, comme l’ont souligné ces exposés qui avaient mis l’accent sur plusieurs solutions techniques, contribuent à le valoriser et à lui donner plus que jamais un rôle majeur.

58

Michèle Battisti

La chronique de Dominique Boullier. Naviguer par profils, mutation des principes documentaires

59

Innovation. Après le basculement des documents vers les personnes comme points de repère, la recherche sur les réseaux se fait désormais par une série d’attributs. Une approche à adopter dans un cadre professionnel.

60

Tim Berners-Lee disait en 2008 : « The Web does not just connect machines, it connects people ». Cela constituait déjà une évolution considérable par rapport au modèle qu’il avait lui-même créé. Il ajoutait que l’heure était au GGG (Global Giant Graph), celui des entités qui peuplent le Web, et non plus celui des URL du début du Web, en 1991. Il avait raison de pointer le basculement de notre mode d’orientation dans l’univers informationnel vers les personnes plutôt que vers les documents ou vers les machines. Mais il avait tort de reprendre une vulgate centrée sur les réseaux sociaux qui assimile « comptes » et « personnes ».

61

Ce sont plutôt les attributs de ces comptes qui nous relient, qui nous donnent la possibilité de naviguer, de nous repérer ou de sélectionner des « amis » que nous ne connaissons pas du seul fait qu’ils ont « liké » la même page. Le numérique en réseaux pousse à déclarer explicitement les attributs dont sont faits nos profils et qui autorisent cette connectivité extrême. Cela permet de renouer avec un modèle très ancien : à côté des médiateurs professionnels de l’information, qu’ils soient médias, experts ou documentalistes, d’autres réseaux ont toujours été disponibles pour obtenir non plus l’information exacte ou la plus autorisée mais l’information la plus pertinente et appropriable, car formulée dans sa langue par un médiateur culturellement proche ou ayant eu la même expérience.

62

Ces deux voies ont toujours été combinées au quotidien (voir le meilleur spécialiste, demander à sa belle-sœur, et désormais aller sur Doctissimo). C’est pour cette raison qu’en 1998, contre les préconisations de Tim Berners-Lee en faveur d’un web sémantique, modèle qui supposait indexation standardisée et discipline totale qu’il a depuis abandonné, j’avais préconisé « l’indexation subjective » [16][16] L’urbanité numérique, L’Harmattan, 1999. issue de l’expérience et des activités vernaculaires, renommée « navigation sociale » en 2000 et qui se retrouve en partie dans les folksonomies. Il fallait aussi entendre que les propriétés des sujets, des profils constituent des ressources de navigation décisives. Les techniques de matching des sites de rencontre exploitent clairement ces attributs mais tous les rapprochements permis par ces propriétés des profils sont loin d’avoir été parcourus.

63

Ainsi, avec le standard ResearchML [17][17] Format XML développé dans l’archive ouverte Spire de..., on peut récupérer dans les systèmes documentaires scientifiques tous les formats identiques au-delà des formats Friends of a Friend. Cette approche permettrait non pas de connecter des personnes mais d’arpenter des réseaux à partir de parentés éphémères ou réduites telles que les langues que l’on parle, les villes que l’on a fréquentées, au-delà des connexions standards à partir de critères classiques comme les noms, les institutions ou les responsabilités. Ni machine, ni document, ni personne, mais une circulation entre attributs qui composent les profils : voilà des pistes encore trop peu explorées.

Notes

[3]

Ensemble des règles juridiques en vigueur.

[8]

La culture ne figure pas dans les 6 jeux de données jugées stratégiques pour donner une nouvelle impulsion à l’Open Data dans la feuille de route du gouvernement, alors qu’un avis de juin 2012 du Conseil national du numérique, les recommandations d’Open Glam et d’un guide récent du ministère de la Culture y étaient favorables https://semaphore.culture.gouv.fr/documents/10746/1502772/GUIDE+DATA+CULTURE

[15]

B. SAJUS. « Le tagging sémantique du corpus histoire des arts ». Documentaliste-Sciences de l’information, 2012, n°2, p. 12-15.

[16]

L’urbanité numérique, L’Harmattan, 1999.

[17]

Format XML développé dans l’archive ouverte Spire de Sciences Po.

Plan de l'article

  1. Le BOFIP-Impôts : un dispositif pour mettre du droit en ligne
    1. Sept principes éditoriaux
    2. Sept types de documents
    3. Les ponts entre la base et son environnement
  2. Une plate-forme collaborative pour l’enrichissement sémantique
    1. Pouvez-vous nous présenter l’activité de TEMIS ?
    2. Quels avantages tire-t-on d’une utilisation de Luxid® ?
    3. Qu’a de particulier le portail Luxid® Community, par rapport à ce qui se fait ailleurs dans votre marché ?
    4. Qui va utiliser ce nouvel espace ?
    5. Que trouve-on très concrètement dans le portail ?
    6. Quelles synergies pensez-vous que cette plateforme va déclencher ?
    7. Comment incitez-vous à utiliser ces nouvelles fonctions ?
    8. Et si l’on veut tester Luxid® Community ?
  3. Open et Linked Data dans la sphère culturelle
    1. Des producteurs
    2. Des utilisateurs
  4. La chronique de Dominique Boullier. Naviguer par profils, mutation des principes documentaires

Pour citer cet article

Pierre Jocelyn, Mayer Daniel, Propos recueillis par Battisti Michèle, Boullier Dominique, « Méthodes techniques et outils », Documentaliste-Sciences de l'Information, 2/2013 (Vol. 50), p. 10-15.

URL : http://www.cairn.info/revue-documentaliste-sciences-de-l-information-2013-2-page-10.htm
DOI : 10.3917/docsi.502.0010


Article précédent Pages 10 - 15 Article suivant
© 2010-2014 Cairn.info
back to top
Feedback