Accueil Revues Revue Numéro Article

Documentaliste-Sciences de l'Information

2013/3 (Vol. 50)

  • Pages : 78
  • DOI : 10.3917/docsi.503.0024
  • Éditeur : A.D.B.S.

ALERTES EMAIL - REVUE Documentaliste-Sciences de l'Information

Votre alerte a bien été prise en compte.

Vous recevrez un email à chaque nouvelle parution d'un numéro de cette revue.

Fermer

Article précédent Pages 24 - 25 Article suivant
1

Il existe un paradoxe, lié au vocabulaire employé dans le domaine des technologies de l’information et de la communication : les notions sur lesquelles il se fonde évoquent souvent le contraire des réalités qu’elles sont censées décrire. Prenons par exemple la très poétique expression du « cloud computing », de l’informatique « dans les nuages » ; la réalité qu’elle recouvre est bien loin de cet échange éthéré d’informations ; on estime que les immenses installations qui hébergent des milliers de serveurs reliés par des kilomètres de câbles consommeront dans dix ans autant d’électricité que la France, l’Allemagne, le Canada et le Brésil réunis [1][1] http://www.zdnet.fr/actualites/cloud-computing-gre....

2

Il en va de même de l’utilisation du terme « donnée » qui, de par son origine même, induit quelque chose de solide, de déjà là, de « donné » qu’il suffirait de calculer pour la faire « parler ». Tout se passe, dans ces discours, comme si la donnée était vue uniquement comme un objet de calcul et non comme une matière dont le traitement, selon les différentes étapes, solliciterait des compétences variées, hétérogènes, et non strictement identifiables aux seuls métiers cités ci-dessus. Or, tout accroissement du volume des objets nécessaires à une prise de décision - quel que soit le domaine - suscite à son tour un besoin de traiter ces objets, de les nommer, de les valider, de les classifier, de les trier, de les conserver, de les détruire, etc.

La nécessité d’une intelligence sociale

3

Autrement dit, ces ensembles de données, mais aussi tout ce qu’ils serviront à produire comme documents, comme objets de connaissances, comme informations, ne seront pas traités de façon automatique, uniquement à raison d’algorithmes et de calculs [2][2] Contrairement à ce qu’affirme, par exemple, Chris Anderson,.... Il y faut une intelligence sociale qui correspond bien à la façon dont, depuis des générations, les professionnels de l’information gèrent des documents, des supports d’information et leurs contenus. Si les « vues » sur ces données qui sont les plus exposées dans la littérature sont celles du statisticien, du chercheur, du marketeur, c’est en partie parce que ce sont celles dont la valorisation est la plus évidente. Les commentateurs insistent souvent sur le fait que le traitement de la donnée suppose le collectif et l’échange entre professionnels d’orientations différentes, mais la question est rarement posée de l’élargissement de ce cercle à d’autres instances ou individus dont les savoirs relèvent de manière large des sciences humaines et sociales, de la science politique, de l’organisation, de la gestion de l’information. Pourtant, parmi les questions posées par la prolifération de la donnée figurent en bonne place des problématiques qui sont de longue date celles des professionnels gestionnaires de l’information. Ces derniers se voient à leur tour interpellés par un changement de paradigme recouvrant, non pas l’apparition d’un nouvel objet que serait la « data », mais un double mouvement caractéristique de cette nouvelle économie de la donnée.

Des problématiques bien connues des professionnels de l’information

4

D’un côté, une énorme masse de données produite et autoproduite passe par des filtres et l’entonnoir d’un traitement en grande partie automatisé pour aboutir à la production de connaissances, à la prise de décision, à la création de nouveaux produits. Et au cours de ce travail se produit la transmutation de « données » en « documents » (en prenant bien évidemment en compte la façon dont l’affichage dynamique de ces éléments interroge à son tour la notion même de document). La volatilité de cette production, son caractère éphémère posent des problèmes redoutables dont doivent s’emparer professionnels de l’information, chercheurs en science de l’information, éditeurs et industriels.

5

D’un autre côté, on assiste à un éclatement, à une décomposition d’ensembles construits qui n’avaient de sens que pris dans leur totalité, et que l’exploitation de leurs données, une fois isolées de l’ensemble, transforme en pourvoyeurs précieux d’informations et de connaissances nouvelles. Il s’agit là du grand intérêt et du véritable effet novateur du linked data : la possibilité, à partir du moment où des ensembles construits de données sont interopérables par le jeu de la normalisation dans des formats pensés pour la mise en relation et la mise en sens d’éléments discrets (triplets RDF, FRBR, FRAD, etc.), d’apparier des données qui ne l’auraient jamais été - ou alors au prix d’un effort et d’un coût considérables - dans les logiques documentaires traditionnelles. Ce traitement était possible dans les bases de données, dira-t-on, et avec raison ; la différence - de taille ! - réside dans le fait que jamais autant de ces données n’auraient été centralisées en un point unique d’accès et que les complexités du requêtage n’auraient pu permettre la richesse d’exploitation promise par le linked data.

6

Encore faut-il définir dans quels buts ces agrégations de flux de données multiples et éparses et cette décomposition de blocs de données en éléments discontinus doivent être effectuées. Autrement dit, il s’agit de décrire quels sont les projets qui peuvent le mieux bénéficier de ce mouvement et de ces techniques et pour lesquels doivent se rassembler statisticiens, informaticiens, mathématiciens, marqueteurs, analystes, sociologues ET professionnels de l’information.

7

Si l’on voit bien, dans les articles qui suivent, combien ce mouvement n’épargne aucun secteur (culture, recherche, entreprise, médias), il reviendra aux professionnels de l’information eux-mêmes de s’emparer de ces problématiques et de se mettre en scène comme « chef de projet de données » [3][3] Libellé ainsi pour éviter de céder à l’anglicisme facile ;..., titre qui pourrait faire le contre-pied des appellations par trop scientistes comme « data scientist » ou « data analyst ».

8

Dans la durée longue des changements introduits par les technologies de l’information et de la communication, ce ne sera ni le premier, ni le dernier, mais pas non plus le moindre des défis à relever.

Notes

[2]

Contrairement à ce qu’affirme, par exemple, Chris Anderson, rédacteur en chef de Wired lorsqu’il écrit : « Nous pouvons analyser les données sans faire d’hypothèses. Nous pouvons lancer les chiffres dans les plus gros réseaux d’ordinateurs que le monde ait jamais eus et laisser les algorithmes trouver des structures que la science n’a jamais imaginées » (cité par Patrice FLICHY in :. « Rendre visible l’information, Une analyse sociotechnique du traitement des données ». Réseaux, 2013/2, n°178-179, p.55-89)

[3]

Libellé ainsi pour éviter de céder à l’anglicisme facile ; il s’agirait du « data project manager ».

Résumé

Français

À lire ce que l’on dit sur les sites et blogs spécialisés du « nouveau » métier de data scientist, la prise en compte des savoirs de l’information-documentation dans l’aventure de la « data » serait mal partie : l’informaticien, et mieux encore le mathématicien, le statisticien et l’ingénieur sont présentés comme les seuls véritables héros de cette histoire. Compte tenu de l’extrême sophistication des outils et de leur très haute technicité, ce discours n’est pas en soi illégitime. Mais il laisse dans l’ombre la question épineuse de « ce que l’on fait » avec ces données et les résultats de leur traitement. Si leur évidente utilisation par le marketing renvoie là encore à des compétences économiques et commerciales, quid de leur usage pour le pilotage des politiques publiques, pour la recherche scientifique au sens large, pour la détection de phénomènes nouveaux, pour l’analyse des grandes tendances sociologiques et sociétales, pour la valorisation des patrimoines culturels, pour la facilitation du travail collaboratif dans les entreprises ?

English

Who will (re)work data?When you read the websites and specialized blogs on the “new” profession of “data scientist”, you don’t see much about the skills of the information/librarian specialist in this new adventure. It’s true that the tools used are very sophisticated and highly technical. But they ignore the prickly question of “what one does” with data and the results of processing.
If the obvious utilization of data by the marketing sector relies on the skills of salespersons and economists, what about their use for piloting public policies, for scientific research in the broadest sense, for detecting new phenomena, for analyzing broad sociological and societal trends, for promoting cultural heritage or for facilitating collaborative work in the private sector?

Español

¿Quién (re)trabajará el dato?Al leer lo que se dice en los sitios y blogs especializados del “nuevo” oficio de data scientist, la consideración de los saberes de la info-doc en la aventura de los “datos” iría por mal camino. Teniendo en cuenta la extremada sofisticación de las herramientas y de su altísimo tecnicismo, este discurso no es ilegítimo en sí. Pero se deja en la sombra la cuestión espinosa de “lo que hacemos” con estos datos y los resultados de su tratamiento. Si su evidente utilización por el marketing va más allá de competencias económicas y comerciales, ¿qué sucede con su uso para el control de las políticas públicas, para la investigación científica en sentido amplio, para la detección de fenómenos nuevos, para el análisis de las grandes tendencias sociológicas y de la sociedad, para la valorización de los patrimonios culturales y para la facilitación del trabajo colaborativo en las empresas?

Deutsch

Wer verarbeitet die Daten (weiter) ?Wenn man liest, was in den spezialisierten Websites und Blogs über den „neuen“ Beruf des Datenwissenschaftlers geschrieben wird, muss man glauben, dass das IuD-Wissen im Abenteuer der „Data“ keine bedeutende Rolle spielt. Zwar sind diese Aussagen nicht an sich illegitim, da die Tools hochspezialisiert und hochgradig technisch sind. Doch sie beleuchten nicht die schwierige Frage, „was geschieht“ mit den Daten und den Ergebnissen ihrer Verarbeitung. Ihre offensichtliche Nutzung durch das Marketing verweist auf Kompetenzen in Wirtschaft und Handel, doch was ist mit ihrer Nutzung zur Steuerung öffentlicher Politik, für die wissenschaftliche Forschung im weitesten Sinne, für die Entdeckung neuer Phänomene, für die Analyse der grossen soziologischen und gesellschaftlichen Tendenzen, für die Wertschöpfung des kulturellen Erbes, für die Erleichterung der gemeinschaftlichen Arbeit in Unternehmen ?

Plan de l'article

  1. La nécessité d’une intelligence sociale
  2. Des problématiques bien connues des professionnels de l’information

Pour citer cet article

Cotte Dominique, « Qui (re)travaillera la donnée ? », Documentaliste-Sciences de l'Information, 3/2013 (Vol. 50), p. 24-25.

URL : http://www.cairn.info/revue-documentaliste-sciences-de-l-information-2013-3-page-24.htm
DOI : 10.3917/docsi.503.0024


Article précédent Pages 24 - 25 Article suivant
© 2010-2014 Cairn.info
back to top
Feedback