Accueil Revues Revue Numéro Article

Documentaliste-Sciences de l'Information

2011/2 (Vol. 48)

  • Pages : 80
  • DOI : 10.3917/docsi.482.0064
  • Éditeur : A.D.B.S.

ALERTES EMAIL - REVUE Documentaliste-Sciences de l'Information

Votre alerte a bien été prise en compte.

Vous recevrez un email à chaque nouvelle parution d'un numéro de cette revue.

Fermer

Article précédent Pages 64 - 73 Article suivant
1

La révolution numérique de ces vingt dernières années a induit de profondes modifications dans l’accès à la littérature scientifique autant que dans les pratiques de publication des chercheurs. Les systèmes d’auto-archivage en ligne permettent en effet à ces derniers de mettre leurs publications à disposition sur le Web sans passer par les canaux habituels de l’édition scientifique.

2

En France, la volonté de soutenir les initiatives d’archives ouvertes s’affirme dès le début des années 2000 avec la création du Centre pour la communication scientifique directe (CCSD) du Centre national de la recherche scientifique (CNRS). Depuis la déclaration de Budapest en 2002 et l’appel international de Berlin lancé en 2003 pour la constitution et la diffusion d’archives ouvertes [1][1] Ces deux initiatives sont résumées dans les grandes..., le mouvement OAI (Open Archive Initiative) s’accélère : le nombre de sites d’archives ouvertes a triplé entre 2008 et 2009?[14] [15].

3

Les pratiques des chercheurs restent néanmoins disparates. Si les astrophysiciens, avec la fameuse base ArXiv, ont très tôt compris l’intérêt des archives ouvertes et se sont rapidement et massivement approprié cet outil, cela est moins sensible dans les champs des sciences humaines et sociales (SHS), tant du côté des publiants que de celui des lecteurs?[5].

4

À l’heure où la question de l’utilisation des archives ouvertes à des fins d’évaluation scientifique est discutée?[1], il paraît légitime de s’interroger sur la représentativité de l’activité scientifique relative à un champ de recherche, d’une part dans les archives ouvertes et d’autre part dans les banques de données commerciales. La présence des articles dans ces deux types de base dépendant en partie des pratiques des chercheurs, comment envisager le dynamisme et appréhender les thématiques de recherche émergentes d’un domaine d’études donné ?

5

Dans cet article, nous présentons les choix méthodologiques et les résultats d’une expérience consacrée à l’étude de l’état de la recherche dans le domaine des sciences de l’information et de la communication (SIC) en France. Nous nous sommes intéressées à la représentation qui peut en être construite à partir d’une banque de données commerciale et d’une archive ouverte.

6

Notre objectif de recherche est ici d’envisager si, devant l’essor des formes de publication en accès libre, les banques traditionnelles donnent toujours une représentation satisfaisante des activités de recherche en SIC ou si, a contrario, il devient incontournable de prendre en compte les archives ouvertes pour avoir une vision réaliste de la recherche en SIC. Même si ces réservoirs sont dissemblables sur certains points (notamment l’alimentation), il nous a semblé intéressant d’appréhender les différences et les recouvrements entre ces deux canaux de diffusion et de déterminer s’il existe une superposition des thématiques de recherche qui en ressortent.

1 - Archives ouvertes et pratiques des chercheurs : état de l’art

7

Entre 2006 et 2008, une politique active de coordination et de valorisation a été menée en France dans les universités et les unités de recherche en faveur de l’utilisation de la plateforme Hyper Articles en Ligne [2][2] http://hal.archives-ouvertes.fr (site consulté le ...?[2]. Aussi, moins de dix ans après son lancement, HAL arrive onzième du classement mondial des dépôts institutionnels?[1]. Ce dépôt permet aux chercheurs eux-mêmes de mettre à disposition gratuitement leur production via des portails thématiques (par sujet, par manifestation scientifique, etc.) ou institutionnels.

8

Il s’agit de l’un des modèles de libre accès à l’information scientifique (appelé également « voie verte »), les revues pouvant être elles-mêmes en accès libre (« voie or »), soit par choix politique, soit grâce au modèle de l’auteur-payeur. Cette distinction est souvent peu connue des lecteurs de ce type de littérature puisque transparente pour eux. En outre, les revues peuvent mettre à disposition gratuitement tout ou partie de leurs articles, soit dès leur parution, soit en accès différé (selon le principe d’une « barrière mobile ») [3][3] Les revues en accès libre sont recensées dans le Directory....

Un succès technique à relativiser

9

Bien que cette initiative soit une réussite incontestable sur le plan technique, son succès politique, notamment en terme de coordination, est contrasté, en partie du fait des spécificités de la recherche publique française et de son mode de fonctionnement?[7]. Par ailleurs, même si l’appropriation et l’utilisation de l’outil par les auteurs prennent de l’ampleur, comme le reflète la croissance exponentielle du nombre de documents stockés (articles, thèses, rapports de recherche, etc.), il convient de nuancer cet enthousiasme technophile.

10

Les pratiques des auteurs en matière d’auto-archivage sont en effet encore peu répandues : en 2007, le nombre de documents sur HAL était estimé ne représenter qu’environ 15 % du nombre total des publications françaises d’articles scientifiques?[2]. En outre, plutôt qu’une solution globale pour toute la recherche française, se confirme aujourd’hui la nécessité de « raisonner par discipline », les solutions appropriées pour les champs de recherche en sciences dures, techniques et médecine paraissant peu ou pas adaptées pour les sciences de l’homme et de la société?[9] : à contextes et logiques différents, solutions différentes.

Des bénéfices pourtant certains

11

Les avantages liés à l’utilisation des archives ouvertes ont toutefois été démontrés par de nombreux travaux, entre autres?[11] [3] [12] [4], que ce soit pour les institutions, les domaines de recherche mêmes, les auteurs, les lecteurs (chercheurs et citoyens) ou encore les organismes de financement de la recherche.

12

Les bénéfices de la publication scientifique en accès libre sont multiples et de plusieurs ordres. Ils concernent notamment l’immédiateté et la facilité de diffusion des savoirs, la visibilité des publications qui en découle ainsi que l’accroissement de leur accessibilité (qui induit un meilleur taux de citation, avec un gain évalué entre 25 et 250 %). Par ailleurs, les entrepôts de données garantissent la pérennité des informations et un horodatage des documents pouvant contribuer à la protection de la propriété intellectuelle. En outre, la mise en ligne des productions scientifiques autorise une diffusion des connaissances vers le grand public et les pays en voie de développement. Enfin, dans un autre ordre d’idées, les archives ouvertes peuvent permettre la mise en place de nouveaux indicateurs de la recherche, centrés davantage sur les utilisateurs.

13

Ainsi, depuis une quinzaine d’années, la webométrie permet de décrire quantitativement les processus de publication scientifique en ligne en se basant sur des données publiques, accessibles à tous, indépendamment des bases traditionnelles de citations. Trois types d’indicateurs peuvent être envisagés?[1] : ceux concernant les activités relatives (dépôts effectués par les auteurs, par institution, par sujet), ceux portant sur les usages (visites, visiteurs, téléchargements) et ceux relatifs à la visibilité (citations et hyperliens).

Des freins de plusieurs ordres

14

Malgré tout, comme le souligne notamment Beaud?[3], le succès relatif des archives ouvertes en France peut être expliqué par plusieurs facteurs de différentes natures. En premier lieu, citons la culture institutionnelle, qui influence (positivement ou non) l’utilisation des archives ouvertes et l’autoarchivage. Par ailleurs, l’engagement de la direction des institutions dans ce domaine et la façon dont elle communique jouent également un rôle majeur dans l’appropriation de l’outil par les chercheurs?[2] : les pratiques en matière d’information, d’accompagnement, d’incitation (voire d’obligation dans certains cas) sont évidemment déterminantes.

15

Du côté des chercheurs, plusieurs freins sont possibles. Diverses raisons peuvent expliquer qu’ils hésitent à s’écarter des circuits traditionnels de l’édition scientifique?[3]?[4] :

  • des aspects juridiques mal connus (propriété intellectuelle, droit d’auteur, position des éditeurs, etc.) ;

  • un sentiment, plus ou moins justifié, de faible mobilisation de la part de la hiérarchie de l’institution, voire l’absence de politique claire à ce sujet ;

  • la méconnaissance du mouvement et des projets d’archives ouvertes et, conséquemment, un déficit de crédibilité scientifique et de prestige ;

  • la crainte du plagiat ;

  • la non-évaluation des dépôts et l’absence de validation scientifique et, pour certains, un attachement au modèle « peer review » auquel ils sont habitués ;

  • le manque de temps, la perception d’une contrainte professionnelle supplémentaire inutile.

Peuvent aussi être évoqués les aspects techniques et le manque de formation à l’utilisation des outils.

Des pratiques marquées selon les domaines

16

Dans tous les cas, l’appropriation des archives ouvertes par les chercheurs, tant comme contributeurs que comme utilisateurs, est disparate. Bien que la production scientifique en France soit globalement significative, de très nettes différences existent, selon les champs disciplinaires, dans les pratiques de publication ouverte. Les freins invoqués ci-dessous sont probablement plus marqués en sciences humaines et sociales qu’en sciences exactes. Cela s’explique en partie par la prédominance de l’anglais comme langue de recherche en sciences exactes, plus prégnante qu’en SHS. En conséquence, de nombreuses revues à comité scientifique et relecteurs francophones ont disparu depuis la fin des années 1990, souvent absorbées par des revues internationales anglophones pour lesquelles coexistent plusieurs politiques d’accès ouvert à l’information scientifique en ligne?[2].

17

Le modèle auteur-payeur offre un accès gratuit pour les lecteurs, les frais d’édition étant pris en charge par l’institution des auteurs. D’autres éditeurs proposent également un accès « hybride », soit à une partie des articles (par exemple pendant les quinze jours suivant leur publication, ou encore aux plus anciens). Or, il est fréquent en SHS (notamment en raison d’une temporalité de la recherche différente) que les auteurs valorisent leurs travaux dans des ouvrages plutôt que par le biais d’articles. En outre, la publication électronique n’a fait son apparition que depuis relativement peu de temps dans l’univers des SHS (moins de dix ans), contrairement à des disciplines comme la physique nucléaire.

18

Néanmoins, que ce soit dans les domaines de la numérisation d’articles anciens, de la publication électronique ou de la mise à disposition de corpus pour les chercheurs en sciences sociales, des initiatives et structures comme le Très Grand Équipement Adonis [4][4] Accès unifié aux données et documents numériques des... et le Centre pour l’édition électronique ouverte (Cléo [5][5] http://cleo.cnrs.fr (site consulté le 17/01/11).) visent à réduire cette « fracture numérique » entre les sciences dures et les SHS.

19

Soulignons en outre que cette disparité de pratiques est également avérée au sein même des sciences exactes. Ainsi, par exemple, dans le domaine biomédical l’appropriation par les chercheurs d’un modèle de publication ouvert ne va pas non plus de soi [8]. Au contraire, plusieurs tentatives en ce sens, notamment une initiée par la fameuse revue Nature, ont échoué. Les travaux de Bégault [4] portant sur les chercheurs en sciences de l’ingénieur vont dans le même sens.

20

Malgré tout, l’auto-archivage et l’utilisation des archives ouvertes en SHS semblent sur la bonne voie et progressent de manière significative chaque année?[2]. Ainsi, comme le montre la recherche menée par Bourrion et al.?[6] dans le domaine des lettres et sciences humaines, les trois quarts des chercheurs interrogés se déclarent prêts à déposer leur production sur une archive ouverte.

21

Pour conclure, à notre connaissance, les travaux de recherche s’intéressant au libre accès à la littérature scientifique portent essentiellement sur l’appropriation des archives ouvertes par les chercheurs (pratiques de consultation et de dépôt) ainsi que sur l’impact de l’auto-archivage sur la visibilité de la recherche (indicateurs). Nous n’avons pas trouvé d’étude abordant la question de la représentativité d’un domaine de recherche à partir des archives ouvertes. Dans ce contexte, il nous a paru intéressant et original de nous intéresser aux recouvrements possibles entre une archive ouverte et une base commerciale.

2 - Une expérience en sciences de l’information et de la communication

Délimitation du périmètre de l’étude et choix des sources

22

Pour cette étude, nous avons adopté une démarche quantitative et travaillé sur un ensemble de notices bibliographiques relevant des sciences de l’information et de la communication (SIC) en France. À notre connaissance, ce champ n’a pas encore fait l’objet de recherche spécifique concernant l’auto-archivage.

23

Afin de pouvoir repérer les différents thèmes émanant de notre corpus, il était important de disposer, pour chaque document, d’informations provenant de l’indexation, par exemple des indices de classement, des descripteurs, etc. Comme d’autres auteurs, notamment Roche [13], nous pouvons souligner la pauvreté des plans de classement de la plupart des banques de données et des archives ouvertes. Les analyses portant sur de hauts niveaux d’agrégation, c’est-à-dire sur un découpage disciplinaire général, ne permettent pas d’identifier finement des axes de recherche spécifiques.

24

C’est pourquoi notre choix s’est porté, plutôt que sur HAL-SHS, sur @rchiveSIC [6][6] http://archivesic.c-csd.cnrs.fr (site consulté le ..., une archive ouverte en sciences de l’information et de la communication présentant un plan de classement thématique plus détaillé. Concernant les bases commerciales, nous avons opté pour Francis [7][7] www.inist.fr/spi-p.php?article23 (site consulté le..., banque de données française spécialisée en sciences humaines et sociales produite par l’Institut de l’information scientifique et technique (Inist) du CNRS, qui utilise un vocabulaire contrôlé pour l’indexation ainsi qu’un plan de classement. @rchiveSIC ayant vu le jour en mai 2002, la majorité des articles déposés ont été publiés à partir de 2000. Nous avons par conséquent choisi d’interroger Francis sur cette même période.

Constitution et présentation du corpus

25

En avril 2009, le moissonnage de la base @rchiveSIC dans son intégralité par le protocole OAI-PMH a permis de constituer un ensemble de 1 008 notices au format XML selon le standard du Dublin Core. Concernant la banque de données Francis, l’extraction des références pertinentes pour le domaine choisi a nécessité l’examen approfondi de son plan de classement. Deux catégories ont retenu notre attention : la catégorie « Sciences de l’information » et celle intitulée « Sociologie de la communication et des mass média / Linguistique ». Nous avons interrogé ces deux catégories pour la période 2000-2009 en imposant la contrainte suivante : qu’au moins l’un des auteurs soit affilié en France. Nous avons ainsi colligé 3 952 notices. Notre corpus total est donc constitué de 4 960 notices, référençant en grande majorité des publications en français (les autres langues représentant environ 8 % pour @rchiveSIC et 18 % pour Francis).

26

Par ailleurs, la nature des publications diffère d’une base à l’autre. En effet, si plus des deux tiers des publications de Francis sont des articles parus dans des revues à comité de lecture, une plus grande variété de types de publications est présente sur @rchiveSIC, comme le montre la figure 1.

Figure 1 - Distribution des publications dans @rchivesic et Francis selon leur typeFigure 1
27

Certains des articles référencés par Francis sont également auto-archivés dans @rchiveSIC. Cette répartition corrobore les freins évoqués dans la section précédente et montre que les auteurs sont plus enclins à déposer sur les archives ouvertes des articles relevant de manifestations scientifiques que d’autres types de publications. Les raisons peuvent être de plusieurs ordres. Cela peut être en partie dû à une plus grande souplesse (réelle ou supposée) des comités scientifiques des colloques et conférences en matière de diffusion des productions et des droits afférents. Par ailleurs, comme évoqué par Bégault [4], les chercheurs peuvent considérer qu’il s’agit de renforcer la diffusion d’un travail préalablement validé et présenté à la communauté scientifique, à la différence d’une prépublication non évaluée.

Repérage des doublons

28

À l’aide d’un script informatique, nous avons repéré les recouvrements de notre corpus total, soit les articles présents conjointement dans les deux réservoirs. Procédant par comparaison de chaînes de caractères, ce script attribue un score de similarité entre une notice d’@rchiveSIC et une référence de la banque Francis. Les champs analysés pour le calcul de ce score sont les champs titre et auteurs. Nous avons ainsi identifié 71 « doublons », ce qui correspond à 7,04 % des documents provenant d’@rchiveSIC et à 1,80 % des références provenant de Francis. Ainsi notre corpus comporte 4 889 documents distincts (corpus total de 4 960 minoré des 71 doublons).

3 - Étude thématique du corpus : méthodologie

29

Dans les études scientométriques, la caractérisation thématique des corpus se fait généralement par l’affectation de sujets aux articles en fonction des revues dans lesquelles ils sont publiés et non en fonction du contenu même des articles. Cela peut entraîner un certain nombre de confusions et imprécisions. Notre objectif ici est de déterminer dans quelle mesure un autre type de caractérisation est possible. Nous proposons d’adopter le point de vue des fournisseurs des bases, c’est-à-dire d’utiliser comme point d’entrée les plans de classement.

30

Ceux d’@rchiveSIC et Francis étant différents en termes de catégories proposées et de profondeur, la comparaison s’avère délicate (tableau 1). Nous avons donc dû aligner les catégories, c’est-à-dire rechercher des correspondances entre ces deux plans de classement. Nous avons par exemple observé que la classe « Aspects juridiques : propriété intellectuelle, responsabilité du producteur. Éthique » de Francis est proche de la catégorie « Droit de l’information/communication » présente dans @rchiveSIC.

Tableau 1 - Caracteristiques comparees des plans de classement de @rchivesic et FrancisTableau 1
31

L’alignement des classes demeure cependant une opération difficile, certaines catégories de l’une des sources se retrouvant morcelées dans plusieurs catégories de l’autre, particulièrement pour la partie documentation et sciences de l’information. Ainsi, par exemple, Francis regroupe des thématiques qu’@rchiveSIC sépare, comme la muséologie, le cinéma, l’art et l’esthétique.

32

Malgré tout, nous avons pu exploiter statistiquement les données pour chaque base puis nous avons comparé les résultats issus des deux sous-corpus. Pour les deux sources, nous avons procédé à un double décompte des publications pour chaque catégorie : d’une part un compte de présence, d’autre part un compte fractionnaire. Pour le compte de présence, un article présent dans n catégories compte pour 1 dans chaque catégorie. Le compte fractionnaire est pondéré, un article présent dans n catégories comptant pour 1/n dans chacune des catégories concernées. Ces décomptes ont été effectués pour la totalité des documents des deux sources et pour les documents de l’intersection, c’est-à-dire des documents présents des deux côtés.

4 - Étude thématique du corpus : résultats

Des logiques d’indexation différentes

33

L’analyse thématique des documents de l’intersection met en exergue des pratiques et des logiques d’indexation différentes pour les deux bases. Cela était prévisible compte tenu de leur nature. En effet, bien que les deux référentiels proposent un panel de catégories identiques, celles-ci ne sont pas affectées de façon symétrique.

34

La catégorie « Communication et information scientifique » en est un bon exemple. Cette catégorie d’@rchiveSIC indexe 22,30 % des documents communs aux deux sources alors qu’elle n’est pas employée par les indexeurs de Francis. Par ailleurs, les documents retrouvés pour cette catégorie d’@rchiveSIC traitent en grande partie de la problématique de l’édition scientifique sur support électronique ou des archives ouvertes et se retrouvent majoritairement pour Francis dans la classe « Édition, diffusion et reproduction de l’information », voire plus précisément dans la sous-catégorie « Diffusion de l’information (Archives ouvertes, Open access, etc.) et fourniture de documents ».

35

En outre, bien que certaines catégories soient représentées de manière à peu près équivalente pour les deux bases étudiées, des nuances d’indexation significatives persistent (tableau 2). Francis favorise davantage la visibilité de la production en documentation et sciences de l’information, conséquence d’un plan de classement détaillé en sciences de l’information et de la recommandation pour les indexeurs de trancher pour un unique code de classement. La plate-forme @rchiveSIC autorise quant à elle l’affectation d’un document dans plusieurs sous-domaines. Ceci améliore la visibilité des thématiques relevant des sciences de la communication (économie, industries culturelles, éducation et formation, etc.).

Tableau 2 - Extrait de la repartition thematique des articles de l’intersection pour chaque source (compte fractionnaire)Tableau 2

Des divergences thématiques

36

L’un de nos objectifs est de déterminer les thématiques de recherche émanant de chaque source et de quantifier la proportion de documents s’y rattachant afin d’apprécier les différences thématiques existant entre les deux sources. Compte tenu des différences de plan de classement et des logiques d’indexation énoncées précédemment, la comparaison thématique des deux sources par alignement des catégories reste délicate.

37

C’est pourquoi il nous a semblé plus judicieux de comparer pour chaque source, selon son propre modèle d’indexation, l’image thématique renvoyée pour l’ensemble de ses documents avec l’image obtenue pour les documents de l’intersection (documents communs aux deux sources). Dans le cas où aucune différence majeure n’apparaîtrait, c’est-à-dire si les images obtenues se révélaient semblables, nous pourrions conclure que les images renvoyées par les documents de l’intersection représentent bien les thématiques de chaque source et que dans ce cas il existe bien une superposition thématique entre les deux sources. Dans le cas contraire, les différences entre les images renvoyées nous permettront d’appréhender quelles sont les divergences entre les deux réservoirs.

38

Aussi, pour chacune des deux sources étudiées, avons-nous évalué par un test d’ajustement du khi-deux [8][8] Le test d’ajustement du khi-deux permet de vérifier... l’hypothèse d’une répartition thématique équivalente pour l’intersection et pour chaque source. Pour ce faire, nous avons utilisé le décompte des publications en compte de présence et, conformément aux recommandations usuelles, fixé à 5 le seuil des valeurs permettant ce calcul.

39

Ainsi, pour chaque catégorie C des deux sources, nous avons calculé les effectifs théoriques grâce à la formule suivante [9][9] Par « nombre de valeurs » nous entendons ici «?nombre... :

40
41

La majorité des effectifs théoriques sont supérieurs à cinq. En cas d’effectifs inférieurs, nous avons procédé à des regroupements. Le tableau 3 présente les résultats obtenus pour le calcul des effectifs théoriques pour chaque catégorie @archiveSIC (ou regroupement de catégories).

Tableau 3 - Calcul des effectifs theoriques pour la source @rchivesicTableau 3
42

Pour ces deux tests, les valeurs de khi-deux sont très élevées, et nous pouvons rejeter les hypothèses de répartition équivalente dans l’intersection et chacune des sources avec un risque d’erreur inférieur à 0,1 %. L’ensemble formé par les documents communs aux deux sources n’est donc pas un échantillon représentatif de chacune d’elles.

43

Concernant @rchiveSIC, les catégories contribuant à la valeur de khi-deux élevée sont par ordre décroissant?: «?Documentation?», «?Communication et information scientifique?» et «?Édition électronique?». Dans ces trois cas, les effectifs observés dans l’intersection sont plus importants que leurs effectifs théoriques (tableau 4). Cela indique que ces thématiques sont bien représentées dans la banque de données Francis. Dans une moindre mesure, trois autres catégories participent à la forte valeur de khi-deux?: «?Éducation, formation?», «?Cinéma, art, esthétique?» et «?Organisation et communication?», pour lesquelles les effectifs observés sont inférieurs aux valeurs théoriques. Cela signifie que les documents émanant de ces catégories ne sont pas bien (voire sont mal) référencés dans notre export de Francis.

Tableau 4 - Valeurs de khi-deux par case pour les donnees d’@rchivesicTableau 4
44

Plusieurs hypothèses peuvent expliquer ce phénomène : soit les documents auto-archivés dans @rchiveSic pour ces thématiques sont majoritairement issus de la littérature grise (rapports, actes de colloque, etc.) et, pour cette raison, nous ne les retrouvons pas dans la banque Francis ; soit ils se retrouvent classés dans d’autres catégories de Francis non explorées dans notre étude. Il se peut également que Francis couvre mal ces thématiques.

45

Le test de khi-deux sur les données de Francis fait apparaître les thématiques sur-représentées ou au contraire sous-représentées dans l’archive ouverte étudiée. Ainsi il met donc en évidence des pratiques d’auto-archivage différentes selon les thématiques.

46

Une classe contribue à elle seule à 78 % de la valeur du khi-deux (tableau 5). Il s’agit de la classe « Édition, diffusion et reproduction de l’information », pour laquelle l’effectif observé est très largement supérieur à l’effectif théorique, en particulier pour la sous-catégorie « Diffusion de l’information (Archives ouvertes, Open access, etc.) et fourniture de documents ». La catégorie « Sciences de l’information et des bibliothèques. Étude d’ensemble » (troisième valeur de khi-deux par case) admet elle aussi un effectif observé supérieur à l’effectif théorique.

Tableau 5 - Valeurs de khi-deux par case pour les donnees de FrancisTableau 5
47

L’édition libre et électronique (archives ouvertes, communication et information scientifique, diffusion de l’information) ainsi que la documentation (sciences de l’information et des bibliothèques) sont donc des thématiques de Francis sur-représentées dans l’intersection. Pour ce corpus, 22 % des publications relevant de l’édition électronique et 14 % des publications en documentation se retrouvent auto-archivés dans @rchiveSic. Ceci signifie que les auteurs d’articles relevant de ces thématiques auto-archivent plus volontiers leur production scientifique, y compris des documents publiés dans les circuits traditionnels de l’édition scientifique et bien référencés par l’Inist. Ces auteurs, par la spécificité de leurs thématiques de recherche, sont particulièrement sensibilisés aux possibilités offertes par les archives ouvertes et aux impacts sur la visibilité de la recherche.

48

Trois catégories aux effectifs observés inférieurs à la théorie retiennent également notre attention par leurs valeurs de khi-deux par case élevées. Il s’agit de « Sociologie de la communication et des mass media. Linguistique » (deuxième valeur de khi-deux par case) puis de « Aspects juridiques : propriété intellectuelle, responsabilité du producteur. Éthique » et « Organismes documentaires ». Ces catégories sont faiblement représentées dans l’intersection au regard de leurs places dans l’ensemble de la source. Avec des taux d’auto-archivage autour de 0,5 % pour ces thématiques, nous serions tentées de conclure à une faible pratique de dépôt dans les archives ouvertes par les auteurs concernés. Cependant, si le droit de l’information et de la communication a effectivement une faible part de publications dans @rchiveSIC (moins de 1,17 %), la sociologie apparaît comme la troisième catégorie d’@rchiveSIC avec presque 8,5 % des publications en compte fractionnaire.

49

Il est alors légitime de s’étonner du faible recouvrement des publications, et d’envisager soit l’hypothèse d’un dépôt de massif de documents issus de la littérature grise pour cette catégorie, soit d’un faible recouvrement des sources d’information pour les deux réservoirs.

4 - Conclusion et perspectives

50

Ce travail de recherche visait l’étude de la représentativité de la recherche française en sciences de l’information et de la communication à travers une archive ouverte et une base de données commerciale, l’identification de recouvrements entre ces canaux de diffusion et la comparaison des images thématiques renvoyées.

51

L’étude menée sur les bases Francis et @rchiveSIC a permis de mettre en évidence un très faible taux de recouvrement entre ces deux sources. À peine 1,8 % des documents référencés dans Francis sont auto-archivés dans @rchiveSIC, ce qui est nettement inférieur aux pratiques d’auto-archivage observées en sciences dures ou encore dans certains domaines des sciences humaines et sociales [2]. D’autre part, cette recherche confirme l’intérêt des archives ouvertes comme source d’information : notre expérience montre que seuls 7 % des documents d’@rchiveSIC sont référencés par Francis. Ainsi, les documents d’@rchiveSIC non référencés par Francis représentent quasiment 20 % des publications de notre corpus total (4 889 documents). Ces documents émanent de la littérature grise mais aussi des circuits de publication traditionnels.

52

Cette étude montre la richesse mais aussi toute la difficulté d’établir une analyse thématique à partir des plans de classement. Les images renvoyées sont alors dépendantes des pratiques d’indexation et des langages de représentation utilisés.

53

Cependant, au-delà des logiques de représentation propres à chaque source, les tests de khi-deux réalisés attestent l’existence de divergences thématiques importantes entre les deux sources. Le droit de l’information (7 % des publications dans Francis contre 1,17 % dans @rchiveSIC), la sociologie de la communication (23 % de publication dans Francis contre 8,41 % dans @rchiveSIC) et les aspects documentaires (institutions documentaires, gestion des services d’information) sont mieux référencés par Francis. De même, @rchiveSIC fait apparaître des axes de recherche peu présents dans Francis, comme l’éducation et la formation, le cinéma, l’art et l’esthétique ou la communication organisationnelle.

54

Ainsi, nos travaux contribuent à mieux cerner les pratiques de publication et d’auto-archivage des chercheurs en SIC.

55

Par ailleurs, bien que le libre accès soit un mouvement global et international, nous avons choisi de mener cette étude à l’échelle nationale. L’approche proposée et la méthodologie étant généralisables, elles permettront toutefois d’étudier d’autres champs disciplinaires, sur d’autres zones géographiques, à partir de données issues d’autres bases.

56

De manière plus large, cette recherche questionne les techniques d’évaluation des structures de recherche s’appuyant sur des indicateurs quantitatifs fondés sur des banques de données payantes et contribue au débat sur les indicateurs de la recherche. Toutefois, nos données datent de 2009 et la situation a probablement évolué depuis : du fait du contexte de la recherche en France et des politiques d’évaluation, les universités et laboratoires se trouvent de plus en plus dans une dynamique de visibilité qui passe par le recours à l’auto-archivage institutionnel.

57

En outre, afin de poursuivre et compléter ces travaux, il nous paraît intéressant de nous pencher sur les usages des archives ouvertes par les chercheurs. Cela pourrait être fait par le biais de l’étude de logs et d’indicateurs (notamment d’activité et de recherche d’information, comme suggéré dans [16]) ou encore grâce à une enquête qualitative menée auprès des usagers, déposants comme consultants. Cette approche permettrait entre autres de prendre en compte un troisième mode de diffusion des articles, l’auto-publication sur site Internet personnel qui, comme le souligne Wojciechowska [17], est une pratique courante dans certaines disciplines. •

58

Mars 2011


Références

  • 1 –  Isidro F. AGUILLO, José L. ORTEGA, Mario FERNÁNDEZ and Ana M. UTRILLA. «?Indicators for a webometric ranking of open access repositories?». Scientometrics, 2010, vol. 82, n° 3, p. 477-486. From the issue entitled Selected papers of the 10th International Conference on Science and Technology Indicators, 17-20 September 2008, Vienna, Austria
  • 2 –  Pierre BARUCH. «?Open Access Developments in France?: The HAL Open Archive System?». Learned publishing, 2007, vol. 20, n° 4, p. 267-282. http://hal.archives-ouvertes.fr/ hal-00176428_v1
  • 3 –  Nathalie BEAUD. Sensibilisation et motivation au dépôt en Archives Ouvertes, Étude du comportement des acteurs de l’École des Mines d’Alès. Mémoire pour le titre professionnel de chef de projet en ingénierie documentaire, Paris, Institut national des techniques de la documentation, CNAM, 2008. 120 p. http://memsic.ccsd.cnrs.fr/docs/ 00/47/65/79/PDF/BEAUD.pdf
  • 4 –  Béatrice BÉGAULT. «?Archives ouvertes?: réflexions sur leur implication dans les pratiques des chercheurs en sciences de l’ingénieur?». Intelligence collective et organisation des connaissances, 7e colloque du chapitre français de l’ISKO. 2009. http://www.isko-france.asso.fr/ pdf/isko2009/BEGAULT.pdf
  • 5 –  Hélène BOSC. «?Archives ouvertes : quinze ans d’histoire?». In?: C. Aubry et J. Janik (éd.). Les archives ouvertes : enjeux et pratiques. Guide à l’usage des professionnels de l’information. Paris?: ADBS Éditions, 2005. P. 27-54. http://archivesic.ccsd.cnrs.fr/ docs/00/11/94/41/PDF/ OuvrageOAIarchive.pdf
  • 6 –  Daniel BOURRION, Jean-Louis BOUTROY, Claire GIORDANENGO et Pascal KRAJEWSKI. Les chercheurs en lettres et sciences humaines et les archives ouvertes. Mémoire de recherche pour le diplôme de conservateur de bibliothèque, Lyon, ENSSIB, 2006. 129 p. http://halshs.archives-ouvertes.fr/ docs/00/08/60/84/PDF/ chercheurs_LSH_AO_v1.0.pdf
  • 7 –  Hans DILLAERTS. «?Analyse prospective du libre accès en France?». In?: E. Broudoux et G. Chartron (éd). Enjeux politiques du document numérique, Actes de la troisième conférence Document numérique et société, Aix-en-Provence, 15-16 novembre 2010. Paris : ADBS Éditions, 2010. P. 47-70. http://archivesic.ccsd.cnrs.fr/ docs/00/53/72/39/PDF/analyse_prospective_libre_acces.pdf
  • 8 –  Nathalie DUCHANGE, Delphine AUTARD et Nicole PINHAS. «?Le libre accès : une opportunité pour la recherche biomédicale?». Medecine sciences, 2008, vol. 24, n° 8-9, p. 771-775. http://www.edk.fr/reserve/print/ e-docs/00/00/0C/AA/ document_article.md
  • 9 –  GROUPEMENT FRANÇAIS DE L’INDUSTRIE DE L’INFORMATION. Synthèse des discussions du groupe de travail sur le libre accès. Janvier 2010. 50 p. http://www.gfii.asso.fr/article.php3?id_article=3182
  • 10 –  Thierry LAFOUGE, Yves-François LE COADIC et Christine MICHEL. Éléments de statistique et de mathématique de l’information : infométrie, bibliométrie, médiamétrie, scientométrie, muséométrie, webométrie. Cours avec exemples et exercices corrigés. 2002. Lyon : Presses de l’Enssib, 2002. 319 p. (Les cahiers de l’Enssib)
  • 11 –  Dominique L’HOSTIS et Pascal AVENTURIER. Archives ouvertes – Vers une obligation de dépôt?? Synthèse sur les réalisations existantes, les pratiques des chercheurs et le rôle des institutions. Rapport INRA. 2006. 45 p. http://archivesic.ccsd.cnrs.fr/docs/00/ 13/83/02/PDF/Note-AO-version2-051206-diff-Externe.pdf
  • 12 –  Michael NORRIS, Charles OPPENHEIM and Fytton ROWLAND. «?The citation advantage of open-access articles?». Journal of the American Society for Information Science and Technology, 2008, vol. 59, issue 12, p. 1963–1972
  • 13 –  Ivana ROCHE, Claire FRANÇOIS et Dominique BESAGNI. «?Détection de techniques prometteuses à partir de méthodes bibliométriques?». In?: CIDE 10, 10e Colloque international sur le document électronique, Nancy, 2 au 4 juillet 2007. Session Bibliométrie. 2007, mis à jour le 10/09/2008. http://hal.archives-ouvertes.fr/docs/00/31/09/71/PDF/ CIDE_2007roche_etal.pdf
  • 14 –  Joachim SCHÖPFEL et Hélène PROST. «?Les statistiques d’utilisation d’archives ouvertes. État de l’art?». In : C. Boukacem Zeghmouri (éd). L’information scientifique et technique dans l’univers numérique?: mesures et usages. Actes du colloque «?Ressources électroniques académiques : mesures & usages?», Lille, 26–27 novembre 2009. Paris : ADBS Éditions, 2011. P. 147-164. http://archivesic.ccsd.cnrs.fr/docs/00/ 48/05/38/PDF/EPEF_Schopfel_Prost_5.0.pdf
  • 15 –  Joachim SCHÖPFEL et Hélène PROST. Développement et usage des archives ouvertes en France. 1re partie?: Développement. 2010. 49 p. http://archivesic.ccsd.cnrs.fr/sic_00497389/fr
  • 16 –  Joachim SCHÖPFEL et Hélène PROST. Développement et usage des archives ouvertes en France. 2e partie?: Usage. 2010. 73 p. http://archivesic.ccsd.cnrs.fr/ sic_00527043/fr
  • 17 –  Anna WOJCIECHOWSKA. «?Analyse d’usage des archives ouvertes dans le domaine des mathématiques et de l’informatique?». Documentaliste – Sciences de l’information, 2006, vol. 43, n° 5-6, p. 294-302. http://www.adbs.fr/servlet/ com.univ.collaboratif.utils.LectureFichiergw?ID_FICHIER=2135

Notes

[1]

Ces deux initiatives sont résumées dans les grandes lignes page 24 de la Synthèse des discussions du groupe de travail sur le libre accès [9].

[2]

http://hal.archives-ouvertes.fr (site consulté le 17/01/11).

[3]

Les revues en accès libre sont recensées dans le Directory of Open Access Journal (DOAJ), www.doaj.org (site consulté le 17/01/11).

[4]

Accès unifié aux données et documents numériques des sciences humaines et sociales, www.tge-adonis.fr (site consulté le 17/01/11).

[5]

http://cleo.cnrs.fr (site consulté le 17/01/11).

[6]

http://archivesic.c-csd.cnrs.fr (site consulté le 17/01/11).

[7]

www.inist.fr/spi-p.php?article23 (site consulté le 17/01/11).

[8]

Le test d’ajustement du khi-deux permet de vérifier si un échantillon observé peut être considéré comme extrait d’une population donnée. À ne pas confondre avec le test d’indépendance du khi-deux qui teste si deux caractères d’une population sont indépendants [10].

[9]

Par « nombre de valeurs » nous entendons ici «?nombre de fois où les catégories de la source ont été affectées aux articles », un article pouvant être indexé par plusieurs catégories. Les catégories @archiveSIC ont été utilisées 1?915 fois pour indexer les 1?008 documents d’@rchiveSic et 155 fois pour les 71 documents de l’intersection.

Résumé

Français

Cet article présente une étude comparée de la visibilité de la recherche française en sciences de l’information et de la communication dans deux sources distinctes. Elle est fondée sur une analyse bibliométrique de corpus textuels constitués de notices bibliographiques issues d’une archive ouverte (@rchiveSIC) et d’une banque de données commerciale (Francis). Le propos de Stéphanie Pouchot et Camille Prime-Claverie est d’examiner si, devant l’essor des formes de publication en accès libre, les banques traditionnelles donnent toujours une représentation satisfaisante de la recherche en SIC ou si, pour en avoir une vision pertinente, il est désormais indispensable de prendre en compte les archives ouvertes.

English

Bibliometric overview of information and communication science researchThis article presents a comparative study of the visibility of French information and communication science research in two distinct sources. It is based on a bibliometric study of bibliographic entries from an open archive (@rchiveSIC) and a commercial databank (Francis). In light of the boom in different forms of open access publications, the authors examined whether traditional databanks are still providing satisfactory coverage of ICS research or whether open access archives are a necessary complement to ensure relevance.

Español

¿Qué imágenes bibliométricas de la investigación en CIC?Este artículo presenta un estudio comparado sobre la visibilidad de la investigación francesa en ciencias de la información y de la comunicación en dos fuentes distintas. Se basa en un estudio bibliométrico de curpus textuales formados por noticias bibliográficas emitidas por un archivo abierto (@rchiveSIC) y una base de datos comercial (Francis). El propósito de las autoras es analizar si, ante el desarrollo de las formas de publicación de acceso libre, las bases de datos tradicionales representan satisfactoriamente a la investigación en CIC en todo momento o si, por tener una visión pertinente, de ahora en adelante es imprescindible tener en cuenta los archivos abiertos.

Deutsch

Welche bibliometrischen Bilder der Recherche im Bereich IuK-Wissenschaften?Dieser Artikel stellt eine vergleichende Studie über die Sichtbarkeit der französischen Forschung im Bereich der Informations- und Kommunikationswissenschaften in zwei getrennten Quellen dar. Sie basiert auf einer bibliometrischen Studie von Textkorpora bestehend aus bibliographischen Daten aus einem offenen Archiv (@rchiveSIC) und einer kommerziellen Datenbank (Francis). Der Zweck der Autoren ist es zu prüfen, ob traditionelle Datenbanken immer noch eine befriedigende Darstellung der Forschung im Bereich der Informations- und Kommunikationswissenschaften geben, oder ob es für einen relevanten Überblick jetzt unumgänglich ist, offene Archive zu berücksichtigen.

Plan de l'article

  1. 1 - Archives ouvertes et pratiques des chercheurs : état de l’art
    1. Un succès technique à relativiser
    2. Des bénéfices pourtant certains
    3. Des freins de plusieurs ordres
    4. Des pratiques marquées selon les domaines
  2. 2 - Une expérience en sciences de l’information et de la communication
    1. Délimitation du périmètre de l’étude et choix des sources
    2. Constitution et présentation du corpus
    3. Repérage des doublons
  3. 3 - Étude thématique du corpus : méthodologie
  4. 4 - Étude thématique du corpus : résultats
    1. Des logiques d’indexation différentes
    2. Des divergences thématiques
  5. 4 - Conclusion et perspectives

Pour citer cet article

Pouchot Stéphanie, Prime-Claverie Camille, « Quelles images bibliométriques de la recherche française en SIC ? », Documentaliste-Sciences de l'Information 2/2011 (Vol. 48) , p. 64-73
URL : www.cairn.info/revue-documentaliste-sciences-de-l-information-2011-2-page-64.htm.
DOI : 10.3917/docsi.482.0064.


Article précédent Pages 64 - 73 Article suivant
© 2010-2014 Cairn.info
back to top
Feedback