CAIRN.INFO : Chercher, repérer, avancer.

1 Que reflètent au juste les chiffres diffusés par les services statistiques publics ? Ceux-ci sont issus de deux types de sources : les enquêtes directes (recensements, sondages…) et les registres administratifs (fichiers de gestion, répertoires…). Les « avantages » et les « inconvénients » des unes et des autres sont le plus souvent analysés en termes utilitaires, de coût et d’adéquation aux besoins supposés des utilisateurs. En revanche, est peu évoqué le fait que ces deux sources sont le produit de formes d’activités et d’enregistrements dont les buts sont très différents : pour dire vite, les enquêtes visent en principe à décrire la société, tandis que les registres, conçus à des fins de gestion, reflètent plutôt les rouages de l’État et des institutions. Ainsi, selon le point de vue utilitaire, le plus courant, les enquêtes permettent de façonner précisément les questionnements en fonction des besoins ; mais elles sont coûteuses, en argent comme en temps (notamment pour les enquêtés). De plus, les enquêtes par sondage peuvent difficilement être ventilées territorialement, compte tenu des contraintes de représentativité des échantillons. En revanche, les sources administratives sont supposées moins coûteuses (puisque déjà collectées à d’autres fins) ; souvent quasi exhaustives, elles peuvent donc être territorialisées ; mais, tributaires de définitions et de catégories réglementaires, elles diffèrent de celles dont les utilisateurs des statistiques ont besoin, et elles peuvent rendre difficiles les comparaisons, entre pays ou dans le temps.

2 La question de la répartition des sources des statistiques publiques est en général réduite à ces quelques idées. En particulier, dans un contexte marqué, d’une part, par les restrictions budgétaires et, d’autre part, par les réticences accrues des individus et des entreprises à répondre à des enquêtes, le recours à des sources administratives est fortement préconisé, notamment dans certains pays européens (Europe du Nord et Pays-Bas) [1]. S’il existe en théorie deux grandes catégories de sources statistiques, la pratique des statisticiens a conduit à les rapprocher, voire à les combiner, pour répondre à des besoins différents les uns des autres selon qu’ils sont le fait de responsables politiques, d’acteurs économiques et sociaux ou de chercheurs. Les logiques de ces combinaisons entre les deux types de sources dépendent non seulement de la diversité des contraintes techniques et des besoins, mais aussi du positionnement institutionnel des organismes producteurs d’information. Ainsi l’harmonisation européenne pousse à développer des enquêtes, puisqu’il est de plus en plus difficile de fournir des informations comparables à partir de sources administratives nationales hétérogènes. En revanche la réponse aux demandes localisées implique l’usage de telles sources, pour des raisons de coût et d’exhaustivité, en permettant notamment de moduler souplement les zonages géographiques.

3 On reprendra cette question, en examinant la portée des arguments usuels rappelés ci-dessus, puis en l’élargissant, au-delà de ces arguments certes en partie pertinents, et en l’intégrant dans une réflexion plus vaste sur le contenu cognitif et sur le rôle social des productions des institutions statistiques. Avant de préciser mieux le contenu de ces deux types de sources, on qualifiera ici provisoirement d’« enquête » une collecte effectuée par un organisme spécialisé dans la statistique, et visant à produire une information « agrégée de portée générale ». En revanche, une « source administrative » [2] est issue d’une institution dont la finalité n’est pas de produire une telle information, mais dont les activités de gestion impliquent la tenue, selon des règles générales, de fichiers ou de registres individuels, dont l’agrégation n’est qu’un sous-produit, alors que les informations individuelles en sont l’élément important, notamment pour les individus ou les entreprises concernés [3]. Les critères et les méthodes d’évaluation des qualités de ces deux types de sources, du point de vue de leurs usages premiers, sont différents. Le premier relève notamment de la théorie, bien constituée, des erreurs d’échantillonnage alors que, pour le second, aucune théorie des erreurs de portée générale n’existe encore [4].

4 En dehors même du fait que la distinction entre les deux sources est moins évidente qu’il ne peut sembler à première vue, cette confrontation fait apparaître que les façons dont ces statistiques donnent forme au monde social sont fortement dépendantes des circuits d’enregistrement et de codage, dont la distinction « enquêtes versus registres » n’est qu’un aspect parmi d’autres. La condition préalable à la production d’une statistique est la construction, cognitive et politique, d’un « espace conventionnel d’équivalence ». Or cet espace est, pour les sources administratives, fortement déterminé nationalement. Les contextes institutionnels et réglementaires nationaux conditionnent ces sources de façon encore plus directe et évidente qu’ils ne le font dans le cas des enquêtes, ce qui n’est pas sans conséquence pour la comparabilité internationale des données statistiques, une exigence de plus en plus fréquente. Les changements de réglementation perturbent la continuité des séries. Une autre demande récurrente porte sur l’évaluation des politiques publiques [5], ce qui suppose de distinguer les fins et les moyens. Or les sources administratives portent plus sur les moyens et sur les actions publiques que sur l’état de la société. Il y a là une difficulté, dont par exemple les statistiques sur la délinquance fournissent un exemple bien connu.

5 Cette question, en apparence technique si elle est présentée seulement sous son aspect « utilitaire » à travers la liste des arguments classiques, peut sembler n’intéresser que les statisticiens publics. Elle est peu abordée par les statisticiens universitaires et par les chercheurs, économistes ou sociologues, utilisateurs des données statistiques, sinon, dans quelques cas, pour signaler des lacunes ou des biais éventuels des dites données, résultant de leur origine dans des fichiers administratifs. Or, par cette entrée, on peut revisiter les statistiques publiques d’une façon inhabituelle, notamment en pensant en même temps leurs apports de connaissance et les circuits sociaux de leurs mises en forme et de leurs usages. Les récents développements des demandes de statistiques sont liés, par exemple, à trois types d’évolution de ces usages : la construction européenne, la décentralisation, et les réformes de la gestion des services publics instaurant des procédures d’évaluation quantifiée de leur efficience. Ces situations nouvelles sont des occasions de poser à nouveaux frais ces questions aussi anciennes que la statistique publique.

6 Une mise en perspective historique évoquera quelques cas où les deux types de sources ont coexisté, ou sont entrés en concurrence : les statistiques de population (état civil et recensements), les analyses de la pauvreté au xixe siècle, la mesure du chômage, la distribution des revenus et des salaires, la délinquance. Puis la façon usuelle de les confronter sera analysée et critiquée ou au moins relativisée. Ainsi, les deux sources apparaissent différentes mais complémentaires. Une notion importante est celle de répartition du travail de mise en forme (construction et mise en œuvre des catégories et des variables, codage). Ce travail peut être effectué soit en amont du système statistique (préformatage), soit au sein de celui-ci.

7 Enfin une réflexion sera menée en termes d’usages des statistiques, en reconstituant la circularité et les relations mutuelles entre façons de penser la société, actions sur celle-ci, et modes de description. Le paradoxe de cette démarche est de sembler remettre en question l’extériorité (épistémologique et sociale) de la description par rapport à l’action, qui constitue une hypothèse centrale de l’indépendance relative nécessaire de la statistique publique par rapport aux divers pouvoirs, économiques et politiques. Ainsi, la question de la dualité des types de sources n’est pas seulement technique. Elle est une façon, parmi d’autres, de faire ressortir une tension vitale, inhérente aux statistiques publiques, puisque, d’une part, leur déontologie revendique l’autonomie, mais que, d’autre part, leurs circuits de production et d’usages sont intimement inscrits dans ceux de l’action publique. De ce point de vue, les sources administratives seraient plus de nature à refléter l’action déjà existante, tandis que les enquêtes seraient seules capables d’exprimer des aspects nouveaux de la société. Il ne s’agit pas ici de fournir, de façon normative, les « bonnes réponses clé en main » à cette tension, mais d’expliciter celle-ci le plus clairement possible.

Entre administration et observation : quelques précédents historiques

8 Les mesures de population constituent le cœur historique de la statistique publique, depuis le xviiie siècle. Les flux (naissances, mariages, décès) sont mesurés à partir de l’état civil, lui-même issu, depuis 1792, des registres paroissiaux instaurés par édit royal au xvie siècle. En revanche, la population globale est mesurée à l’aide de recensements, depuis 1801. État civil et recensement : déjà semble constituée la dualité registre-enquête directe. Le recensement moderne combine un dénombrement (administratif) et une enquête sociodémographique. Au xixe siècle, il pouvait déjà être vu comme une enquête menée par des spécialistes, que l’on nommera bientôt « statisticiens ». À partir des années 1830, le recensement quinquennal a constitué la principale (sinon la seule) activité propre des nouveaux bureaux de statistique qui se multiplient à travers l’Europe, à l’instigation d’Adolphe Quetelet. Toutes les autres statistiques publiées alors par ces bureaux étaient des compilations de tableaux fournis par les principales administrations de l’État, et sous-produits de leurs activités propres. À travers les recensements de population, les statisticiens se constituent peu à peu une spécificité, et posent les bases d’une professionnalité nouvelle et originale. Ils doivent même réaffirmer régulièrement leur différence par rapport à des administrations de contrôle, notamment celle des impôts, de façon à ne pas être confondus avec celle-ci. Ceci implique la progressive formulation d’une revendication d’autonomie pour cette institution nouvelle, le « Bureau de statistique ». Celle-ci repose notamment sur la construction d’un corps de connaissances générales indépendantes d’un usage gestionnaire. On retrouvera ensuite cette exigence pour les enquêtes. Cette revendication d’autonomie, institutionnelle et cognitive, caractérise la statistique publique, un espace distinct à la fois d’une administration classique et du monde académique de production de connaissances scientifiques. Cette double distinction constitue son originalité.

9 Le recensement est une opération administrative lourde et coûteuse, impliquant le concours de nombreux acteurs, bien au-delà des seuls statisticiens. Jusqu’aux années 1930, il constituait presque la seule enquête directe effectuée par la statistique publique. À ce moment, la « relégitimation » de la méthode des sondages, discréditée tout au long du xixe siècle, transformera complètement l’activité des Instituts nationaux de statistique (INS), en leur ouvrant des possibilités très variées d’investigation directe [6]. Trois cas historiquement importants et bien documentés, la pauvreté, le chômage et la délinquance, montrent bien que l’alternative « registres versus enquêtes » n’est pas seulement un problème pratique de disponibilité et de coût des sources, mais implique des mesures de natures et de significations très différentes.

10 En Angleterre au xixe siècle, la pauvreté a été décrite, d’une part, à partir de la comptabilisation des bénéficiaires des aides distribuées par les Poor law unions, des bureaux de bienfaisance créés en 1835 et, d’autre part, grâce aux enquêtes de Charles Booth, Benjamin S. Rowntree et Arthur L. Bowley, entre 1880 et 1900. Les auteurs du temps, tels qu’Udny Yule [7], ne se posaient pas la question de la différence entre des mesures issues de l’activité de l’institution, et des mesures résultant d’observations directes. Pour eux, le réseau des Poor law unions, dont ils utilisaient les statistiques de gestion, était la boîte noire en aval de laquelle ils se situaient. D’une certaine façon, l’existence de cette institution faisait exister quantitativement la pauvreté, avant que, cinquante ans plus tard, des enquêtes la fassent exister autrement, en permettant notamment d’expliciter la notion de seuil de pauvreté.

11 Le comptage des pauvres implique au préalable leur codage, c’est-à-dire leur attribution à une classe d’équivalence. Ce travail peut être fait soit par une institution spécifique, à des fins pratiques autres que des fins de connaissance, soit par des enquêteurs-statisticiens, à partir d’une définition plus théorique et conforme à des besoins d’information. Un problème logique apparaît quand le mode de gestion de l’institution est utilisé en tant que « variable explicative » d’évaluations de la pauvreté elles-mêmes issues des mêmes données. C’est le cas dans les travaux de Yule (1895), qui utilisait la répartition entre les aides apportées dans des ateliers fermés (indoor relief) et à domicile (outdoor relief), pour « expliquer » (par une équation de régression) une pauvreté totale qui n’était autre que « l’aide totale ». Ce type de paradoxe est classique dans les travaux qui combinent registres et enquêtes.

12 Des questions analogues peuvent être soulevées à propos de l’émergence de la mesure du chômage, entre 1900 et 1950 [8]. La diffusion des bureaux municipaux d’aide aux chômeurs (ancêtres de l’Agence nationale pour l’emploi – ANPE) a donné au chômage une existence sociale et une consistance rendant celui-ci mesurable, avant que, à partir de 1950, les « enquêtes sur l’emploi » ne permettent de mesurer celui-ci autrement, selon les trois critères du Bureau international du travail (BIT) : être sans emploi, immédiatement disponible, et effectuer des recherches. Les deux types de mesure ont ensuite coexisté, de façon jugée complémentaire, la première fournissant une information conjoncturelle (les demandes d’emploi en fin de mois, DEFM), la deuxième une mesure plus structurelle, en général annuelle. Plus tard, il en est résulté un mixte composite, combinant ces deux informations en une troisième (par recalage annuel de la série mensuelle issue des DEFM sur le résultat de l’enquête sur l’emploi). Cette troisième évaluation est différente des deux premières. Elle est utilisée socialement comme indicateur du chômage.

13 Les statistiques sur les revenus et les salaires sont anciennes. Les travaux de Vilfredo Pareto et A. L. Bowley sur les revenus s’appuyaient essentiellement sur des sources fiscales, puisqu’il était admis que des enquêtes directes étaient presque impossibles à ce sujet. Elles mobilisaient donc des données administratives, recueillies à des fins qui suscitaient des soupçons de sous-estimation ou de fraude. Ceci n’a pas interdit d’en tirer des études très fines [9]. Dès 1956, l’Institut national de statistique et d’études économiques (Insee) a procédé à une « enquête sur les revenus », qui portait en fait sur un échantillon de ménages dont on utilisait les déclarations d’impôts, et ne constituait donc pas une « enquête » au sens d’enquête directe [10]. Ceci constitue un exemple de réusage après transport, contrôlé notamment par les procédures d’échantillonnage probabiliste. Un autre exemple est fourni par les statistiques de salaires, recueillies depuis le xixe siècle par des syndicats de salariés ou de patrons, à des fins de revendication, de négociation ou de régulation de ces salaires. Par ailleurs, depuis 1947, les Déclarations annuelles de salaires (DAS) faites par les employeurs à propos de leurs salariés sont exploitées par les statisticiens [11]. Ainsi trois circuits au moins ont existé pour la mesure des revenus salariaux. Ceux-ci peuvent bien sûr être confrontés dans une perspective de critique mutuelle des sources. C’est ce que font les comptables nationaux. Mais une sociologie de la production et des usages des nombres peut aussi prendre pour corpus cette diversité, en observant comment le résultat de ces travaux de synthèse circule ensuite, comme détaché de ses origines, embarqué vers de nouvelles aventures, et racontant une autre histoire mettant en scène d’autres acteurs.

14 La mesure de la délinquance est un autre cas historique de difficulté à articuler sources administratives et enquêtes. Les premières, très anciennes, remontent aux années 1820, avec le Compte général de la justice, qui publie les statistiques de l’activité des tribunaux [12]. Plus récemment, ont été utilisées aussi des statistiques de délinquance issues de l’activité de la police, de la gendarmerie et de la justice. Mais ces sources sont souvent critiquées. Elles sont vues par certains comme reflétant plus l’activité de ces services que celle des malfaiteurs et les dommages subis par les victimes. Un accroissement des statistiques de délinquance est alors perçu comme reflétant une intensification de l’effort des services chargés de protéger les individus. On parle ainsi du « trou noir » de cette statistique, constitué par les crimes et délits non enregistrés. Pour y remédier, on procède à des « enquêtes de victimation » auprès des individus, ou même à des enquêtes anonymes auprès de personnes à propos de leurs éventuels actes délictueux. Ce débat, récurrent depuis le xixe siècle, est comparable à ceux qui ont été déjà évoqués sur la pauvreté et le chômage. Certains (par exemple les ethno-méthodologues américains Aaron V. Cicourel et John I. Kitsuse [13]) vont jusqu’à défendre l’idée que les statistiques de délinquance reflètent seulement l’activité de l’appareil répressif.

15 Une vue plus subtile est que ces données reflètent l’intersection des activités de cet appareil et celles des malfrats, de même que les quantités échangées et les prix, sur le marché d’un produit, sont à l’intersection des courbes d’offre et de demande. De même, les statistiques de pauvreté utilisées par Yule en 1895, issues des fichiers de gestion des Poor law unions, peuvent être vues comme une intersection des politiques de ces institutions et de la montée de la misère dans l’Angleterre des années 1880-1900, comme le nombre de repas distribués par les Restos du cœur est au croisement de l’effort de ceux-ci et du retour de la grande pauvreté en France dans les années 1980-2000. Cette façon de voir les sources administratives permet de ne pas tomber dans le relativisme qui menace certaines lectures des ethno-méthodologues les plus radicaux. Mais elle permet aussi d’aller au-delà de l’exercice, encore fréquent, de confrontation entre sources dans une perspective purement réaliste, quantitative et unidimensionnelle, qui suppose implicitement l’existence, en amont des divers enregistrements, de quelque bon chiffre, indépendant de ses conditions de production. L’enjeu de ces débats est de se frayer un passage entre un réalisme plus ou moins naïf (réclamé avec vigueur par le public), et un relativisme induit par certains usages (critiques ou non) de la notion de « construction sociale » [14]. Les problèmes posés aux statisticiens par la confrontation entre enquêtes directes et sources administratives offrent un terrain pour étudier empiriquement et sociologiquement l’opposition, souvent vue comme purement théorique et philosophique, entre réalisme et constructivisme.

16 Ces exemples historiques ont permis un premier repérage de certaines questions soulevées par l’articulation des deux types de sources, en termes d’interprétation et d’usage, au-delà de la liste des arguments techniques usuellement mis en avant. Il faut maintenant reprendre ces arguments, et les discuter, à la lumière notamment de ces exemples. Il est maintenant nécessaire de préciser la notion de source administrative, qui n’a été évoquée ci-dessus qu’à propos de cas concrets.

Différences, continuités et combinaisons entre les deux types de sources

17 Qu’y a-t-il de commun entre, d’une part, les compilations hétéroclites de tableaux issus des différents ministères et publiés dans les annuaires statistiques jusqu’aux années 1950 et, d’autre part, les exploitations et analyses sophistiquées, effectuées désormais par les services statistiques sur des fichiers individuels transmis à ceux-ci par les administrations ? Il s’agit dans les deux cas de « sources administratives », mais la principale différence est la transmission des données individuelles aux services statistiques spécialisés. Ce tournant dans l’histoire de la statistique publique avait été anticipé par René Carmille, à partir de son expérience dans l’administration de l’armée, avant même qu’il ne crée le Service national de statistique (SNS) en 1941. Dans un livre publié en 1936 [15], il prônait un rapprochement des fichiers gérés par les diverses administrations, par le biais d’« identifiants communs », pour les individus et pour les entreprises, de façon à pouvoir apparier ces diverses informations. Ceci était rendu possible, selon lui, par les machines mécanographiques à cartes perforées (machines fabriquées par la firme Hollerith, ancêtre directe d’IBM). Ainsi, il inventait l’informatique avant que n’existent les ordinateurs. Il esquissera la mise en œuvre de ce projet, entre 1941 et 1944, dans le cadre du SNS, notamment en concevant ce qui deviendra le « numéro de Sécurité sociale » à treize chiffres. Mais la mécanographie de l’époque ne permettait pas d’aller loin dans ce sens. Par ailleurs, R. Carmille (mort à Dachau en 1945) avait aussi contribué à introduire dans le SNS la méthode des sondages, alors nouvelle, sous l’influence de Jean Stoetzel. Après la création de l’Insee en 1946, ces deux orientations (registres mécanographiques et enquêtes) semblent en concurrence. Mais, entre 1946 et 1960, les sondages sont vus par les jeunes statisticiens, formés par la nouvelle « École d’application de l’INSEE » (ancêtre de l’École nationale de la statistique et de l’administration économique, ENSAE), comme plus modernes, élégants mathématiquement et aptes à explorer une grande diversité de questions nouvelles. Ils sont alors provisoirement préférés aux « gros fichiers de Carmille », perçus comme lourds, bureaucratiques et peu innovants, techniquement et intellectuellement [16].

18 Ces perceptions relatives des deux types de sources évoluent à partir des années 1960, sous l’effet de trois évolutions de la statistique publique : 1) la diffusion de l’informatique ; 2) le rôle central joué dans les années 1960 et 1970 par la comptabilité nationale ; et 3) le corollaire de celle-ci, la mise en avant de l’idée de « coordination statistique ». Dès lors, la notion de « source administrative » est intégrée dans le système statistique public. Quand ils utilisent celle-ci, les statisticiens ne se contentent plus de reproduire telles quelles des tabulations effectuées par d’autres, mais ils traitent et transforment à leur façon le matériau fourni par ces institutions. Les Anglo-saxons regroupent sous le nom de data editing l’ensemble de ces opérations de contrôles, vérifications, apurements de fichiers, redressements et imputations diverses. À travers ces manipulations techniques, les fichiers de données individuelles des administrations sont transportés d’un monde de significations à un autre. Ils perdent leurs sens initiaux pour en acquérir d’autres, sur lesquels les statisticiens ont mis leur marque propre. C’est, notamment, le tout qui est envisagé en tant que tel, et non plus les individus, chacun pour leur compte, comme c’est le cas par exemple pour un fichier d’ayants droit.

19 La transmutation évoquée ci-dessus n’est pas seulement symbolique et sémantique, elle est aussi matérielle, à travers cette notion de data editing (dont il n’existe pas de mot français vraiment équivalent). Elle est enfin et surtout coûteuse, en argent, en temps de travail et en matière grise, ce qui relativise l’idée, qui reste répandue, que les sources administratives sont « économiques », en ce qu’elles éviteraient le coût du recueil initial, comme si « il n’y avait qu’à se baisser pour les cueillir ». Le réusage des sources administratives est en fait un lourd investissement. L’idée de sa quasi-gratuité est une idée largement fausse. En revanche, sa couverture extensive, souvent proche de l’exhaustivité, permet en principe des découpages territoriaux modulables de façon souple grâce à la diffusion de la micro-informatique, sous réserve toutefois du respect de règles strictes de confidentialité, qui interdisent les découpages géographiques trop fins.

Diverses manières de combiner enquêtes et registres

20 Mais le problème de « l’économie relative » des deux modes de collecte peut être formulé autrement, dès lors qu’est posée la question de la répartition technique et sociale du travail de mise en forme, c’est-à-dire de mise en œuvre des conventions d’équivalence. Cette mise en forme de l’information peut être faite à différentes étapes d’un long processus, et impliquer des transformations successives, soit en amont de la collecte statistique, soit au cours de celle-ci, soit en aval dans les diverses phases de data editing et de synthèse. Ainsi, des services statistiques de certains ministères effectuent des « enquêtes » auprès d’établissements de santé ou d’éducation, en rassemblant des informations sur leurs activités déjà enregistrées et mises en forme par ceux-ci. Plus généralement, les enquêtes statistiques menées auprès des entreprises recueillent des informations sur les comptabilités ou sur la main-d’œuvre déjà formatées par la gestion interne de celles-ci [17]. De même, l’« Enquête revenus », issue d’un échantillonnage de réponses à l’enquête sur l’emploi, auxquelles sont appariées les déclarations d’impôt des ménages correspondants, est, en partie, un sous-produit d’une source administrative, et non une enquête au sens courant du terme. En effet, dans ces divers cas, le mot « enquête » a un sens assez différent de celui où une information non encore formatée est recueillie. Il y donc un continuum lié à la répartition de ce travail de mise en forme, le long d’une longue chaîne, où par exemple les comptables nationaux viennent ensuite, apporter une nouvelle étape de transport-transformation de l’information.

21 La continuité entre les deux formes de collecte et de mise en forme des données peut être vue aussi en termes de sociologie des organisations. En effet, le Système statistique français est organisé à partir d’une institution centrale, l’Insee, et des Services statistiques ministériels (SSM) qui regroupent près de 40 % des statisticiens publics. Or le problème récurrent de ces derniers est de pouvoir intervenir le plus en amont possible dans l’organisation des systèmes d’informations des ministères, pour pouvoir faire prendre en compte leurs besoins propres (définition des variables, nomenclatures…). Ceci dépend du type de coopération et d’échanges mutuellement utiles qu’ils parviennent à instaurer avec les autres services de leurs ministères [18].

22 Un autre point de vue sur le continuum « enquêtes versus registres » est possible si, dans ce couple, on dirige maintenant l’attention, du côté du pôle « enquêtes », vers le travail des enquêteurs. Ceux-ci portent en effet sur leurs épaules une partie du travail de mise en forme évoqué ci-dessus, notamment en faisant rentrer la diversité parfois incommensurable des situations rencontrées dans le lit de Procuste des questionnaires. Le coût (psychologique ou simplement en temps passé) de cet alignement est souvent non négligeable [19]. L’interaction entre l’enquêteur et l’enquêté n’est pas la même selon les types de questions. Une gamme de cas existe. On peut en mentionner trois : 1) questions d’opinion ; 2) questions « factuelles » n’impliquant pas en principe de recherche spéciale par l’enquêté ; 3) questions nécessitant l’aide de documents, administratifs ou non (bulletins de paie, documents de Sécurité sociale, ordonnances de médecin, factures, tickets de caisse…). Dans les deux premiers cas, l’informateur d’origine est l’enquêté. En revanche, le troisième cas a quelque chose en commun avec les situations d’enquêtes auprès des entreprises, où sont demandés des comptes et des bilans. Dans ce cas, le travail de l’enquêteur est d’aider l’enquêté à éplucher les documents écrits, et à les traduire dans le langage du questionnaire.

23 Cette notion d’« informateur » a l’intérêt de rappeler l’évolution historique de certaines enquêtes par sondage, celles qui portaient sur les prévisions de production agricole dans le contexte américain des années 1920 et 1930 [20]. À l’origine, les « informateurs » étaient des fermiers supposés bien connaître leurs voisins et collègues, au nom desquels ils parlaient après les avoir consultés. Cet informateur était alors à la fois enquêteur et enquêté. La « représentativité » était du même ordre que celle de l’informateur d’un anthropologue étudiant une population d’Indiens d’Amazonie. L’informateur parle au nom des membres de la tribu, et transmet à l’anthropologue une information traduite (dans tous les sens du mot) dans la langue de celui-ci. Dans le cas des fermiers américains, des procédures d’échantillonnage aléatoire ont ensuite été progressivement mises en place, dans les années 1930. L’informateur est devenu un enquêté, ne parlant plus qu’en son nom propre. Sa parole est désormais généralisée du fait de son choix aléatoire, et non plus du fait qu’il suscitait la confiance de ses voisins et des émissaires du ministère de l’Agriculture. Une forme de représentativité, celle de l’échantillon aléatoire, en a remplacé une autre, celle de l’informateur bien choisi plus proche de l’élu porte-parole de ses électeurs [21]. Ce passage implique notamment une standardisation des questionnaires, les rapprochant ainsi de formulaires administratifs, et une redistribution du travail de mise en forme.

24 Toute l’histoire de la méthode des sondages peut être relue à travers la tension entre démarche d’enquête et réusage d’informations antérieures, issues notamment de sources administratives exhaustives. En effet, dès l’origine, il a fallu arbitrer entre deux justifications de la méthode d’observation de « la partie pour le tout », connues respectivement sous les noms de « choix aléatoire » (random selection), et « choix judicieux » (purposive selection), pour ensuite les combiner de façons de plus en plus sophistiquées :

  1. Référence à la loi des grands nombres (tirage dans une urne de Bernoulli), encadrée par le calcul d’un intervalle de confiance exprimé en termes probabilistes : choix aléatoire, formalisé par A. L. Bowley en 1906. Pourtant, le sondage aléatoire le plus simple implique une base de sondage, registre ou recensement.
  2. Recours à des informations extérieures, pour constituer l’échantillon, puis pour améliorer la précision des estimations : choix judicieux [22], puis (de façon distincte), échantillonnage stratifié [23], méthode des quotas, et enfin recours à la modélisation en utilisant des sources administratives, ce qui permet d’utiliser à des niveaux géographiques fins l’information apportée par une enquête portant sur un échantillon national.

La division sociale du travail de mise en forme

25 Les diverses façons de combiner données d’enquête et sources administratives ont été beaucoup développées au cours des trente dernières années, et ont révolutionné la technique des sondages, en brouillant la distinction entre ces deux types de sources [24]. Mais ces combinaisons de plus en plus élégantes entre les deux outils supposent un alignement des mises en forme, nomenclatures, définitions des variables, utilisées de part et d’autre. S’ils ont en principe un plus grand degré de liberté dans le cas des enquêtes, les statisticiens préfèrent souvent recueillir des données déjà formatées, par exemple par des règles de droit [25]. C’est une des raisons pour lesquelles les enquêtes dites « subjectives » (par exemple les enquêtes d’opinion) suscitent souvent leurs réticences, puisque, dans ce cas, le travail de « mise en catégorie » leur incombe. Ceci n’est cependant pas toujours vrai, notamment dans le cas d’enquêtes bien standardisées et routinisées depuis longtemps, comme le sont les « Enquêtes de conjoncture » auprès des chefs d’entreprise, dans lesquelles les questions fermées à trois modalités sur l’opinion, et leurs modes d’interprétation, sont quasiment institutionnalisées et ne posent plus de problème de mise en catégorie.

26 La distinction usuelle entre enquêtes et sources administratives peut donc sembler plaquée sur cet univers compliqué, en fonction de découpages institutionnels. Mais c’est précisément cette division sociale du travail de mise en forme qui est sociologiquement significative. Son étude minutieuse implique que soit provisoirement mise entre parenthèses la question de la « fiabilité », qui, le plus souvent, polarise pour des raisons évidentes l’attention des statisticiens professionnels. En effet, les mises en formes successives effectuées par des acteurs différents sont sous-tendues par des raisons d’être, des logiques, des recettes de fabrication et des tours de main profondément dissemblables, sinon incommensurables. Ainsi, on l’a vu, nombre de fichiers de gestion ont pour vocation initiale de garder des traces, enregistrées selon des normes standard, de droits, de devoirs, de créances, de dettes, de performances d’acteurs individuels. C’est typiquement le cas pour les comptabilités et les bilans d’entreprise. En revanche, quand ces fichiers sont récupérés par les statisticiens, quelque chose circule dans des tuyaux, mais les « données » entrant et sortant de ceux-ci ne semblent pas « les mêmes », en dehors de toute idée de tromperie, voulue ou non [26]. Le passage de l’attention portée au cas singulier à la visée d’un tout résume la transmutation opérée. Cependant, quelque chose est passé d’un bout à l’autre du tuyau : le principe de généralité, règle de droit, nomenclature, plan comptable, tout ce qui ordonnait en amont les cas singuliers, va permettre au statisticien, en aval, de mettre en œuvre ses tabulations, même s’il recompose autrement les principes de classement initiaux.

27 Cette alchimie est encore plus complexe puisque les « données » convergeant de différents tuyaux sont ensuite combinées et « mises en cohérence ». Par exemple, le « Système unifié de statistiques d’entreprises » (SUSE) apparie l’« Enquête annuelle d’entreprise » (EAE) et les déclarations fiscales des Bénéfices industriels et commerciaux (BIC). Ces situations de combinaison et de synthèse entre des sources variées, issues à la fois d’enquêtes et de registres, sont de plus en plus fréquentes. Le cas le plus exemplaire de ce point de vue est celui de la comptabilité nationale. Si, aujourd’hui, cette façon de faire est largement acceptée, il est frappant que, jusqu’aux années 1960, certains statisticiens spécialistes des sondages étaient fort réticents à l’idée que leurs évaluations, dont les marges d’erreurs étaient dûment encadrées par le calcul des probabilités, soient ensuite mêlées et noyées avec des données administratives, dans les tableaux des comptables nationaux.

28 Ce télescopage de deux métrologies de natures différentes (d’une part, le calcul des intervalles de confiance issus d’un échantillonnage bien construit, et, d’autre part, les arbitrages nécessaires à l’ajustement des équilibres ressources-emplois des comptes nationaux) était bien le résultat de la confrontation de plusieurs façons d’articuler des sources, enquêtes et registres, ici examinée. La solution sociale de ce paradoxe est que la mesure synthétique apparaît comme un nouvel objet, qui a coupé le cordon ombilical avec ses parents, registres et enquêtes, a largué les amarres de ses conditions de naissance, et a entamé une autre vie. Cette alchimie, « qui transforme le vil plomb d’une myriade d’informations particulières dans l’or (presque) pur d’un savoir général » [27], est rendue possible notamment par l’autorité, technique et sociale, des institutions de la statistique publique. La construction de la comptabilité nationale a été, historiquement, un moteur puissant à la confrontation et à la critique mutuelle entre sources disparates, notamment les enquêtes et les sources administratives. Mais l’hypothèse retenue ici est que ces synthèses, justifiées par le projet de produire une image globale et cohérente des flux macroéconomiques, ont eu pour prix une sorte d’effacement des spécificités dans leurs contextes d’usages initiaux, des diverses sources mobilisées. Ceci ne disqualifie pas ce « réusage », justifié par son utilité ultérieure, mais incite à étudier de plus près cette transmutation, par transport des nombres d’un contexte d’usage à un autre, à laquelle se livrent les services statistiques publics. La « valeur ajoutée » de ceux-ci réside dans le contrôle strict des conditions de ce transport.

La circularité du savoir et de l’action

29 Les sources administratives sont issues de fichiers de gestion dont la finalité est de traiter des cas individuels. Mais ce qui est important pour leur usage ultérieur à des fins statistiques est que ces traitements sont faits selon des règles générales, standardisées et inscrites dans des textes généraux, de diverses natures. Ce qui, en amont, était l’application de principes de justice ou d’économie de gestion uniforme, devient, en aval, l’assise sociale et technique des classes d’équivalence, sans lesquelles aucun travail statistique ne serait possible. Il y a donc une affinité entre, d’une part, les formes de généralité mises en œuvre par les fichiers de gestion et, d’autre part, les conventions sur lesquelles s’appuie la statistique. Si ces affinités sont perçues souvent comme un inconvénient des sources administratives, en ce qu’elles restreignent l’imagination créatrice du statisticien, elles sont aussi la condition de possibilité de son travail. C’est ce préformatage qui permet le traitement en généralité de la statistique. Ceci incite à poser autrement la question complexe de la dépendance des statistiques issues de registres par rapport aux catégories de ceux-ci. Le rappel historique a présenté divers cas où cette dépendance pose un problème logique, en ce que les indicateurs de moyens de l’action publique sont confondus avec ceux des fins de celle-ci : la pauvreté mesurée par les activités des Poor law unions, la délinquance par celles des forces de sécurité, le chômage par les inscriptions à l’ANPE.

30 Le fait que l’information statistique soit souvent issue de procédures de gestion pose le problème de l’extériorité du savoir par rapport à l’action. La nécessité d’une telle extériorité est souvent posée en principe, comme garantissant l’objectivité des indicateurs visant à asseoir et à évaluer les politiques publiques. Pourtant, le fait que nombre de ces indicateurs semblent provenir de la mise en œuvre de ces politiques elles-mêmes soulève une question que l’on ne peut esquiver [28]. Cette question de l’extériorité ne se pose pas seulement, malgré les apparences, dans le cas des sources administratives. Les enquêtes sont, elles aussi (bien que moins directement), tributaires des structures sociales, mentales, linguistiques, institutionnelles, juridiques, d’une société historique donnée. Ces questions ont souvent été soulevées par les sciences sociales, entre les années 1970 et 1990, sous l’étiquette générale de « construction sociale de ceci ou cela…», dans une perspective de dénaturalisation, sinon de dénonciation [29]. La voie est donc étroite entre un réalisme naïf et un constructivisme souvent accusé de « relativisme », c’est-à-dire de négation de la dure réalité d’un monde social dont la description ne relèverait, pour ces supposés relativistes, que de l’arbitraire de rapports sociaux contingents orientés par des intérêts particuliers.

Une hypothèse de lecture : la coconstruction (pensée-action-description)

31 Comment sortir de cette apparente contradiction ? Une voie possible est de concevoir comme simultanément coconstruits, et étroitement liés entre eux sans que l’un détermine les autres, les trois éléments d’un « triplet » que constitue : 1) la façon de penser la société ; 2) les modalités de l’action en son sein ; et 3) les modes de description, notamment statistiques [30]. Ceci suppose une forme de circularité entre l’action et la description, qui rend bien compte des problèmes logiques évoqués ci-dessus. Certaines transformations des modes de production et des usages sociaux des statistiques publiques, depuis les années 1980, impliquent notamment une mobilisation accrue des sources administratives. Ces évolutions sont l’occasion de tester l’hypothèse de coconstruction proposée ici. Pour explorer celle-ci, on partira du vocabulaire, accompagnant la diffusion progressive d’un triplet en partie nouveau [31]. Un terme, certes ancien, est de plus en plus employé dans les usages sociaux des produits de la statistique publique, celui d’« indicateur ». Parmi ces usages, ce mot a partie liée avec trois univers sémantiques associés aux trois facettes du triplet, dont on peut mentionner des exemples de termes souvent utilisés :

  1. Façon de penser la société : marché, autorégulation, réseau, compétition, gouvernance, qualité, compétence, incertitude, temporalité, cycle, court terme, mobilité, flexibilité…
  2. Modalités de l’action : incitation, projet, innovation, anticipation, évaluation, jugement, objectif, résultat, performance, diagnostic, activation des prestations sociales, best practice
  3. Outils de description : indicateur (quantitatif, économique, conjoncturel, social), clignotant, tableau de bord, suivi, observatoire, symptôme, échelle, classement, palmarès, benchmarking, modèle microéconométrique, panel, effet pur d’une variable toutes choses égales par ailleurs, microsimulation, taux d’emploi…
Marché, incitation, palmarès : ce triplet caractérise l’espace dans lequel la statistique publique s’est en partie redéployée depuis les années 1980. On pourrait le contraster terme à terme avec d’autres espaces, qui n’ont certes pas disparu, à travers le vocabulaire des triplets antérieurs [32]. Les mots utilisés aujourd’hui résultent de mélanges de ces divers espaces. Ainsi, le nom de Claude Gruson pourrait symboliser le triplet vedette précédent, celui des années 1950 et 1960 : keynésianisme, planification, comptabilité nationale et mesure des inégalités. Cependant, si les deux premiers éléments n’ont plus du tout la même aura, en revanche les deux derniers restent bien présents, tout en ayant changé de sens et d’usage [33].

32 L’idée de coconstruction mutuelle de la pensée, de l’action et de la description a été explorée par Robert Salais à propos du chômage dans les années 1930 [34]. Il a observé une forte corrélation entre le taux de chômage enregistré par département dans le recensement de 1936, et le caractère urbain et industriel de celui-ci. Dans les départements incluant des grandes entreprises industrielles (métallurgiques et minières) et des grandes villes, des bureaux d’assistance aux chômeurs étaient actifs, et rendaient l’état de chômeur visible et reconnu. En conséquence, la déclaration de cet état dans le questionnaire du recensement devenait d’autant plus plausible. Ainsi, la complexité de l’interaction entre l’enquête (recensement de 1936) et l’activité de l’institution (bureau de chômage) était soulignée, sans que pour autant ne soit avancée l’idée relativiste que ces bureaux « créeraient » le chômage. Ceci constitue un exemple d’analyse en termes d’intersection (déjà évoquée), entre, d’une part, les pertes d’emploi dues à la crise économique des années 1930 et, d’autre part, l’action visant à secourir les victimes de celle-ci. Le « nombre des chômeurs » résulte de cette intersection.

33 Plus récemment, la « Stratégie européenne pour l’emploi » (SEE), promue par les sommets européens d’Amsterdam et Luxembourg (1997) puis de Lisbonne (2000), a impliqué une évolution des indicateurs d’emploi jugés pertinents pour le suivi de celle-ci, avec notamment la mise en avant du taux d’emploi (actifs occupés/population totale d’une tranche d’âge) au détriment du classique taux de chômage (chômeurs/population active). Le contenu et les débats à propos de la SEE et des indicateurs associés sont bien documentés par des recherches récentes [35]. Celles-ci permettent de suivre la mise en place du nouveau triplet, qui cesse ainsi d’être une simple hypothèse de travail. Il y a une interaction étroite entre, d’une part, les façons dont les personnes sont incitées à chercher du travail et dont les chômeurs sont assistés et, d’autre part, les structures d’emploi reflétées par les sources administratives et par les enquêtes sur l’emploi. Cette observation ne vise pas à invalider les indicateurs issus de ces sources, mais plutôt à inciter à beaucoup d’exigence dans leurs interprétations, notamment pour les comparaisons entre pays.

34 Des recherches du même type, associant des disciplines différentes, pourraient être menées pour d’autres domaines des politiques européennes et des statistiques publiques coconstruites à leurs propos. Parmi ces politiques, il faut distinguer celles qui, dans les traités, sont explicitement du ressort de l’Union (monnaie, concurrence), et celles qui, selon le principe de subsidiarité, restent du domaine des États (politiques sociales, emploi, éducation), mais pour lesquelles le Conseil européen et la Commission peuvent cependant décider d’engager des actions coordonnées incitatives, dont la SEE est précisément un exemple. Dans ce cas, les indicateurs statistiques, utilisés pour évaluer et classer les performances des pays, prennent une importance décisive. C’est ce qu’implique l’expression benchmarking, si souvent utilisée par les institutions européennes. De même que dans le cas de la Loi organique relative aux lois de finance (LOLF), la discussion autour du choix et des procédures de mesure de ces indicateurs devient de première importance : c’est au cours de ces négociations que le triplet pensée-action-description est effectivement coconstruit. On ne peut pas séparer complètement un niveau politique où seraient « choisis » des indicateurs, et un niveau technique auquel leur mesure serait « sous-traitée » [36], comme c’est encore souvent le cas.

35 L’autonomisation, cognitive et professionnelle, du métier de statisticien public est revendiquée et acquise de longue date. Mais elle a parfois pour conséquence une forme de réalisme naïf implicite, résultant de cette division du travail. Parmi les six « critères officiels de qualité des statistiques européennes », celui de « pertinence » relèverait de la responsabilité des commanditaires (ou « clients »), tandis que les cinq autres (précision, actualité, accessibilité, comparabilité, cohérence) incomberaient aux statisticiens. Ce partage des tâches a eu des vertus historiques évidentes, en mettant à l’abri la statistique publique des pressions politiques directes. Cependant, les interactions entre pensée, action et description, devraient être mieux connues et assumées par ces professionnels, notamment lors de leur formation [37]. Ceci est important pour maîtriser les mises en formes et les usages à des fins statistiques des sources administratives. Il ne suffit pas de regretter qu’elles aient été conçues à d’autres fins, il faut encore bien comprendre celles-ci. Pour cela, il faut rentrer dans les logiques des institutions concernées. C’est un souci que connaissent déjà, dans le cas français, les statisticiens en poste dans des SSM, s’ils souhaitent intervenir en amont dans la mise en forme des registres et fichiers que la statistique publique réutilisera ensuite. Une utilisation accrue des sources administratives serait utilement éclairée par une attention portée aux travaux effectués dans un domaine fort actif des sciences politiques, celui de l’analyse des politiques publiques.

Un détour par la Grande-Bretagne

36 Il est instructif de contraster le contexte français avec celui d’un autre pays, la Grande-Bretagne, où les questions soulevées ici sont discutées depuis le xixe siècle, mais de façon différente. La statistique publique (official statistics) y est ancienne, avec une forte tradition d’enquêtes sociales, et elle est très utilisée dans les débats publics, sans doute plus qu’en France. Mais elle est aussi beaucoup discutée et critiquée, notamment dans les milieux scientifiques et dans la presse [38]. Depuis trente ans, elle a fait l’objet de nombreux rapports parlementaires et administratifs, et a plusieurs fois changé d’organisation. Dans les années 1980, le ministère conservateur de Margaret Thatcher avait décidé que les services statistiques devaient travailler uniquement pour les besoins du gouvernement [39]. Cette position a été ensuite assouplie sous les gouvernements de John Major et Tony Blair, mais la question (pour qui travaillent les official statisticians ?) est restée débattue, notamment par des chercheurs.

37 Il est frappant que, en France, les demandes et critiques des chercheurs adressées à la statistique publique (notamment dans le cadre du Conseil national de l’information statistique – Cnis) portent surtout sur l’accès aux fichiers de données, rendus trop difficiles, selon eux, par les règles de confidentialité édictées notamment par la Commission nationale de l’informatique et des libertés (Cnil). En Grande-Bretagne en revanche, une critique beaucoup plus large est récurrente : peut-on faire confiance à une administration statistique qui travaille principalement « pour le gouvernement », et non « pour la société » [40] ? Cette opposition ne recouvre bien sûr pas la distinction entre registres et enquêtes, puisque celles-ci peuvent éventuellement être faites « pour les seuls besoins du gouvernement ». Mais les chercheurs britanniques insistent sur l’idée que la « statistique officielle » est « naturellement conservatrice », au sens de policy confirming, c’est-à-dire qu’elle reflète les objets que l’administration voit et la façon dont elle les voit, parce qu’elle agit déjà sur eux [41]. Cette idée s’applique à l’évidence aux sources administratives, qui, par définition, sont dans ce cas. La statistique officielle serait moins capable d’identifier des phénomènes nouveaux qui, eux, relèveraient plus de la recherche et des enquêtes universitaires. Il faut dire que, en Grande-Bretagne, existe de longue date une forte tradition d’enquêtes et d’expertises universitaires, assez différente de la configuration française, où ces enquêtes et ces expertises sont plus incluses dans l’administration (tradition des corps techniques à la française). Ceci explique d’ailleurs le comportement des chercheurs français qui, depuis une vingtaine d’années, se consacrent désormais à d’importants travaux empiriques, et déplorent de ne pas avoir facilement accès aux données produites dans l’administration.

38 Mais, même si les deux contextes nationaux sont différents, l’insistance mise par les chercheurs britanniques sur l’opposition entre informations « pour le gouvernement » et « pour la société » fait écho à des remarques formulées par des responsables français de SSM [42]. Organisés à l’origine pour faciliter l’usage de sources administratives produites au sein des ministères, ces SSM perçoivent à un moment de leur croissance que, pour connaître l’état de la société et les problèmes non résolus dans leur domaine de compétence, ces sources ne suffisent pas et que des enquêtes sont nécessaires. Ce point de vue est clairement exprimé, par exemple, par les services statistiques des Affaires sociales et de la Santé, du Travail, de l’Éducation. Ainsi, l’intuition des chercheurs anglais est formulée, bien qu’autrement, au sein même des SSM français. Elle rappelle que les enquêtes et les sources issues de registres administratifs ne répondent pas aux mêmes besoins de connaissance. Les premières explorent l’état de la société, tandis que les secondes rendent compte de l’action publique. Même si, comme on l’a vu dans la deuxième partie, les registres sont, d’une certaine manière, complémentaires des enquêtes et peuvent en améliorer la qualité, ils ont une portée très différente du point de vue de ce qu’ils montrent et de ce qu’ils contribuent à exprimer.

Pour un examen des apports respectifs des enquêtes et des registres

39 La modification de la loi de 1951 sur la statistique, qui rend obligatoire la communication des données administratives aux services statistiques publics quand ceux-ci en ont besoin, va faciliter le réusage de ces données. Cette option rapproche la France de certains pays d’Europe du Nord, où cette méthode est largement utilisée, sans pour autant que l’originale tradition française d’enquêtes sur des questions nouvelles et mal connues, notamment dans le domaine social, soit abandonnée. Elle est plutôt une occasion d’approfondir la réflexion sur les spécificités de ces deux types de sources. Classiquement, les arguments en faveur des sources administratives sont de deux types : elles sont moins coûteuses, et leur champ, souvent quasi exhaustif, autorise des exploitations régionales et locales. Mais en revanche, elles reflètent par nature une action déjà existante, et sont peu à même de traiter des questions nouvelles, ni même d’évaluer les effets des actions publiques. Ce choix va donc tantôt dans le sens des besoins nouveaux (demande de données localisées), tantôt s’en éloigne (besoin d’exploration de la société et non pas seulement de l’action de l’administration, risque de discontinuité des séries en cas de changement de réglementation).

40 L’argument classique selon lequel les enquêtes offrent une plus grande liberté pour formuler les questions doit être nuancé. Les contraintes culturelles et organisationnelles pèsent sur elles aussi, même si elles sont moins directes que dans le cas des registres. Ainsi, les questionnaires sont tributaires des catégories cognitives et linguistiques des enquêtés, ou, dans le cas des enquêtes auprès des entreprises, des formes d’organisation préalable de l’information comme, par exemple, les systèmes de normes et de pratiques comptables. Par ailleurs, une forte demande d’enquêtes portant sur des panels longitudinaux d’individus ou de familles est souvent formulée. Or il apparaît qu’un tel suivi dans le temps à travers des enquêtes répétées est difficile : le terme d’« attrition » désigne la décroissance inéluctable des échantillons, pour des causes variées.

41 On ne saurait cependant renoncer à un système d’enquêtes par sondage, qui a fait ses preuves, notamment dans le domaine social, comme le montrent des exemples récents telle l’enquête sur les sans domicile (voir, dans ce dossier, l’article de Cécile Brousse), l’enquête européenne sur les revenus et la pauvreté (voir l’article de Delphine Nivière), ou les enquêtes « Handicaps, incapacités, dépendances », « Histoires de vie, construction des identités », « Littéracie » ou « Vie de quartier ». Ces enquêtes prennent appui sur des registres, soit en tant que base de sondage, soit pour construire des modèles permettant d’améliorer la précision d’estimations localisées. Mais elles permettent aussi d’introduire des questions et des thèmes nouveaux, non explorés par les registres, notamment du fait que leur préparation et leur exploitation impliquent des acteurs variés, non seulement les services statistiques, mais aussi des organismes utilisateurs (souvent cofinanceurs), des associations, des chercheurs en sciences sociales. Cette forme d’association des utilisateurs (notamment des chercheurs), à la conception et à l’exploitation d’enquêtes sociales, compense en partie la distance antérieure, typiquement française, entre la recherche universitaire et les services statistiques. Elle contribue à dessiner un paysage qui reste différent de celui des Britanniques. Elle pourrait conduire à une forme de relations entre chercheurs et statisticiens qui ne se limiterait pas à la demande (certes souvent justifiée) d’accès aux fichiers de données individuelles, mais impliquerait les divers acteurs tout au long de la chaîne de conception et de production. La question de la dualité des sources, enquêtes et registres, ne serait plus une question purement technique laissée aux statisticiens publics, mais pourrait être discutée, de façon réflexive et contradictoire, par l’ensemble des acteurs concernés.

42 Les questions soulevées ici ne visent pas à privilégier un type de source par rapport à un autre, mais incitent plutôt à approfondir la réflexion sur le statut social et cognitif des données produites par le Système statistique public, et sur la diversité et la complémentarité de ses sources. Les registres administratifs sont de plus en plus utilisés, et la valeur ajoutée par le data editing opéré par les statisticiens confère à cette source une qualité comparable à celle des enquêtes [43]. Mais il est utile, pour conclure, de diversifier l’évaluation de cette qualité selon les six critères usuels de celle-ci. Celui de « pertinence » a été discuté ici, en distinguant les notions d’informations sur la société et sur l’action publique. La « précision » ne peut pas être appréciée avec les mêmes outils : d’une part théorie de l’enquête (collecte, échantillonnage…), d’autre part vérification et apurement de fichiers. L’« actualité » est désormais un critère essentiel. De ce point de vue, les registres, gérés en continu, sont précieux sinon incontournables, mais les changements institutionnels posent souvent des problèmes d’interprétation des séries temporelles. L’« accessibilité » soulève la question de la mise à disposition de méta-données, qui ne sont pas du tout de même nature dans les deux cas. Enfin la « comparabilité » et la « cohérence » ne peuvent pas être abordées de la même façon pour les deux sources, puisque la mise en forme des données issues des registres dépend moins des statisticiens que ne l’est celle des données d’enquêtes. Ainsi la comparaison entre les deux types de sources implique la prise en considération de critères variés de la qualité. Elle ne peut être résumée de façon sommaire, et implique une réflexion d’ensemble sur les circuits de production et d’usage de la statistique publique.

Notes

  • [1]
    En France, la loi de 1951 relative à l’obligation, à la coordination et au secret en matière de statistiques a été récemment modifiée dans ce sens. Si, auparavant, les administrations pouvaient transmettre des données individuelles aux services statistiques publics (sous réserve du respect des règles de protection de la confidentialité), elles y sont désormais tenues si ces derniers les leur demandent. Cette modification vise à faciliter l’usage des sources administratives.
  • [2]
    Le mot register est plus employé en anglais que ne l’est « registre » en français. On conviendra ici d’utiliser ce mot plutôt pour regrouper, d’une part, les sources administratives proprement dites, issues d’organismes autres que ceux de la statistique publique, et, d’autre part, les répertoires, gérés par celle-ci, tels que le « Répertoire des entreprises » (SIRENE) ou le « Répertoire national d’identification des personnes physiques » (RNIPP).
  • [3]
    Dans les deux cas, les outils informatiques permettent désormais de traiter statistiquement des fichiers de données individuelles, dans des microsimulations ou des analyses de panels sur données micro. Mais dans ces traitements, les individus sont vus seulement comme les éléments d’un tout, et non en tant que tels, isolément.
  • [4]
    Richard Platek, Carl-Erik Särndal, « Can a Statistician Deliver ? », Journal of Official Statistics, vol. 17, n° 1, 2001, pp. 1- 20 (Statistics Sweden). http://www.jos.nu/Contents/Issue.asp?vol=17&no=1
    Isabelle Boydens, Informatique, normes et temps. Évaluer et améliorer la qualité de l’information : les enseignements d’une approche herméneutique appliquée à la base de données « LATG » de l’ONSS, Bruxelles, Bruylant, 1999.
  • [5]
    Notamment, dans le cas français, pour l’application de la « Loi organique relative aux lois de finance » (LOLF, votée en 2001), qui vise à associer les actions publiques à des définitions explicites de leurs objectifs et à des évaluations de leurs résultats, les unes et les autres sous forme quantitative.
  • [6]
    Alain Desrosières, La politique des grands nombres. Histoire de la raison statistique, Paris, La Découverte, coll. « Poche », 2000.
  • [7]
    Stephen M. Stigler, The History of Statistics. The Measurement of Uncertainty Before 1900, Cambridge (Mass.)-Londres, Harvard University Press, 1986.
  • [8]
    Robert Salais et al., L’invention du chômage, Paris, Puf, 1986.
  • [9]
    Thomas Piketty, Les hauts revenus en France au xxe siècle, Paris, Grasset, 2001.
  • [10]
    Jean Bégué, « Les enquêtes sur les revenus fiscaux des ménages », in Pour une histoire de la statistique, tome 2, Matériaux, Paris, Insee-Economica, 1987, pp. 241-251.
  • [11]
    Serge Volkoff, « La statistique annuelle sur les salaires », ibid., pp. 219-228.
  • [12]
    Philippe Robert et al., Les comptes du crime. Les délinquances en France et leurs mesures, Paris, L’Harmattan, 1994.
  • [13]
    Aaron V. Cicourel, John I. Kitsuse, « Note sur l’utilisation des statistiques officielles », Social Problems, vol. 11, 1963, pp. 131-139, traduction publiée par La lettre grise de l’association Pénombre, vol. 1, n° 2, 1996 : http://www.unil.ch/penombreEn ligne
  • [14]
    Ian Hacking, Entre Science et Réalité. La construction sociale de quoi ? Paris, La Découverte, coll. « Textes à l’appui », 2001 [The Social Construction of What, Cambridge (Mass.), Harvard University Press, 1999].
  • [15]
    René Carmille, La Mécanographie dans les administrations, Paris, Recueil Sirey, 1936.
  • [16]
    L’argument du danger des fichiers pour la protection de la confidentialité des données et de la vie privée ne semble avoir été avancé qu’incidemment à cette époque, alors même que la période antérieure avait été marquée dans divers pays par des cas graves d’usage des fichiers par des régimes totalitaires. [Une discussion d’ensemble de tels usages est présentée par William Seltzer et Margo Anderson, « The Dark Side of Numbers : The Role of Population Data Systems in Human Rights Abuses », Social Research, vol. 68, n° 2, 2001, pp. 481-513.]. Ces questions ne seront posées et largement discutées qu’à partir des années 1970, lors de la diffusion de l’informatique de gestion (Loi informatique et libertés, création de la Cnil en 1978).
  • [17]
    C’est d’ailleurs la raison pour laquelle l’idée que ces enquêtes peuvent recueillir des informations « meilleures » que celles issues des sources fiscales a été peu à peu abandonnée.
  • [18]
    Un bon exemple a été fourni par l’évolution du Service statistique des douanes, dont les activités avaient été, dans un premier temps, fortement menacées par la suppression des barrières douanières internes à l’Union européenne. Un nouveau système, dit de « Déclaration d’échanges de biens » (DEB) a été mis en place, plus proche, de fait, d’une enquête, de par sa nature mixte, administrative et statistique. Ceci a été fait avec l’appui des services douaniers, qui y voyaient une façon de relégitimer leur activité de production d’information. Une évolution analogue a été observée avec la transformation des activités statistiques de confection de la balance des paiements par la Banque de France, depuis la création de l’euro et de la Banque centrale européenne.
  • [19]
    Delphine Nivière, Chiffres européens en construction. La naissance de statistiques européennes sur les revenus et les conditions de vie, mémoire pour le DEA de sciences sociales, ENS-EHESS, 2003.
  • [20]
    Emmanuel Didier, « Sampling and Democracy : Representativeness in the First Unites States Surveys », Science in Context, vol. 15, n° 3, 2002, pp. 427-445.
  • [21]
    Il serait utile d’étudier dans quelle mesure les personnes interrogées dans le cadre d’un sondage politique se perçoivent elles-mêmes comme porte-parole des autres citoyens.
  • [22]
    Corrado Gini, « Une application de la méthode représentative aux matériaux du dernier recensement de la population italienne (1er décembre 1921) », Bulletin del’IIS, vol. 23, t. 2, 1928, pp. 198-215.
  • [23]
    Jerzy Neyman, « On the Two Different Aspects of the Representative Method : the Method of Stratified Sampling and the Method of Purposive Selection », Journal of the Royal Statistical Society, vol. 97, 1934, pp. 558-606 ; pp. 607-625 (discussion).
  • [24]
    La réforme récente du recensement de la population française en est un exemple, puisque, pour les communes de 10 000 habitants et plus, il est procédé à un sondage sur un échantillon de logements constitué par le « Répertoire d’immeubles localisés » (RIL), un registre géré et mis à jour par l’Insee avec le concours des communes.
  • [25]
    La refonte de la nomenclature des catégories socioprofessionnelles, entre 1978 et 1982, a été l’occasion de confronter ces deux situations, l’une de préformatage quasi juridique pour les catégories à statut, l’autre de nécessaire mise en forme des catégories par les statisticiens eux-mêmes, pour les groupes sociaux moins définis institutionnellement. Voir Alain Desrosières et Laurent Thévenot 1988, Les catégories socioprofessionnelles, Paris, La Découverte, coll. « Repères », 1988.
  • [26]
    On peut penser à l’immigrant d’Europe orientale débarquant à Ellis Island un matin de 1900. Souvent, il devait changer de nom. Restait-il « le même » ? Cela dépend du point de vue, existentiel ou sociologique. Il en va peut-être de même pour la circulation-transmutation des données dans les tuyaux analysés ici. Cette comparaison, certes hasardeuse, vise à suggérer la question : que signifie « conserver son identité » ? Il n’y a pas une seule bonne réponse, et c’est cela qui rend la question intéressante.
  • [27]
    Cinquante ans d’INSEE… ou la conquête du chiffre, Paris, Insee, 1996, p. 9.
  • [28]
    La mise en œuvre de la LOLF, qui prévoit que les actions publiques devront être dotées d’indicateurs d’objectifs, de moyens mis en œuvre et de résultats atteints, va rendre cette question essentielle. Elle ne pourra être résolue que par une réflexion collective et des négociations complexes, impliquant de nombreux acteurs. Il n’est pas sûr que, au moment du vote unanime de la loi en 2001, ses promoteurs aient bien eu conscience que ce moment de la définition et de la mesure concrète des indicateurs n’était pas seulement une question technique, à sous-traiter à des spécialistes, mais une opération complexe, engageant toute la philosophie du dispositif. Dans ce domaine, des recherches e n sociologie de la quantification seraient les bienvenues.
  • [29]
    I. Hacking, Entre Science et Réalité…, op. cit.
  • [30]
    Il est possible de raconter l’histoire longue de la production statistique en appliquant cette hypothèse, qui endogénéise cette production, en l’intégrant dans la cadre de formes successives d’État. Voir A. Desrosières, « Historiciser l’action publique : l’État, le marché et les statistiques », in Pascale Laborier et Danny Trom (éd.), L’historicité de l’action publique, Paris, Puf, 2003, pp. 207-221.
  • [31]
    Luc Boltanski, Ève Chiapello, Le nouvel esprit du capitalisme, Paris, Gallimard, coll. « NRF essai », 1999.
  • [32]
    On ne porte pas ici de jugement sur ces configurations historiques successives, ni même sur le degré de validité des hypothèses présentées, qui ne concernent peut-être qu’une petite partie du monde social. Elles sont présentées de façon intentionnellement contrastée pour susciter leur examen empirique. Certains cherchent à imaginer des alternatives à celles-ci. Voir Jean Gadrey et Florence Jany-Catrice, Les indicateurs de richesse et du développement. Un bilan international en vue d’une initiative française, Paris, Direction de l’animation de la recherche, des études et des statistiques (Dares), 2003. http://www.travail.gouv.fr/edtudes/pdf/indicateurs.pdf
  • [33]
    Pour la comptabilité nationale, voir : André Vanoli, Une histoire de la comptabilité nationale, Paris, La Découverte, coll. « Repères », 2002.
  • [34]
    R. Salais et al., L’invention…, op. cit.
  • [35]
    Jean-Claude Barbier, La Stratégie européenne pour l’emploi : les représentations des acteurs en France, Centre d’études de l’emploi, Rapport de recherche, n° 7, décembre 2002 (av. coll. Ndongo Samba Sylla) ; R. Salais, « La politique des indicateurs. Du taux de chômage au taux d’emploi dans la stratégie européenne pour l’emploi (SEE) », in Bénédicte Zimmermann (éd.), Action publique et sciences sociales, Paris, MSH, 2004. http://www.insee.fr/fr/nomdefmet/colloques/acn/colloque10/salais.pdf Gilles Raveaud, Économie politique de la stratégie européenne pour l’emploi, thèse en sciences économiques, Université de Paris X-Nanterre, 2004.
  • [36]
    Si ce n’est sous-traitée, au sens propre, à des organismes extérieurs dotés d’un « cahier des charges » plus ou moins précis.
  • [37]
    Cette formation devrait inclure non seulement des cours de probabilité, de statistique mathématique, d’économie et d’économétrie, mais aussi des cours de droit, de science politique, de sociologie de la quantification (ce dernier terme regroupant la statistique, la comptabilité, l’évaluation des politiques publiques). Ceci impliquerait l’étude de cas concrets, issus par exemple des débats autour de la mise en place de la LOLF ou des politiques européennes.
  • [38]
    Daniel Dorling, Stephen Simpson (éd.), 1999 : Statistics in Society. The Arithmetic of Politics, Londres, Arnold, coll. « Arnold applications of statistics series », 1999.
  • [39]
    Ceci contrastait avec le cas français où, depuis au moins 1970, l’Insee, sous la direction de Jean Ripert, était et est toujours au service de tous les acteurs économiques et sociaux. Les débats organisés au sein du Conseil national de l’information statistique (Cnis) concrétisent cette ouverture à l’ensemble des acteurs concernés par la statistique publique.
  • [40]
    Un bon reflet de ces débats est fourni par Ray Thomas, Statistics as Facts about Society. The Functions of Statistics in Britain in the Second Half of the 20th Century, A submission for a PhD by publication, Open University, Milton Keynes, UK, 1999. On trouve quelques-unes de ces idées sur le site : http://www.socresonline.org.uk/socresonline/1/3/5.html
  • [41]
    Cette idée est cohérente avec l’hypothèse de co-construction pensée-action-description formulée ci-dessus.
  • [42]
    Michel Blanc, Alain Desrosières, « Entre décentralisation et coordination. Une analyse des spécificités des SSM », Courrier des statistiques, n° 104, 2002, pp. 9-25. http///www.insee.fr/fr/ffc/docsffc/cs104b.pdf
  • [43]
    Il manque cependant, pour ces méthodes de data editing, une documentation technique et pédagogique comparable à tout ce qui existe à propos des enquêtes par sondage.
Français

Résumé

Les sources de la statistique sont les enquêtes et les registres. Leurs mérites sont liés à leur coût et à leurs apports de connaissance. Elles donnent forme au monde social, mais elles dépendent des conventions d’enregistrement. Leur production implique la construction cognitive et politique d’un espace d’équivalence marqué par les contextes institutionnels. Elles sont utilisées pour évaluer des politiques publiques, à travers des indicateurs, en distinguant les fins et les moyens. Or les registres reflètent les moyens plus que l’état de la société. Cette critique est traitée en analysant la coconstruction des façons de penser : la société, l’action publique, et les outils de description.

Pour citer cet article
Distribution électronique Cairn.info pour Belin © Belin. Tous droits réservés pour tous pays. Il est interdit, sauf accord préalable et écrit de l’éditeur, de reproduire (notamment par photocopie) partiellement ou totalement le présent article, de le stocker dans une banque de données ou de le communiquer au public sous quelque forme et de quelque manière que ce soit.
keyboard_arrow_up
Chargement
Chargement en cours.
Veuillez patienter...