2001
Le travail humain
Usage de la ponctuation dans la description technique : marquer la partition de l’objet décrit
É. Mounier
Université P. Mendès-France, 2, place doyen Gosse, 38031 Grenoble. E-mail : Evelyne. Mounier@ upmf-grenoble. fr
A. Bisseret
INRIA, 655, avenue de l’Europe, 38330 Montbonnot Saint-Martin. E-mail : Andre. Bisseret@ inria. fr
This study deals with the way writers use punctuation marks when they describe complex objects in technical texts. The first experimental studies on the use of punctuation (and connectors) by non-professional writers were carried out by Fayol and his colleagues and resulted in the model proposed by Fayol (1997 b). These studies showed first, a large between-subjects agreement regarding the hierarchy in punctuation marks (from the paragraph to the comma) according to the intensity of linkage (or separation) that they induce between propositions. Secondly, they demonstrated that the frequency and the nature of punctuation marks are highly correlated to the degree of linkage between the states and/or events successively mentioned. In a text, the stronger the linkage between two successive propositions, the lower the separation value of the punctuation mark between them. The results of these studies were obtained by requesting subjects to write texts, starting from very common scripts (e.g., going to the dentist). In that way, subjects did not encounter interpretation difficulty and researchers had a highly predictable hierarchical structure among the propositions. Moreover, the Fayol model rests on correlations computed between the values of between-elements linkage on the one hand, and the frequency and values attached to punctuation marks on the other.
The objective of the present experiment was twofold : 1 / to assess the model in a professional context, using a writing task that was indeed less strictly controllable but, at the same time, less constrained and more plausible, because of its direct relation with the subjects’ professional field ; 2 / to test the model very strictly, by tracking down all occurrences of examples to the contrary in the whole set of elementary patterns of punctuation. Adults enrolled on a business documentation course, received three maps of a documentation centre which varied according to the number of pieces of information and the level of detail given. They were requested to write three texts describing these maps so that they could be given to users to guide them in the room.
Results strongly confirm the Fayol (1997) model. Out of 353 elementary patterns under analysis, 303 patterns were consistent with the model, the proportion being [f = 85,8 % ; 95 % confidence interval : 81,7 % < f < 89,3 %]. So, when they transcribe a representation structured as a decomposition of a complex object into units described by features, writers process punctuation marks ordered according to their linkage/separation strength, and use them to mark in text surface, item clustering and hierarchical levels of the complex object decomposition tree. The model is fairly simple. From a practical perspective, it is proposed that punctuation protocol be used as one of the methodological tools for studies of experts’ mental representations. Also, it is claimed that explicitation of the model could benefit technical writers’training. Finally, it is suggested that the implementation of the model in text generators should be considered.
Keywords :
Mental representation, Technical text, Written object description, Linearization, Punctuation.
Cette étude porte sur l’utilisation de la ponctuation par des rédacteurs de descriptions d’objets dans des textes techniques. L’étude repose sur le modèle qui résulte des travaux de Fayol et collaborateurs (Fayol, 1997). Ces travaux ont montré que la force de séparation d’un signe de ponctuation est en forte corrélation avec le degré de liaison entre les états ou faits qui se succèdent dans le texte. Plus ceux-ci sont liés, plus faible sera la force de séparation du signe de ponctuation mis entre eux. Ces travaux ont testé cette hypothèse par calcul de cette corrélation et ceci, dans le cadre de tâches de rédaction rigoureusement contrôlées et contraintes. La présente étude teste cette hypothèse dans le cas d’une tâche de rédaction moins contrainte, mais en rapport direct avec l’activité professionnelle des adultes concernés et donc plus plausible pour eux. De plus, une démonstration plus forte est recherchée, au-delà de corrélations, par un relevé systématique des contre-exemples au modèle. Les résultats montrent une très grande validité du modèle. Or ce modèle est très simple. Trois applications pratiques sont suggérées : une utilisation méthodologique du modèle pour l’étude des représentations ; l’explication du modèle dans la formation des rédacteurs techniques ; l’introduction du modèle dans les systèmes de génération de textes par ordinateur.
Lorsqu’une personne doit décrire un objet, oralement ou par écrit, elle part d’une représentation mentale de l’objet qu’elle cherche à communiquer au moyen du discours. Cette représentation mentale est multidimensionnelle. En particulier, cette représentation comporte souvent une partition de l’objet, structurée hiérarchiquement (par ex. : Anderson, 1983, p. 58 ; McNamara, 1986 ; McNamara, Hardy, & Hirtle, 1989 ; Palmer, 1977). Or, communiquer au moyen du langage oblige à traduire une telle représentation sous une forme strictement linéaire. C’est une des difficultés du sous-processus de « mise en phrases » (translating dans le modèle de Hayes et Flower, 1980). On parle de contrainte de linéarisation. Les stratégies utilisées pour satisfaire cette contrainte ont été activement étudiées, en particulier dans le domaine de la description de configurations spatiales comme des plans ou des cartes. Dans un premier temps, on a privilégié une stratégie dite de « circuit imaginaire » : elle consiste, partant d’une partie de l’objet, à décrire, autant que possible, la partie la plus proche ; elle manifeste un principe de respect de la connexité. Des auteurs ont pu penser que cette stratégie de circuit était nécessaire et suffisante pour expliquer les descriptions (Levelt, 1982 b, p. 254 ; Linde & Labov, 1975). Ensuite, des descriptions relevant de deux autres stratégies ont été mises en lumière : les descriptions qui reposent sur l’application à la figure d’une structure schématique indépendante de la figure, telle qu’une grille de lignes et/ou de colonnes (Bisseret & Montarnal, 1996 ; Daniel, Carité, & Denis, 1996 ; Denis & Denhière, 1990 ; Ehrich & Koster, 1983) et les descriptions qui manifestent une décomposition hiérarchique de la figure en explicitant des parties et sous-parties selon plusieurs niveaux d’abstraction (Bisseret & Montarnal, 1996 ; Ehrich & Koster, 1983 ; Shanon, 1984 ; Taylor & Tversky, 1992). La structuration hiérarchique reste la caractéristique première de la représentation spontanée des configurations spatiales, même si, dans certaines conditions particulières, cette représentation est traitée pour produire une description linéarisée sous la forme d’un « circuit » (Bisseret & Montarnal, 1996).
Pour le locuteur, une part importante de la « mise en phrases » consiste donc à tenter d’expliciter la structure de sa représentation hiérarchique de l’objet. Le locuteur cherche à indiquer dans quelle mesure les éléments distingués dans l’objet sont à regrouper ou à dissocier. En particulier, il doit pouvoir marquer que deux éléments juxtaposés dans le texte ne doivent pas l’être dans la représentation. Le locuteur dispose pour cela du langage proprement dit (par ex. : « À gauche, trois X alignés le long du mur et, à droite, cinq Y groupés autour d’un grand Z »). Il dispose également d’autres moyens pour marquer la force de liaison entre les éléments successivement décrits : à l’oral, le locuteur peut moduler la longueur des pauses ; à l’écrit, le rédacteur dispose de signes de ponctuation et de connecteurs.
Cet article a trait à l’usage de la ponctuation dans le marquage de la catégorisation hiérarchique des éléments de l’objet décrit. Or l’usage de la ponctuation ne relève pas de normes précises (Ferreiro & Pontecorvo, 1999). Nous suivons Drillon (1991, p. 122) lorsqu’il affirme, à la fin de la partie historique de son traité : « La ponctuation est bien non une affaire de style, non une affaire de respiration, mais la conséquence inévitable d’une certaine forme de pensée. La règle est celle que se donne la pensée. » Il conclut en particulier : « Déroger à la règle est impossible, puisque nul n’est tenu de lui obéir » (Drillon, 1991, p. 123). L’étude de l’activité de ponctuation ne peut donc pas être faite en termes d’écarts à une norme, d’erreurs. Dès lors, on peut faire la conjecture que la ponctuation reflète des caractéristiques importantes de la représentation que se fait le rédacteur de ce qu’il décrit. L’étude de la ponctuation présenterait donc un grand intérêt pour l’analyse de l’activité cognitive des rédacteurs.
Fayol et ses collaborateurs ont étudié expérimentalement l’emploi de la ponctuation (et des connecteurs) par des sujets tout-venant (Chanquoy, 1989 ; Chanquoy, Foulin, & Fayol, 1990 ; Fayol, 1997
a ; Fayol, 1997
b ; Fayol & Abdi, 1988). Ils sont les premiers, et jusqu’ici les seuls, à l’avoir fait de façon systématique et chez l’adulte tout-venant (d’autres études existent, mais sont, pour la plupart, historiques ou linguistiques et portent sur les productions littéraires). Ces auteurs ont étudié des descriptions de procédures familières : des
scripts, tels que le script « aller chez le dentiste » ou des descriptions de dispositifs familiers tels que l’emploi du temps de la semaine chez des élèves. Ils ont trouvé un large accord inter-sujets quant à la hiérarchie des signes de ponctuation (du
paragraphe
[1] à la
virgule) selon la force de liaison/séparation que ces signes introduisent entre propositions (Fayol & Abdi, 1988). Ils ont ensuite mis en évidence que, dans des tâches de rédaction, « la fréquence et la force des marques de ponctuation étaient très fortement corrélées avec le degré de liaison entre états et/ou événements évoqués successivement » (Fayol, 1997
a, p. 162). Ces résultats ont été obtenus en demandant à des adultes et à des enfants d’évaluer les degrés de liaisons entre les propositions d’un script ; puis, en demandant à d’autres sujets, de rédiger un texte correspondant à ce même script (Fayol & Abdi, 1988 ; Chanquoy, 1989).
À partir de ces résultats, Fayol (1997 a, p. 169 sq. ; 1997 b) propose une théorie de l’usage de la ponctuation. Son modèle utilise la parenthétisation pour rendre compte du passage d’une hiérarchie d’éléments à leur mise en séquence. Ainsi, dans une séquence textuelle, « les degrés de liaison entre les éléments sont indiqués par la parenthétisation : deux propositions sont d’autant plus fortement liées qu’elles sont incluses dans un nombre plus élevé de parenthèses » (Fayol, 1997 a, p. 173). Pour le marquage en surface, l’hypothèse est alors qu’un signe de ponctuation sera de force de séparation d’autant plus faible que les éléments qu’il sépare sont inclus dans un plus grand nombre de parenthèses.
Pour mieux expliciter cette hypothèse, voici l’exemple d’un texte procédural (très résumé) inspiré d’un guide de balades en montagne (Merlen, 1992).
Le Bec de l’Orient
Garez la voiture près du refuge du pré de Gève (P1)
Montez par la piste forestière du Cyclone (P2)
La piste s’élève doucement parmi les épicéas (P3)
Ils assurent une ombre agréable (P4)
On arrive à un sentier à gauche d’une grange en ruines (P5)
Il se prolonge par le chemin de crête du Bec de l’Orient (P6)
La descente peut se faire en continuant le GR9 (P7)
Prenez un sentier avant la Fontaine de Nave (P8)
Il redescend doucement jusqu’au parking du refuge (P9).
Les propositions numérotées de P1 à P9 peuvent être représentées selon une sorte de réseau sémantique dans lequel la longueur des segments indique un degré de liaison entre propositions (voir fig. 1).
Fig. 1. De haut en bas : représentation du texte sous forme de réseau de propositions ; parenthétisation correspondante ; exemple de ponctuation, compatible (lignes 1 et 2) ou non (ligne 3) avec le modèle. Cette illustration est inspirée de Fayol (1997 a, fig. 2, p. 172)From top to bottom : representation of the text as a semantic network ; linearization with embedded parentheses ; examples of punctuation, consistent with the model (lines 1 and 2) or not (line 3). After Fayol (1997 b, fig. 8 . 4, p. 174)
Dans la figure 1, les trois ovales distinguent trois phases : « l’arrivée à pied d’œuvre », « la montée » et « la descente ». Entre P1 et P2 la liaison est moins forte qu’entre P2 et P3 ou P4 ; par contre, ces deux dernières propositions sont plus proches l’une de l’autre que de P2, etc. Cette hiérarchisation des propositions élémentaires, lorsqu’elles sont linéarisées en texte, peut être représentée par la parenthétisation indiquée sous le schéma. Dans la ponctuation réalisée au bas de la figure, les trois phases sont séparées par une mise en paragraphe (point, à la ligne, majuscule). Dans la description de « la montée », les propositions P3 et P4, incluses dans le plus grand nombre de parenthèses, sont séparées par une virgule, tandis que P3 est séparée de P2 par un signe plus fort, le point-virgule. Ce sous-ensemble est encore plus fortement distingué de P5 par un signe plus fort, le point ; relativement, P5 et P6 sont rapprochées par un point-virgule. Cette ponctuation est compatible avec le modèle. Par contre, dans le paragraphe correspondant à la description de « la descente », la ponctuation (un point-virgule entre P7 et P8 et un point entre P8 et P9) n’est pas compatible avec le modèle. Dans la représentation, P8 est plus proche de P9 que de P7 ; le signe entre P8 et P9 devrait être de force inférieure à celle du signe entre P7 et P8. Par exemple (P7 . P8 ; P9) ou bien (P7 ; P8, P9).
L’hypothèse centrale du modèle ainsi explicitée et illustrée, nous présentons maintenant l’expérience conçue pour la tester.
II. OBJECTIFS DE L’EXPÉRIENCE
Jusqu’ici, les résultats qui ont permis de construire ce modèle ont été obtenus grâce à l’utilisation de trames de scripts. Celles-ci ont l’avantage de décrire des actions très familières. Elles préviennent donc tout problème d’interprétation par les sujets. L’expérience ici présentée avait pour objectif de tester ce modèle dans une tâche de rédaction moins strictement contrôlée mais aussi moins contrainte et plus plausible parce qu’en rapport direct avec le domaine professionnel des adultes concernés.
Par ailleurs, les travaux antérieurs ont montré une évolution avec l’âge du nombre de signes de ponctuation disponibles (Fayol, 1997 a). Les adultes participant à l’expérience sont censés être capables d’utiliser tous les signes. Pour tester le modèle dans le cas d’une utilisation de l’éventail complet des signes, il fallait proposer de décrire un objet suffisamment complexe, qui permît une représentation selon des niveaux de décomposition suffisamment nombreux. Cependant, nous avons voulu observer comment évoluait l’utilisation des signes, à partir d’une représentation simple de l’objet (peu de niveaux de décomposition). Dans ce cas, quels signes sont utilisés et qu’en est-il lorsque la représentation du même objet se complexifie ? Dans ce but, nous avons conçu une tâche dans laquelle, pour un même objet, les niveaux de détails à inclure dans la description augmentent ; de façon à ce que, corrélativement, le nombre de niveaux hiérarchiques de la décomposition de l’objet augmente aussi. L’hypothèse est précisée plus bas, après la description du matériel.
Enfin, le modèle proposé par Fayol (1997
a et
b) repose sur le calcul de corrélations entre d’une part, la force du lien inter-éléments et d’autre part, la fréquence et la force de séparation des signes de ponctuation. Ces corrélations rapportées sont très élevées. Notre conjecture est que ce modèle a une très forte validité, au moins pour expliquer le comportement de rédacteurs de textes descriptifs techniques
[2]. Nous avons donc décidé de le tester très strictement en recherchant systématiquement toute occurrence de contre-exemples dans l’ensemble des patterns élémentaires de ponctuation.
III . 1. SUJETS
Vingt-et-un sujets volontaires et non rémunérés ont participé à l’expérience. Il s’agissait d’étudiantes en année spéciale de DUT de documentation d’entreprise et de DUT des métiers du livre. Les âges allaient de 21 à 51 ans (âge moyen : 29 ans). Dans le contexte de leurs cours, on leur avait demandé pendant la semaine précédant l’expérience, de traiter un cas pratique d’installation d’une salle équipée de terminaux d’interrogation de banques de données et de postes de consultation de CD-ROM.
III . 2. MATÉRIEL
Le matériel se composait de trois versions A, B et C du plan d’une salle de documentation dans laquelle les appareils sont disposés à l’intérieur de cinq zones bien délimitées. Chaque plan était présenté séparément : les plans A et B occupaient une page A4 et le plan C occupait une page A3 (cf. annexes). Ces plans diffèrent quant au nombre et au niveau de détail des informations. Le plan A ne comporte que les noms des zones : zone CD-ROM, zone microformes, etc. Le plan B présente pour chaque zone, le nom de la zone, le nom de l’élément représenté par chaque « boîte » ajoutée dans la zone et d’éventuelles indications supplémentaires, telles que le producteur ou le domaine de telle base de données. Le plan C reprend toutes les indications figurant sur le plan B et ajoute des informations plus ou moins nombreuses pour quelques zones. Ces informations concernent la zone globalement, mais aussi chaque élément qui la compose. Par rapport au plan A, les plans B et C incitent donc à une complexification croissante de la hiérarchie de niveau de décomposition.
Du point de vue du modèle, le matériel entraîne progressivement une augmentation du nombre d’emboîtements de parenthèses, et donc, une contrainte plus forte sur le choix des signes. La description du plan A peut se réduire à une liste des cinq zones, chacune assortie de sa situation spatiale ; à la limite, un même signe peut être utilisé pour séparer les énoncés évoquant les zones et n’importe quel signe peut convenir pour ce faire. Sauf si la représentation comporte au moins un regroupement de zones par rapport à d’autres ; dans ce cas on s’attendra à l’usage d’au moins deux signes de valeurs différentes. Le plan B ajoute des détails, et suppose donc des emboîtements de parenthèses qui devraient entraîner un nombre de signes différents plus grand. En fin d’épreuve, les emboîtements de parenthèses suscités par le plan C, devraient contraindre à l’utilisation de tous les signes selon leur force de séparation relative.
III . 3. PROCÉDURE
Chaque sujet devait rédiger trois textes, un pour chaque plan, en se référant aux seules informations figurant sur chacun des plans. La passation était collective, elle se déroulait en une seule séance.
Tous les sujets décrivaient les plans dans l’ordre A, B, C, et, donc, du plus simple au plus complexe. Ce choix nécessite une remarque méthodologique. On pense évidemment au risque que l’on prend à faire jouer simultanément deux sources de variations : les différences de complexité entre les plans à décrire et un effet d’ordre. Utiliser des groupes indépendants (un groupe par plan à décrire), ou contrebalancer l’ordre de présentation des plans permettait d’éviter ce risque. Mais rappelons que nous ne cherchions pas, avant tout, à comparer la ponctuation de descriptions simples contre des descriptions complexes. Notre objectif était d’étudier l’usage de la ponctuation pour marquer la partition d’un objet. Il importait donc, de maximiser la probabilité de la formation d’une représentation fondée sur une décomposition en niveaux hiérarchiques et, corollairement, de favoriser l’homogénéité des représentations entre les sujets. La description des plans du plus simple au plus complexe, par tous les sujets, permettait ces objectifs. L’interprétation de certains résultats doit donc tenir compte de l’effet d’ordre ainsi induit.
Le temps n’était pas limité. À chaque description, l’expérimentateur attendait que tous les sujets aient terminé pour passer à la description suivante. Les plans étaient distribués au fur et à mesure de telle sorte que, lors d’une description, les sujets n’aient pas connaissance du plan suivant.
La consigne donnée oralement aux sujets au début de l’expérience comportait les informations suivantes. « Il s’agit de décrire une salle libre-service d’un centre de documentation qui existe réellement dans un organisme scientifique. Cette salle contient différents appareils qu’il s’agit de localiser. Le texte doit être rédigé avec soin puisqu’il est destiné à être communiqué à des utilisateurs. Il doit servir à les guider dans la salle
[3]. Les utilisateurs ne sont pas des professionnels de la documentation, néanmoins ils savent ce que sont les CD-ROM, les banques de données, les microformes. Les différents éléments de la présentation matérielle des textes vont faire l’objet d’une étude, aussi doivent-ils être identifiables sans équivoque ; par exemple : un retrait, soulignement, retour à la ligne, marque de paragraphe, sous-paragraphe, etc. Il n’y a pas de contrainte de temps. »
De plus, à chaque phase, on distribuait le nouveau plan à décrire et on répétait oralement la même consigne pour les trois plans : « Vous devez décrire le plan fourni en localisant les différents éléments dont le nom figure sur le plan ; ces noms figurent également sur des panneaux dans la salle. Le texte produit doit contenir l’ensemble des données qui se trouvent sur ce plan et seulement ces informations. Le texte écrit doit servir à guider les utilisateurs dans la salle. »
À la fin de l’expérience, on collectait les textes produits par chaque sujet. On vérifiait avec lui que les éléments de présentation étaient identifiables ; à défaut, on lui demandait de les préciser. En particulier, on veillait à identifier avec lui les marques de paragraphes dans chacun des textes. L’ensemble de l’expérience a duré environ deux heures trente minutes.
Un sujet a été éliminé parce qu’il n’avait pas participé à la totalité de l’expérience. Les résultats portent sur 60 textes (3 textes * 20 sujets). Nous avons adopté la hiérarchie des signes de ponctuation établie en fonction de leur intensité de séparation (Fayol & Abdi, 1988). Nous avons été amenés à ajouter le « sous-paragraphe » et le « sous-sous-paragraphe » dans la mesure où des sujets explicitaient l’utilisation de telles marques (marquées par un à la ligne et une indentation avec un tiret, un point, une étoile...). En l’absence de données expérimentales sur la position de ces deux marques dans l’échelle d’intensité des signes, nous les avons placées derrière le paragraphe. Les textes comportaient très peu de connecteurs. Une exception notable était l’utilisation fréquente du et que nous avons donc inclus dans l’échelle. Pour cette inclusion du et, nous disposions d’un résultat signalé par Fayol (1997 a, p. 161) qui place le et après la virgule, donc, traduisant une séparation moins forte entre propositions. La hiérarchie des signes testée dans cette expérience est donc la suivante, du signe ayant la force de séparation la plus forte au signe ayant la force de séparation la moins forte :
paragraphe > sous-paragraphe > sous-sous-paragraphe
> point > point virgule > deux-points > virgule > et
Étant donné la construction des trois plans à décrire, et l’ordre de leur présentation aux sujets, le contenu du plan A (les cinq zones et leur localisation) est prégnant dans les trois étapes. On s’attend à ce que ces zones constituent le(s) niveau(x) haut(s) de la hiérarchie de décomposition. Pour l’analyse, nous considérons qu’un texte est une succession de cinq descriptions de zones. Nous distinguons d’une part, la ponctuation inter-zones : ce sont les quatre signes de ponctuation qui séparent (délimitent) ces descriptions ; d’autre part, la ponctuation intra-zone : ce sont les signes utilisés à l’intérieur de la description d’une zone. De plus, dans les textes B et C, chaque description de zone est composée de descriptions des items composant la zone. Là encore, nous distinguons la ponctuation inter-items qui sépare (délimite) les descriptions des items et la ponctuation intra-items, interne à la description d’un item.
Dans un premier temps, avant l’évaluation proprement dite du modèle, nous présentons des résultats sur la ponctuation inter-zones qui démontrent la relativité de la valeur de séparation des signes.
Ensuite nous testons le modèle en ne s’intéressant, là encore, qu’à la seule ponctuation inter-zones : d’abord, en examinant dans quelle mesure cette ponctuation inter-zones est utilisée comme prédit, pour marquer les regroupements de zones explicités dans les textes ; puis, en vérifiant, par ailleurs, que la force de séparation de cette ponctuation inter-zones est bien supérieure à la force de séparation de la ponctuation intra-zone.
Enfin, nous testons le modèle au niveau le plus fin de la ponctuation intra-zone, selon une procédure identique : d’abord, en examinant dans quelle mesure la ponctuation inter-items est utilisée comme prédit, pour marquer des regroupements d’items ; puis, nous vérifions si la ponctuation interne à la description d’un item, est bien de valeur inférieure à la ponctuation délimitant cet item.
IV . 1. FLEXIBILITÉ DANS L’USAGE DE L’ÉVENTAIL DES SIGNES POUR LA PONCTUATION INTER-ZONES
Cette première analyse a porté sur les seuls signes inter-descriptions de zones. Puisqu’il y a cinq zones, chaque texte comporte quatre transitions de ce type. Autrement dit, pour le moment, on ignore la ponctuation interne aux descriptions des zones. Les textes ont été caractérisés par un pattern ou la description d’une zone est représentée par un Z. « Z » est considéré comme une variable qui peut prendre pour valeurs {A, B, C, M, R}, les initiales des noms de zones : Accueil, Banques de données, CD-ROM, Microformes et Reprographie. Nous les utiliserons lorsqu’il sera utile de les spécifier. Le pattern Z ϒ Z ϒ Z ϒ Z ϒ Z, par exemple, représente un texte dans lequel les descriptions des cinq zones sont séparées par des marques de paragraphe (ϒ = point + à la ligne + ligne blanche et/ou indentation). On disposait de 80 observations pour chacun des trois textes (4 transitions * 20 sujets).
Nous avons regroupé les signes selon trois classes : les signes faibles dont la force de séparation est inférieure à celle du point, les points et les signes forts (paragraphes et sous-paragraphes). Le tableau 1 présente les effectifs d’utilisation de ces trois classes de signes pour séparer les zones dans les trois textes.
TABLEAU 1 :
Nombre d’utilisations des trois classes de signes pour séparer deux zones, pour les trois textes
Number of times each of the three classes of marks is used to separate the description of two areas in the three texts
Globalement, la répartition des utilisations des trois classes de signes (signes forts, points, signes faibles) diffère entre les trois conditions [χ2(4, N = 240) = 64,28 ; p < .0001]. Cependant, lorsque la quantité d’informations à indiquer pour chaque zone est très faible (textes A), on constate que les signes des trois classes se trouvent utilisés indifféremment pour séparer deux zones. La répartition des choix entre les trois classes de signes pour les textes A n’est pas différente du hasard [χ2(2, N = 161) = 4,38 ; NS]. En revanche, lorsque ensuite, les sujets doivent redécrire la salle en indiquant plus de détails, les signes forts (paragraphe et sous-paragraphes) sont nettement privilégiés pour séparer les descriptions de deux zones, au détriment des signes faibles qui sont très exceptionnels ; ceci, déjà pour les textes B. Lors de la rédaction des textes C, l’utilisation des signes forts est encore plus importante, au détriment cette fois des points. Les répartitions entre classes de signes pour les textes sont différentes du hasard tant pour les textes B [χ2(2, N = 161) = 31,07 ; p < .0001] que pour les textes C [χ2(2, N = 161) = 42,46 ; p < .0001].
En résumé, lorsque les textes de description de zones sont très courts, certains sujets utilisent des signes forts, d’autres des points, d’autres des signes faibles, pour séparer les zones. Ensuite, lorsque les sujets doivent ajouter plus de détails sur chaque zone, les signes dont la force de liaison est plus faible leur sont nécessaires à l’intérieur de la description d’une zone ; ceci entraîne, lors des descriptions les plus complexes, une quasi-généralisation de l’utilisation du signe à force de séparation la plus forte, le paragraphe, pour séparer les zones.
IV . 2. TEST DU MODÈLE SUR LA PONCTUATION DES REGROUPEMENTS DE ZONES
IV . 2 . A. Les types de regroupements et leur codage
Dans certains textes, le rédacteur n’explicite aucun regroupement de zones. Le texte décrit les cinq zones au même niveau, comme une liste (pattern ZZZZZ). En revanche, d’autres textes manifestent une partition des zones : ils regroupent certaines zones par rapport aux autres. En d’autres termes, ils manifestent (au moins) un niveau d’abstraction d’ordre supérieur à celui des zones élémentaires.
Les textes ont été codés du point de vue de ces regroupements en utilisant, à l’instar de Fayol (1997 a, p. 173), un codage par parenthétisation. Lorsque n zones sont explicitement regroupées, elles donnent lieu à mise entre parenthèses (voir un exemple au tableau 2). Ce codage a été réalisé indépendamment de la ponctuation, sur la seule base de l’interprétation des propositions textuelles. En effet, l’objectif était de vérifier que la ponctuation était bien utilisée pour indiquer la partition hiérarchique choisie pour l’ensemble de zones. Ce codage a été fait par les deux auteurs indépendamment ; les désaccords, peu nombreux, étant supprimés ensuite, par discussion.
Par exemple, dans le texte du tableau 2, on met entre parenthèses les quatre premières zones, qui correspondent aux « outils » ; on tient compte pour ce faire des propositions « sont réparties en plusieurs zones », « la zone CD-ROM... » et « les trois autres zones » qui montrent bien que la cinquième (l’accueil) est isolée. Dans ces quatre zones, on met entre parenthèses « les trois autres zones » clairement regroupées par rapport à la zone CD-ROM. Enfin parmi ces trois zones, on regroupe entre parenthèses reprographie et banques de données à cause de la proposition « respectivement à gauche et à droite » (et non pas en tenant compte de la faiblesse relative du et qui les sépare). On laisse isolé l’Accueil. En complétant ce parenthèsage par les signes de ponctuation observés, on réduit alors le texte au pattern : [(C • (M , (R et B))) ϒ A].
TABLEAU 2 :
Exemple de codage d’un texte
An example of how texts were coded
Les regroupements de zones observés sont opérés selon les deux grands critères classiquement signalés dans les études portant sur les descriptions spatiales. Selon un critère fonctionnel, on trouve une distinction entre l’Accueil et les autres zones caractérisées comme « zones de services » [A (BCMR)] ; ou entre l’Accueil et la Reprographie d’une part, caractérisées comme « zones de reproduction de documents » (imprimante et photocopieur) et d’autre part, les trois autres zones décrites comme « zones de recherche d’information » [(AR) (BCM) ou (AR) BCM ou AR (BCM)]. Selon un critère spatial, on trouve soit une partition entre « le premier plan », ou « les deux zones de part et d’autre de l’entrée » (Accueil et Microformes) et les autres zones, parfois signalées comme « zones face à l’entrée » [(AM) (BCR)] ; soit une partition entre les deux zones du fond et les autres [(BR) ACM] ; soit encore une partition entre les deux zones de gauche et les autres [(MR) ACM] ; on trouve enfin « le centre » distingué des autres zones, « les quatre coins » [C (ABMR)].
IV . 2 . B. Mise à l’épreuve du modèle sur les patterns sans regroupement de zones
Sur les 60 textes, 31 correspondent au pattern « sans regroupement de zones » (ZZZZZ). Dans ce cas, selon le modèle, on s’attend à ce qu’un même signe de ponctuation soit utilisé pour séparer les cinq zones (ponctuation régulière). On trouve 24 textes qui respectent ainsi le modèle. Trois signes différents sont rencontrés : le point, dans trois textes ; le « à la ligne + tiret », dans six textes ; le paragraphe (un paragraphe par zone) dans 15 textes.
Mais on trouve sept réalisations de ce pattern dans lesquelles deux ou trois signes différents sont introduits entre les descriptions de zones, alors qu’aucune expression linguistique n’a permis de déceler la moindre explicitation de regroupement de zones (ponctuation irrégulière). Pour l’une de ces réalisations, produite deux fois par le même sujet dans ses textes A et B, il est possible de supposer un regroupement intentionnel mais qui serait indiqué par la seule ponctuation. En effet, le regroupement de zones que l’on pourrait inférer d’après la seule ponctuation (selon le modèle) est l’un de ceux qui ont été explicités par plusieurs sujets (regroupement des outils de reproduction : zone accueil et zone reprographie). De plus, le même sujet a explicité le rapprochement de ces zones par rapport aux autres dans son texte C. Pour les cinq autres réalisations, les regroupements manifestés d’après la seule ponctuation ne correspondent à aucun de ceux qui ont été explicités. Il se peut que ces cas correspondent à une représentation de regroupement de la part du rédacteur. Nous n’avons toutefois aucun moyen de le savoir. Nous avons donc considéré que ces sept réalisations irrégulières ne pouvaient pas être interprétées en termes de confirmation/réfutation du modèle ; Pour les calculs, nous les avons retirées de l’ensemble des observations (53 observations au lieu de 60).
IV . 2 . C. Mise à l’épreuve du modèle sur les patterns avec regroupement de zones
Pour les patterns avec regroupement de zones, le modèle prédit que les signes de ponctuation seront d’une force de séparation d’autant plus faible que les deux zones qu’ils séparent sont inscrites dans un nombre plus élevé de parenthèses. On trouve 53 textes qui explicitent (au moins) un regroupement de zones. Parmi ces textes, quatre prennent le modèle en défaut. D’une part, dans deux cas, un paragraphe sépare deux regroupements, alors que les zones de l’un de ces regroupements sont déjà séparées par des paragraphes : (Z ϒ Z ϒ Z) ϒ (Z et Z). Il s’agit de deux textes d’un même sujet. D’autre part, dans deux cas, un deux-points sépare une zone d’un regroupement explicite de zones alors que ces dernières sont séparées par un signe plus fort (à l’intérieur de la parenthèse) : le point-virgule dans un cas [Z : (Z ; Z ; (Z et Z))], le point dans l’autre [Z ϒ Z : (Z • (Z et Z))].
Cependant, deux autres textes manifestent une irrégularité de ponctuation, du type Z, Z et Z, alors qu’aucun regroupement n’est explicité entre les deux dernières, par rapport à la première. Dans la mesure où nous avons postulé au départ que le et avait une force de séparation plus faible que la virgule, un critère strict conduit à considérer que ces ponctuations prennent le modèle en défaut. Cependant, nous discuterons ultérieurement la généralité de cette différence de valeur entre le et et la virgule. Nous pensons que, dans de tels cas, le et est en fait de même valeur que la virgule. Nous considérons donc un critère moins strict qui conduit à ne pas retenir ces deux cas contre le modèle.
Au total, au niveau de la ponctuation de séparation des descriptions des 5 zones, le modèle est pris en défaut dans 6 textes sur 53 suivant le critère strict, et dans 4 textes sur 53 suivant le critère moins strict. La proportion de respect du modèle avec le critère strict est de [f = 88,7 % ; intervalle de confiance à 95 % : 77,0 % < f < 95,7 %], tandis qu’avec le critère moins strict elle est de [f = 92,5 % ; intervalle de confiance à 95 % : 81,8 % < f < 97,9 %].
IV . 3. TEST DU MODÈLE SUR LA FORCE DE SÉPARATION DES SIGNES INTERNES PAR RAPPORT AUX SIGNES DÉLIMITEURS D’UNE ZONE
Il s’agit ici de vérifier que les signes internes à la description d’une zone sont plus faibles que les signes qui délimitent cette zone. Seuls les textes B et C étaient pertinents pour cette analyse. En effet, ils comportent la description de plusieurs items par zone ; on y rencontre donc de la ponctuation intra-zone, ce qui n’est pratiquement pas le cas pour les textes A.
Notre procédure a consisté à repérer, pour chaque description de zone, le signe interne le plus fort et à le comparer au signe délimiteur de la zone le plus faible. Celui-ci doit être supérieur à celui-là pour que le modèle soit respecté.
Voici un premier exemple :
Zone précédente. Le quatrième coin est réservé à la zone microformes, qui contient le lecteur reproducteur de microfiches et lecteur de microfiches pour les thèses de sciences humaines, sciences politiques et physique chimie. Zone suivante.
La description de cette zone est délimitée (séparée de la zone précédente et suivante) par des points. À l’intérieur de la description, on trouve 2 virgules et 2 et. Le signe interne le plus fort est donc la virgule ; il est inférieur au signe délimiteur le plus faible (le point). Le modèle est donc respecté.
Voici un deuxième exemple :
Zone précédente ; au fond, dans la zone des banques de données en ligne, vous pourrez consulter les bases suivantes : Agora (Agence France Presse), Eurecas (Chimie) ; Logos (documentation française). ϒ Zone suivante.
Cette description est délimitée par un point-virgule au début et par un ϒ à la fin ; or en interne, le signe le plus fort est un point-virgule, de force égale au signe délimiteur le plus faible. Le modèle n’est donc pas respecté.
Concrètement, pour chaque description de zone, on dispose d’un pattern composé du signe qui la sépare de la zone précédente, du signe qui la sépare de la zone suivante et, entre parenthèses, du signe le plus fort relevé à l’intérieur de la description. Par exemple, le pattern « ϒ Z(;) • » correspond à une description de zone qui est séparée de la précédente par un paragraphe et de la suivante par un point. Le signe interne le plus fort est un point-virgule. Lorsqu’il s’agit de la première zone décrite dans le texte, si elle est précédée d’une introduction, le signe qui la sépare de celle-ci est adopté comme séparation de début ; sinon, on admet que le délimiteur de début est un paragraphe. S’il s’agit de la dernière zone décrite, on décide d’adopter le paragraphe comme délimiteur de fin. Précisons que lorsqu’une zone est suivie d’un paragraphe ou d’un sous-paragraphe (pour la séparer de la zone suivante), il arrive souvent que sa description se termine par un signe (point, point-virgule ou virgule). Ce signe n’est alors pas compté comme interne à la description de la zone. On admet qu’il fait partie du signe de séparation avec la zone suivante. Autrement dit, par exemple, le délimiteur de zone paragraphe est souvent en fait un point suivi de paragraphe. On dispose ainsi de 100 patterns (5 zones * 20 sujets) pour chacun des types de textes B et C.
Le modèle est pris en défaut dans 13 cas sur 100 dans les textes B et dans 18 cas sur 100 dans les textes C. La comparaison de ces deux proportions par le test du χ2 conduit au maintien de l’hypothèse nulle.
Globalement donc, c’est dans 31 cas sur 200 (15,5 %) que le modèle est mis en défaut, sur ce critère. La proportion de cas de respect du modèle est donc : [f = 84,5 % ; intervalle de confiance à 95 % : 78,7 % < f < 89,2 %].
IV . 4. TEST DU MODÈLE SUR LA PONCTUATION DES REGROUPEMENTS D’ITEMS INTERNES À LA DESCRIPTION D’UNE ZONE
Il s’agit de tester le modèle au niveau plus fin de la ponctuation utilisée pour délimiter et regrouper les items composant une zone. Il s’agit alors des niveaux bas de la hiérarchie de décomposition de l’objet global.
Afin de ne pas surcharger, nous rendons compte ici de l’analyse d’une zone (celle des CD-ROM) qui avait été prévue en vue d’une telle analyse. À partir de la description B, la description de cette zone devait indiquer trois items composants (3 CD-ROM différents), dont deux présentaient une caractéristique commune : les CD-ROM Pascal et Francis, tous les deux signalés comme étant produits par un même éditeur (l’Inist). Cependant, sur le plan, ces deux items étaient séparés par un troisième, le CD-ROM CD-thèses (voir le plan B en annexe). On s’attendait donc à deux possibilités, classiquement repérées dans les descriptions spatiales et déjà signalées plus haut pour le regroupement des zones : soit le sujet liste les trois items dans l’ordre spatial, de gauche à droite (Pascal CD-thèses Francis) ou, beaucoup plus improbable, de droite à gauche (Francis CD-thèses Pascal) ; soit le sujet opère un regroupement « fonctionnel » en rapprochant les deux items ayant une caractéristique commune par rapport au troisième ((Pascal Francis) CD-thèses). L’avantage de ce dispositif était que la présence d’un regroupement pouvait être observée sans ambigu ïté. Le parenthésage ne posait donc aucun problème. Nous utiliserons ici le terme de « pattern » pour désigner la réduction du texte à une liste de ces trois items assortie d’une part, d’un parenthésage si le regroupement fonctionnel était observé et d’autre part, de la ponctuation observée entre les items.
Exemples :
Le texte : « En face de l’entrée, accès aux CD-ROM Pascal, CD-thèse, Francis » est représenté par le pattern [Pascal, CD-thèses, Francis] ; .
Le texte : « Face à l’entrée se trouve la zone allouée aux CD-ROM : vous pourrez y interroger PASCAL et FRANCIS, produits par l’Inist, et CD-thèses » est représenté par le pattern [(Pascal et Francis) et CD-thèses].
Le texte : « La zone CD-ROM dispose de trois postes de consultation :
• PASCAL (INIST)
• CD-THèSES
• FRANCIS (INIST) »
est représenté par le pattern : [Pascal § – CD-thèses § – Francis].
Les résultats montrent effectivement les deux types de descriptions de la zone. Sur 40 textes, 15 présentent le regroupement fonctionnel tandis que 25 sont de simples listes selon la disposition spatiale (toutes de gauche à droite).
Parmi les patterns avec regroupement, cinq respectent strictement le modèle en ce que les deux items regroupés (Pascal et Francis) sont séparés par un signe plus faible que le signe qui les sépare du troisième (CD-thèses). Dans ce cas, la ponctuation est donc redondante par rapport au regroupement explicite. Il faut souligner un cas où nous avons dû considérer les parenthèses : « (Pascal et Francis) et CD-thèses », où les parenthèses sont mises par le sujet. Nous n’avions pas prévu d’introduire les parenthèses dans notre étude. Mais on en trouve. Dans le cas présent, nous avons considéré qu’elles diminuaient la force de séparation du premier et par rapport à celle du deuxième. Cependant, sept patterns avec regroupements ne manifestent pas cette redondance de la ponctuation ; le signe qui sépare les deux items regroupés est de même force que celui qui les isole du troisième. Le regroupement n’est donc pas renforcé par la ponctuation. On peut toutefois considérer que le modèle n’est pas pour autant mis en défaut.
En revanche, trois patterns contredisent le modèle dans la mesure où le signe entre les deux items regroupés est plus fort que le signe qui sépare ceux-ci du troisième.
Parmi les traitements en liste, 18 patterns sont réguliers : un même signe sépare les trois items de la liste : une fois le paragraphe, treize fois le sous-paragraphe et quatre fois la virgule. Cependant, on trouve sept patterns qui contredisent le modèle ; alors qu’il n’y a pas regroupement, on trouve des signes de valeurs différentes entre les trois items censés être au même niveau.
Au total donc, selon un critère strict, ce sont 10 descriptions sur 40 qui ne confirment pas le modèle à ce niveau de l’énumération des items composant la zone. La fréquence de respect strict du modèle est donc : [f = 75 % ; intervalle de confiance à 95 % : 58,8 % < f < 87,3 %].
Cependant, il est possible d’envisager un allégement du critère de vérification du modèle. On observe cinq réalisations d’une liste de la forme [Pascal, CD-thèses et Francis] qui posent à nouveau le problème de la valeur relative du et et de la virgule. Nous proposons la possibilité d’une égalité de la force de séparation du et et de la virgule. Ce ne sont plus alors que cinq descriptions qui contredisent le modèle. Avec ce critère moins strict, la proportion de respect du modèle est de [f = 87,5 % ; intervalle de confiance à 95 % : 73,2 % < f < 95,8 %].
IV . 5. TEST DU MODÈLE SUR LA FORCE DE SÉPARATION DES SIGNES INTERNES PAR RAPPORT AUX SIGNES DÉLIMITEURS D’UN ITEM
Enfin, dans les (seuls) textes C, la description d’un item composant comporte au moins une information autre que son nom. Au niveau le plus fin de la description d’un seul item, nous devions vérifier que le signe interne le plus fort était de valeur inférieure à celle du signe délimiteur de l’item le plus faible. On disposait alors de 60 observations (3 items * 20 textes C). Sur ces 60, 10 descriptions ne respectent pas le modèle car elles comportent un signe intra-item dont la force de séparation est égale ou supérieure au signe délimiteur (de l’item) le plus faible. La proportion de respect du modèle est donc de [f = 83,3 % ; intervalle de confiance : 71,5 % < f < 91,7 %].
IV . 6. UN INDICE GLOBAL DU RESPECT DU MODÈLE
Les quatre mises à l’épreuve du modèle précédentes portent sur des observations réalisées en des points critiques des textes : ponctuation séparant et regroupant les zones ; ponctuation séparant et regroupant les items d’une zone ; et, tant pour les zones que pour les items, comparaison du signe intra-description le plus fort au signe délimiteur le plus faible. Ces points critiques sont indépendants. Il est donc possible de considérer un indice global constitué par la fréquence des cas de respect du modèle par rapport aux 353 observations considérées. Avec le critère strict, nous avons 296 cas de respect du modèle, soit une proportion de [f = 83,8 % ; intervalle de confiance à 95 % : 79,6 % < f < 87,5 %] ; avec le critère moins strict, nous avons 303 cas de respect du modèle sur 353 observations, soit [f = 85,8 % ; intervalle de confiance à 95 % : 81,7 % < f < 89,3 %].
IV . 7. UNE OBSERVATION COMPLÉMENTAIRE : LA MISE ENTRE PARENTHÈSES
Comme nous l’avons déjà signalé, nous n’avions pas prévu les parenthèses dans l’ensemble des signes étudiés. Or, le corpus en comporte et se pose le problème de leur statut par rapport à l’ensemble des signes de ponctuation. Les 60 textes comportaient 143 mises entre parenthèses, dont 9 en condition A, mais surtout 68 et 66 en conditions B et C respectivement. Une mise entre parenthèses au moins a été utilisée par 3, 16 et 17 sujets, respectivement dans les textes A, B et C. Un seul sujet n’a utilisé aucune parenthèse dans ses trois textes.
Mis à part un cas signalé plus haut, les parenthèses ne sont pas utilisées pour regrouper des éléments de haut niveau de l’objet, tels que les zones ou les items dans les zones. La mise entre parenthèses survient pour indiquer les caractéristiques de plus bas niveaux de détail des éléments : la situation dans le plan telle que « la zone microformes (en bas à gauche) » ; l’éditeur du produit ou les années disponibles tels que « ... le CD-ROM Pascal (Inist) disponible sur quatre ans (années 1990 à 1993) » ; ou d’autres renseignements tels que « elle est interrogeable par le logiciel Stairs (commandes de recherche sur le texte intégral, interrogeable en français seulement) ».
Pour chaque mise entre parenthèses, nous avons considéré le premier signe de ponctuation rencontré avant et le premier signe rencontré après l’expression mise entre parenthèses. On constate ainsi que tous les signes peuvent délimiter un membre de phrase incluant une mise entre parenthèses, y compris les signes à valeur de séparation les plus faibles que sont la virgule et le connecteur et. Cependant, et comme on en peut voir un cas dans le dernier exemple ci-dessus, des expressions entre parenthèses comportaient parfois des signes de ponctuation (de 1 à 3 signes). Treize cas ont été décomptés sur les 143 mises entre parenthèses (9,1 %). On y trouve 4 connecteurs et, 8 virgules, 2 tirets, 4 deux-points, et même 1 point.
Le modèle d’usage de la ponctuation proposé par Fayol (1997 a et b) repose sur l’idée que la hiérarchie des signes de ponctuation est utilisée par les sujets comme un système de parenthésage pour marquer en surface, une organisation hiérarchique des éléments de l’objet décrit, en indiquant les forces de liaison entre les éléments successifs. L’expérience rapportée avait pour objet de tester ce modèle de façon drastique et dans le cas d’une rédaction de textes techniques (description d’un plan) plausible pour des adultes techniciens du domaine. Cette tâche était moins contrainte que la tâche de rédaction à partir de trames de scripts utilisées dans les études antérieures. Néanmoins, les comportements des sujets sont restés suffisamment interprétables puisque parmi les 360 cas observés, seuls 7 ont dû être retirés parce qu’impossibles à interpréter.
V . 1. LA VALEUR DE SÉPARATION D’UN SIGNE EST RELATIVE
Fayol (1997 a et b) a montré que le marquage en surface de la hiérarchie des éléments de l’objet décrit dépendait à la fois, du paradigme linguistique (le nombre de signes dont dispose le sujet augmente avec l’âge) et de l’usage qu’un individu donné peut faire des signes dont il dispose. Nous montrons ici que cet usage, chez l’adulte qui dispose de tous les signes, varie d’un sujet à l’autre, en relation avec la complexité de la structure hiérarchique de la représentation de l’objet à décrire. Quand cette structure est simple (liste d’éléments sans détail sur chacun), les sujets utilisent un ou deux signes seulement. Ils se répartissent approximativement à égalité, entre ceux qui choisissent des signes de valeurs de séparation forte (paragraphes, sous-paragraphes), ceux qui retiennent des signes de valeur moyenne (le point) et ceux qui adoptent des signes faibles (point-virgule, virgule, et). Autrement dit, les premiers produisent des listes présentées verticalement (une ligne par élément), les autres des listes présentées en lignes horizontales. Cependant, dès lors que des détails doivent être introduits dans la description (passage au texte B puis au texte C), la structure hiérarchique devient plus complexe et les sujets qui utilisaient des signes de valeur faible, pour séparer les éléments de haut niveau, les remplacent par des signes plus forts afin de disposer de signes plus faibles pour marquer des séparations au niveau inférieur.
Ce phénomène de glissement confirme que la valeur de séparation d’un signe est normalement relative. Grâce au fait que chaque sujet rédigeait les trois textes, ce glissement est observé intra-sujet, ce qui donne de la force au résultat.
V . 2. FORTE VALIDITÉ DU MODÈLE DE FAYOL
Avant de conclure sur la validité, nous devons discuter de la difficulté que nous avons rencontrée, liée à la valeur relative de la virgule et du connecteur et. En tenant compte des résultats de Fayol et Abdi (1990), nous avions admis, pour tester le modèle, que le et avait une valeur de séparation inférieure à celle de la virgule. Il n’en va sans doute pas toujours ainsi. La figure 2 rapporte trois exemples de textes extraits du corpus. Le premier correspond aux résultats de Fayol et Abdi (1990) ; le et peut y être interprété comme ayant une valeur de séparation inférieure à la virgule ; il confirme le rapprochement des deux zones par rapport aux autres, tel qu’il est explicité par la caractéristique commune « au fond de la salle ».
Texte (A1) :
« La salle de libre-service se présente comme suit : en entrant se trouvent face à vous la zone des CD-ROM, à votre droite l’accueil, sur la gauche la zone des documents microformes, au fond de la salle à gauche la zone de reprographie et à droite la zone de banques de données en ligne. »
pattern [Z, Z, Z (Z et Z)]
Texte (A2) :
« La salle libre-service est composée de cinq zones. Trois concernent la recherche d’informations, elles se localisent toutes sur la même diagonale : à l’entrée à gauche se situe la zone des microformes, au centre, la zone de CD-ROM et au fond à droite la zone de banques de données en ligne.
« Les deux zones restantes concernent l’accueil à droite de l’entrée et la zone de reprographie au fond à gauche. »
pattern [(Z, Z et Z) ϒ (Z et Z)]
Sous-paragraphe du texte (B13) :
« – Les CD-ROM : Pascal (Inist), CD-thèses et Francis (Inist) au centre de la pièce,
pattern [Pascal, CD-thèses et Francis]
Le second texte illustre un cas relativement fréquent où le et aurait la même valeur de séparation que la virgule ; il s’agirait alors de listes d’items considérés au même niveau, séparés par des virgules, mais dont la dernière virgule serait remplacée par un et, non pas pour indiquer un rapprochement des deux derniers items par rapport aux autres, mais simplement pour ajouter une indication de « fin de liste ». C’est aussi le cas dans le troisième texte où il est hautement improbable que le sujet ait voulu rapprocher les deux derniers items par rapport au premier (les deux items rapprochables et souvent rapprochés étant le premier et le dernier). Cette conjecture mérite peut-être d’être vérifiée expérimentalement mais elle nous a autorisés à proposer un critère (dit moins strict) qui admet le et de fin de liste comme ayant une valeur de séparation équivalente à celle de la virgule. Nous pensons que ce critère est le plus adéquat pour l’évaluation du modèle.
Quoi qu’il en soit, les résultats montrent une très forte validité du modèle. Globalement, avec le critère strict, 83,8 % des patterns de ponctuations observés confirment le modèle (limite de confiance inférieure : 79,6 %), tandis qu’avec le critère moins strict ce sont 85,8 % des patterns qui confirment le modèle (limite de confiance inférieure : 81,7 %). Or, bien que la consigne demandât de rédiger avec soin, il reste que bon nombre des sujets étaient probablement sous la pression du temps du fait que l’on attendait que tous aient fini une description pour passer à la description suivante. S’agissant de la mise au point d’une notice d’information du public, on peut dire que l’on ne simulait ici que la première rédaction qui normalement serait suivie de plusieurs relectures. Les résultats en sont d’autant plus forts. Il est très plausible qu’une partie non négligeable des patterns qui contredisent le modèle ne corresponde en fait qu’à des inadvertances, du même ordre que les fautes d’orthographe que laisse souvent un rédacteur dans une première version d’un texte, même après relecture, sans que l’on puisse conclure pour autant qu’il ne connaît pas l’orthographe. Pour vérifier cette présomption, il faudrait, dans une expérience semblable, demander aux sujets de confirmer systématiquement les signes utilisés ; seuls les écarts au modèle non corrigés conduiraient à le mettre en doute. Il est donc certain que les valeurs obtenues pour le respect du modèle, même avec le critère moins strict, doivent être prises comme des valeurs par défaut.
V . 3. DES PROBLÈMES À APPROFONDIR
Pour terminer, nous soulignons deux problèmes que nos données permettent de poser mais non de résoudre et pour lesquels des études seraient nécessaires en utilisant une tâche ad hoc : celui des parenthèses, à propos duquel nous avons apporté quelques observations, et celui de la valeur relative du point-virgule et du deux-points.
V . 3 . A. Statut des parenthèses
À notre connaissance, la relation des parenthèses avec les signes de ponctuation n’a pas fait l’objet d’étude expérimentale. Peut-on les considérer comme ayant une force de séparation qui les insère quelque part dans la hiérarchie des signes de ponctuation et connecteurs ? Les observations faites sur le présent corpus montrent que l’on trouve des mises entre parenthèses encadrées par tous les autres signes, y compris les plus faibles que sont la virgule et le connecteur et. Si on considère les parenthèses comme un signe de ponctuation, cette observation incline à faire l’hypothèse qu’elles ont une très faible force de séparation. Cependant, on relève aussi des cas de ponctuation à l’intérieur des parenthèses (virgule, connecteur et, mais aussi deux-points et même un point), ce qui va à l’encontre de cette hypothèse. Or, dans le cadre de la distinction classique entre texte principal et texte secondaire, la mise entre parenthèses a été étudiée en tant que marqueur de mise en retrait et donc de texte secondaire par rapport au texte principal, à l’instar d’autres marqueurs tels que la note de bas de page (Caro & Bisseret, 1997). Dans cette perspective, une conjecture alternative serait de considérer que ce rôle de marqueur de mise en retrait est indépendant du système de ponctuation tel que retenu ici. On s’attendrait à ce que l’éventuelle ponctuation interne aux parenthèses respectât le modèle mais indépendamment de la ponctuation courante de la partie de texte principal dans laquelle s’insèrent les parenthèses. Ce point demande à être étudié plus précisément.
V . 3 . B. Valeurs relatives du deux-points et du point-virgule
Fayol (1997 a, p. 161) donne les hiérarchies entre les signes de ponctuation selon la force moyenne de liaison estimée par des sujets (Fayol & Abdi, 1990) et selon la durée moyenne des pauses à la lecture, d’après Van de Water et O’Connel (1986, cité par Fayol, 1997 a, p. 161). Les hiérarchies ainsi obtenues sont identiques à l’exception de la hiérarchie entre le point-virgule et le deux-points. Selon la durée moyenne des pauses, le deux-points a une force de séparation plus forte que le point-virgule. Par contre, selon la force moyenne de liaison estimée par des sujets, le deux-points a une force de séparation plus faible que le point-virgule. Pour cette étude, nous avons adopté ce dernier ordre. Toutefois, le problème reste ouvert, pour le moins dans le type de texte ici étudié. Il s’agit de descriptions qui comportent une part importante de décomposition d’un objet global en sous-objets eux-mêmes composés de sous-objets. Les textes recueillis comportent donc de nombreuses structures de liste, souvent précédées d’une annonce suivie d’un deux-points. Dans de nombreux cas, les éléments de la liste, derrière le deux-points, sont organisés en alinéa (à la ligne + tiret ou étoile, etc.). Dans d’autres cas, la liste est organisée en ligne ; les éléments sont alors séparés, souvent par une virgule (ainsi que et ; voir les textes de la figure 2), mais en quelques cas aussi par des points-virgules.
Deux exemples typiques sont les suivants :
« La salle libre-service comprend différentes sources d’informations : à droite en entrant vous trouverez l’accueil ; au fond, toujours à droite se situent les banques de données en ligne ; au centre les CD-ROM ; et sur la gauche en entrant vous trouverez les microformes et au fond la reprographie. »
« Le CD-thèses comprend : les thèses de sciences, lettres, droit depuis 1972 ; les thèses de médecine depuis 1983 ; les thèses de sciences vétérinaires depuis 1990. »
Face à de tels textes, il semble difficile de penser que le rédacteur admette une force de séparation plus forte pour les points-virgules qui séparent les divers items listés, que pour le deux-points qui sépare l’annonce de la liste (un terme générique tel que « sources d’informations ») de la liste proprement dite. Ainsi, on peut penser qu’en certains contextes (annonce de liste) le deux-points pourrait jouer un rôle du même type que celui que nous avons évoqué pour les parenthèses. Intuitivement d’ailleurs, il semble souvent possible de remplacer le deux-points par une mise entre parenthèses de ce qu’ils annoncent. Des études plus précises sont nécessaires sur le(s) rôle(s) du deux-points.
Au total, comme nous venons de le souligner, il reste des points à préciser. Il est cependant possible de conclure à la forte validité du modèle de Fayol. Alors qu’à l’école, il n’y a pas d’apprentissage explicite dans ce sens, l’ensemble des signes de ponctuation s’établit, chez les rédacteurs de descriptions d’objets complexes, comme un système de parenthétisation. Lorsqu’ils transcrivent une représentation structurée selon une hiérarchie d’éléments assortis de leurs caractéristiques, le passage à la stricte linéarité du discours les entraîne à juxtaposer dans leur description des éléments qui sont distants dans leur représentation. Les rédacteurs traitent les signes de ponctuation comme ordonnés selon une force de séparation/liaison et les utilisent pour moduler la signification des juxtapositions en marquant les regroupements/séparations d’éléments et leurs niveaux hiérarchiques relatifs. Le marquage de la hiérarchie d’éléments par la ponctuation apparaît donc comme un des moyens utilisés par les rédacteurs pour pallier ces effets de la contrainte de linéarisation.
Conclusions pratiques
L’étude qui a été présentée participait à un programme de recherche ; elle ne partait donc pas d’un objectif pratique précis. Il s’agissait de contribuer à l’analyse et la modélisation de l’activité cognitive des rédacteurs techniques. Cependant, la simplicité du modèle de Fayol (1997 a et b) et la démonstration de sa très forte validité nous paraissent d’un grand intérêt pour la pratique.
Nous suggérons d’abord une utilisation méthodologique de ces résultats. La ponctuation peut être considérée comme une trace fiable de la structure des représentations d’objets construites par les personnes. Faire décrire par écrit un objet s’avère donc une technique possible de mise au jour des représentations, tant dans une perspective de recherche que de pratique ; on peut considérer la ponctuation comme l’un des observables qui permettent d’inférer les représentations que construisent les personnes des objets de leur activité. Tout particulièrement sur le terrain, dans le cadre d’une analyse de l’activité cognitive d’opérateurs, on peut envisager d’utiliser une telle technique, pour découvrir, de façon relativement simple et rapide, la structure de la partition que les opérateurs opèrent sur tel objet important de leur activité (par ex., tableaux de commandes, installations supervisées, magasins (tenus ou fréquentés), secteurs géographiques d’activité, etc.)
La formation des rédacteurs est un autre domaine d’application : nous pensons qu’elle pourrait bénéficier d’un exposé, voire d’une mise en évidence empirique, du modèle de Fayol. Cette recommandation peut étonner et nous devons la justifier ; par ailleurs, en prérequis, elle suppose une certaine efficacité de ce système de ponctuation en compréhension.
D’abord, on peut s’étonner de la recommandation : quelle utilité y aurait-il à former des rédacteurs à des comportements dont on montre qu’ils les produisent spontanément ? Certes, former à ponctuer selon le modèle est superflu ; mais ce comportement est implicite et en favoriser la prise de conscience nous paraît utile. Pour un autre aspect de la rédaction, la planification des idées, Flower et Hayes (1980, p. 44) ont insisté sur le fait que les bons rédacteurs se distinguent par le fait qu’ils sont conscients de leurs processus cognitifs ; ils peuvent les expliciter, contrairement aux mauvais rédacteurs. Ces auteurs recommandent que la formation favorise cette prise de conscience des processus (Flower & Hayes, 1981, p. 56). Dans le même sens, nous pensons que faire prendre conscience aux rédacteurs du fait qu’ils ponctuent leurs descriptions selon un modèle systématique et clairement explicitable leur serait profitable.
Par ailleurs, le prérequis pour un tel renforcement est que ce modèle de production de la ponctuation soit favorable à la compréhension. Nous pensons que c’est le cas, comme pour d’autres comportements de rédacteurs. En effet, une hypothèse générale très plausible est que si, en position de rédacteurs, les personnes manifestent un mode de description dominant, elles s’attendent à ce même mode lorsqu’elles sont en position de lecteurs ; une telle attente, si elle est satisfaite, facilite la compréhension. Denis et Denhière (1990) ont validé cette hypothèse en ce qui concerne le mode de structuration d’une description spatiale ; ils ont montré qu’un mode de structuration fréquent chez les rédacteurs (comparé à un autre plus rare) donnait lieu à une lecture plus rapide et à de meilleurs rappels chez les lecteurs. Dans le même sens, Zacks et Tversky (1999) ont démontré que la correspondance établie par les personnes entre la forme de graphique (en histogramme
vs en courbe) et le message délivré (comparaisons discrètes
vs tendance globale) est la même en production et en compréhension. Concernant la ponctuation, il a été montré, grâce à la technique ADFM
[4], que la possibilité de prévoir la ponctuation à venir dans le texte accélérait le temps de lecture (Coirier, Gaonac’h et Passerault, 1996, p. 183). Plus spécifiquement, Fayol (1989) a montré qu’un texte ponctué en congruence avec l’organisation du modèle mental de la situation décrite est jugé plus compréhensible qu’un autre dans lequel cette correspondance n’est pas respectée. Il y a donc de bonnes raisons de penser que le système de ponctuation mis en évidence en situation de production se trouve être efficace en situation de compréhension. On peut penser qu’un tel ajustement se produit à la faveur des interactions de communication dans une communauté de rédacteurs/lecteurs avec pour résultat, le développement d’une convention implicite (Zacks & Tversky, 1999).
Enfin, le troisième domaine d’application que nous suggérons est celui de la génération de textes par ordinateur. Dans ce domaine, la grande diversité des règles partielles recensées dans les traités de linguistique sur la ponctuation est dissuasive pour leur introduction dans un système de génération (cf. note 2, p. 368). Pour peu que l’objectif ne soit pas littéraire mais se limite à des textes techniques, le modèle de Fayol se présente comme une alternative très intéressante. Il modélise le comportement de rédacteurs humains tout en favorisant la compréhension. Or, il est simple ; il semble possible de le traduire en un ensemble de règles peu nombreuses et suffisamment formalisables pour en munir un système de génération de descriptions techniques (Mounier, 1997).
Nous devons beaucoup à Michel Fayol pour des échanges très intéressants sur le sujet ainsi que pour sa relecture très attentive de premières versions ; ses nombreuses suggestions nous ont été très utiles. Nous remercions également Michel Denis, Jean-Michel Hoc et Jean-Michel Passerault pour leurs questions et leurs remarques qui nous ont permis d’améliorer la clarté de l’article. Enfin, nous remercions Mireille Bétrancourt et Anne Pellegrin qui ont participé à l’édition de ce texte.
Manuscrit reçu : janvier 2000.
Accepté après révision par J.-M. Hoc : mai 2001.
·
Anderson, J. R. (1983). The architecture of cognition. Cambridge, MA : Harvard University Press.
·
Bisseret, A., & Montarnal, C. (1996). Linearization in spatial descriptions : Tour or hierarchical structures ? Current Psychology of Cognition, 15, 487-512.
·
Caro, S., & Bisseret, A. (1997). Étude expérimentale de l’usage des organisateurs paralinguistiques de mise en retrait dans les documents électroniques. Le Travail Humain, 60, 409-437.
·
Catach, N. (1994). La ponctuation. Paris : PUF.
·
Chanquoy, L. (1989). La description de l’emploi du temps d’une semaine par des enfants de CE 1. Études de linguistique appliquée, 73, 45-56.
·
Chanquoy, L., Foulin, J. N., & Fayol, M. (1990). The on-line management of short text writing by children and adults. Cahier de Psychologie Cognitive, 10, 513-540.
·
Coirier, P., Gaonac’h, D., & Passerault, J.-M. (1996). Psycholinguistique textuelle. Paris : Armand Colin.
·
Daniel, M.-P., Carité, L., & Denis, M. (1996). Modes of Linearization in the description of spatial configurations. In J. Portugali (Ed.), The construction of cognitive maps (pp. 297-318). Dordrecht, The Netherlands : Kluwer.
·
Denis, M., & Denhière, G. (1990). Comprehension and recall of spatial descriptions. Cahier de Psychologie Cognitive, 10, 115-143.
·
Drillon, J. (1991). Traité de la ponctuation française. Paris : Gallimard.
·
Ehrich, V., & Koster, C. (1983). Discourse organization and sentence form : The structure of room descriptions in Dutch. Discourse Processes, 6, 169-195.
·
Fayol, M. (1989). Une approche psycholinguistique de la ponctuation. Étude en production et en compréhension. Langue Française, 81, 21-39.
·
Fayol, M. (1997 a). Des idées au texte. Psychologie cognitive de la production verbale orale et écrite. Paris : PUF.
·
Fayol, M. (1997 b). On acquiring and using punctuation : A study of written french. In J. Costermans & M. Fayol (Eds.), The processing of interclausal relationships (pp. 157-178). Hillsdale, NJ : Laurence Erlbaum Associates.
·
Fayol, M., & Abdi, H. (1988). Influence of script structure on punctuation. Cahiers de Psychologie Cognitive, 8, 265-279.
·
Fayol, M. & Abdi, H. (1990). Ponctuation et connecteurs. In M. Charolles, S. Fischer, & J. Jayez (Eds.), Le discours (pp. 167-180). Nancy : Presses Universitaires de Nancy.
·
Ferreiro, E., & Pontecorvo, C. (1999). Managing the written text : The beginning of punctuation in children’s writing. Learning and Instruction, 9, 543-564.
·
Flower, L. S., & Hayes, J. R. (1980). The dynamics of composing : Making plans and juggling constraints. In L. W. Gregg & E. R. Steinberg (Eds.), Cognitive processes in writing (pp. 31-50). Hillsdale, NJ : Laurence Erlbaum Associates.
·
Flower, L. S., & Hayes, J. R. (1981). Plans that guide the composing process. In C. H. Frederiksen & J. F. Dominic (Eds.), Writing : The nature, developpement and teaching of written communication ; vol. 2 : Writing : Process, development and communication (pp. 39-58). Hillsdale, NJ : Laurence Erlbaum Associates.
·
Hayes, J. R., & Flower, L. S. (1980). Identifying the organisation of writing processes. In L. W. Gregg & E. R. Steinberg (Eds.), Cognitive processes in writing (pp. 3-30). Hillsdale, NJ : Laurence Erlbaum Associates.
·
Levelt, W. J. M. (1982 a). Linearization in describing spatial networks. In S. Peters & E. Saarinen (Eds.), Processes, beliefs, and questions (pp. 199-220). Dordrecht, The Netherlands : Reidel.
·
Levelt, W. J. M. (1982 b). Cognitive style in the use of spatial direction terms. In R. J. Jarvella & W. Klein (Eds.), Speech, place, and action (pp. 251-267). Chichester, UK : John Wiley.
·
Linde, C., & Labov W. (1975). Spatial networks as a site for the study of language and thought. Language, 51, 924-939.
·
McNamara, T. P. (1986). Mental representations of spatial relations. Cognitive Psychology, 18, 87-121.
·
McNamara, T. P., Hardy, J. K., & Hirtle, S. C. (1989). Subjective hierarchies in spatial memory. Journal of Experimental Psychology : Learning Memory and Cognition, 15, 211-227.
·
Merlen, E. (1992). Cinquante-deux balades en famille autour de Grenoble. Grenoble : Éditions Didier Richard.
·
Mounier, É. (1997). L’utilisation du système de ponctuation dans le cadre de descriptions spatiales. Communication présentée à Génération automatique de Texte 97. Grenoble, France, octobre.
·
Palmer S. E. (1977). Hierarchical structure in perceptual representation. Cognitive Psychology, 9, 441-474.
·
Shanon, B. (1984). Room descriptions. Discourse Processes, 7, 225-255.
·
Taylor, H. A., & Tversky, B. (1992). Descriptions and depictions of environments. Memory and Cognition, 20, 483-496.
·
Tournier, C. (1980). Histoire des idées sur la ponctuation. Des débuts de l’imprimerie à nos jours. Langue Française, 45, 28-40.
·
Zacks, J., & Tversky, B. (1999). Bars and lines : A study of graphic communication. Memory and Cognition, 27, 1073-1079.
[1]
Ces études, la nôtre aussi, s’inscrivent dans la perspective fonctionnelle qui inclut l’alinéa, le changement de paragraphe (voire le chapitre et le tome), dans la ponctuation (voir par ex., Drillon, 1991, chap. 13 ; Fayol, 1997
a, p. 149). On parle de « ponctuation du texte » (par ex., Catach, 1994, p. 50 ; Tournier, 1980, p. 38).
[2]
Nous restons dans le cas de descriptions techniques, sans prétendre couvrir tous les usages possibles, dans la rédaction littéraire en particulier. Dans celle-ci, force est de supposer que d’autres usages sont possibles, en constatant que Drillon (1991) y distingue 140 cas d’emploi de la virgule ! Encore faudrait-il y regarder de plus près, car il se focalise sur chaque signe pris isolément (un chapitre par signe) plus qu’en ses relations aux autres.
[3]
Un lecteur nous a fait remarquer qu’un plan « serait plus profitable aux utilisateurs » qu’un texte. C’est possible, mais il se trouve que la mise à disposition d’un tel texte est une pratique courante dans les centres de documentation (d’ailleurs, un plan y est souvent joint). Nous n’avions pas à juger cette pratique ; elle nous fournissait une tâche réaliste, adéquate pour notre objectif.
[4]
ADFM (autodécryptage par fenêtre mobile). Le sujet lit un segment de texte courant mais dispose du segment suivant crypté. Ce dernier peut cependant comporter ou non la ponctuation en clair.