Introduction

Quelle patience n’a-t-il pas fallu à Roger Little en 1965 pour composer “manuellement” le premier index de l’œuvre de Saint-John Perse, Word Index of the complete Poetry and Prose of Saint-John Perse[1] ! Combien de vérifications successives, et de comptes différents au hasard des accents déplacés ou des homographes échappés à la vigilance du lecteur, avant de pouvoir prétendre établir chaque fois le chiffre exact !

Mais, dès la parution de l’ouvrage, le fastidieux travail auquel il s’était astreint a révélé son utilité pour les chercheurs. Ils ont pu ainsi, en feuilletant les pages, comparer la fréquence des mots, ou vérifier ce que leur intuition de lecteur leur avait fait pressentir : l’importance du vocabulaire de la mer, des mots “songe”, sables”, ou “sel” ou encore l’usage abondant des adjectifs “grand”, “haut”, “pur”, etc. . .

 Cependant, quelle qu’ait été l’utilité de l’entreprise, le programme a assez vite montré ses limites. L’exhaustivité du dépouillement s’est trouvée compromise par la parution de nouveaux textes : le discours “Pour Dante” en 1965 et d’autres écrits publiés dans l’édition des Œuvres complètes procurée par le poète dans la Pléiade en 1972, de nouveaux poèmes – “Nocturne” en 1972, “Sécheresse” en 1974 – et enfin l’ultime recueil, Chant pour un équinoxe. En effet, quelques mois avant sa mort en 1975, Saint-John Perse avait regroupé sous ce titre les deux derniers poèmes et deux textes antérieurs, dont l’un s’intitulait déjà “Chant pour un équinoxe”.

Par ailleurs, la double mention que le critique anglais faisait dans son titre de la poésie et de la prose portait à confusion. Saint-John Perse s’est assez souvent exprimé sur ce qu’il appelait vers ou verset pour que l’on renonce même à l’appellation de prose poétique pour les recueils qu’il a publiés. [2]

Mais qu’en est-il des discours d’apparat, des hommages ou de certains témoignages ? Sont-ils prose ou poésie ?

Assurément le rythme, les images ou l’organisation séquentielle rappellent ceux de certains poèmes, et l’on y sent souvent le dessein de “faire œuvre d’art”. C’est également le cas pour un certain nombre de lettres choisies par Saint-John Perse pour l’édition de la Pléiade, en particulier pour les Lettres d’Asie[3].

Toutefois le caractère référentiel de ces œuvres de circonstance ne leur permettait pas de figurer dans l’œuvre poétique auprès de poèmes publiés comme tels par Saint-John Perse et qui sont “irréductibles à tout l’ordre temporel, affranchis de toute heure comme de tout lieu”[4].

En tout état de cause, c’est le poète lui-même qui, dans l’édition de la Pléiade en 1972, a clairement défini ce qui constituait son œuvre poétique. Sa mort, en 1975, en a établi le corpus définitif puisque Saint-John Perse avait récusé à l’avance toute publication posthume sous ce titre. Et la réédition des Œuvres Complètes en 1982 n’a fait que rajouter les nouveaux poèmes du recueil Chant pour un équinoxe, dont il avait lui-même préparé la publication.

Il devenait désormais possible de travailler sur un corpus rigoureusement défini et publié dans une collection dont la référence s’impose à tous les chercheurs. Le développement de l’outil informatique a fait le reste en garantissant l’exhaustivité et la fiabilité de l’indexation. Il suffisait simplement de fixer les paramètres de son protocole en fonction des particularités de l’œuvre.

Comme la base de données linguistiques de Nancy ne disposait pas de la totalité des poèmes de Saint-John Perse, le texte complet de l’œuvre poétique a été “scannérisé” et transféré sur un logiciel de traitement de texte par l’équipe de techniciens[5] de l’UPR 6861 du C. N. R. S. à l’Université de Nice-Sophia-Antipolis. Des relectures et des vérifications successives nous ont permis d’éliminer de façon quasi complète les erreurs ou fautes de frappe, afin de confier un texte fiable au logiciel Hyperbase[6] utilisé pour l’indexation.

Le corpus a été réparti sur 9 cartes rassemblées en un seul fichier dans une pile de ce logiciel. Chacune de ces cartes est constituée par le texte d’un recueil ou d’un ensemble de poèmes tels qu’ils ont été définis et paginés dans l’édition de la Pléiade publiée en 1982. Pour la neuvième carte, il a cependant paru plus judicieux de restituer l’organisation et le titre général de Chant pour un équinoxe que Saint-John Perse avait fixés pour l’édition de son recueil chez Gallimard en 1975 ; plutôt que de réserver à un supplément les deux derniers poèmes, “Sécheresse” et “Nocturne”, comme cela avait été fait dans l’édition de la Pléiade de 1982, vraisemblablement pour respecter la pagination de l’édition antérieure des œuvres complètes. La référence “Chant” concerne donc successivement “Sécheresse”, “Chant pour un équinoxe”, “Nocturne” et “Chanté par celle qui fut là”. Mais c’est bien évidemment la pagination de la Pléiade que désignent les références.

Enfin il a paru indispensable de corriger deux coquilles de cette édition et de restituer un où à la place d’un ou (en dernière ligne de la page 410 pour Oiseaux ), et, comme l’avait fait Albert Henry dans l’édition critique d’Amitié du Prince[7], figues pures au lieu de figues mûres en p. 67.

Dans le traitement du corpus lexical, reconnaissons cependant une des limites du logiciel Hyperbase qui a dissocié le Ô du ô alors qu’ il s’agissait de la même forme, avec ou sans majuscule du fait de sa position en tête ou à l’intérieur de la phrase. Il faudra donc additionner les deux ensembles d’occurrences pour apprécier l’importance de l’invocation. Mais on peut aussi remarquer que cette limite se retourne en avantage dans un cas précis d’homographie. En effet, pas plus que dans les autres index, il n’a été possible d’obtenir ici une distinction automatique entre les homographes ; sauf pour avis le mot français et l’Avis latin qui, ayant opportunément pris ses lettres de noblesse dans la nomenclature ornithologique à l’usage des poètes, s’est retrouvé, dans l’index comme dans le texte, coiffé d’une majuscule.

Si la fiabilité est la première vertu de l’ordinateur, l’exhaustivité dépend du programme qui lui est proposé. Or cet index s’est voulu plus proche d’un répertoire de mots de poète que de la tradition lexicographique. C’est pourquoi on n’y retrouvera pas, regroupées, les différentes formes d’une entrée de dictionnaire. Et si la lemmatisation n’a pas été effectuée, ce n’est pas tant parce que le logiciel n’en permettait pas la réalisation automatique que parce que les différentes formes étaient plus intéressantes en elles-mêmes. En effet, pour un texte de poésie où les phonèmes ont une si grande importance, n’est-il pas artificiel de donner un infinitif que les poèmes ignorent, ou le singulier d’un mot que Saint-John-Perse n’emploie jamais qu’au pluriel? Assurément la disposition par ordre alphabétique est déjà un premier artifice, mais le maintien de toutes les formes séparées, comptabilisées et référencées, permet de mieux apprécier les temps de prédilection et les qualités phonétiques des genres, des nombres ou des formes conjuguées. Ce choix rend sensible l’usage particulièrement fréquent et significatif du pluriel dans l’écriture de Saint-John-Perse qui regroupe en grandes foules “toutes sortes d’hommes dans leurs voies et façons”[8].

  C’est encore ce même principe qui a écarté les citations anglaises et latines mises en exergue de certains poèmes puisque, par définition, les mots qu’elles contenaient n’avaient pas pu être manipulés par Saint-John Perse. En revanche, ont été conservés les mots anglais (Thanksgiving Day, starling), latins (ave, avis), et les mots des îles ou d’ailleurs (Annaô, anhinga, Ologhi, Yaghé) qu’il s’était appropriés pour leurs connotations ou leurs vertus rythmiques. Il en a été de même pour les mots des titres, qui ont été comptabilisés sous leurs formes respectives.

Cependant, pour créer un index qui soit utile et suffisamment clair pour le plus grand nombre de lecteurs, il est nécessaire d’opérer un certain filtrage.

Certes, la relative minceur de l’œuvre poétique de Saint John Perse eût permis l’indexation de tous les formes, mais le repérage des signes de ponctuation (5777, / 1892. / 1067 … / 1003 ! ), s’il est précieux pour une étude linguistique ou stylistique, aurait occupé un espace excessif dans un ouvrage destiné à l’ensemble des chercheurs.

On a renoncé pour les mêmes raisons à l’indexation des mots-outils, articles[9], prépositions très usuelles (à / au / aux / de / d’ / du / des / en / sur / dans), Les très hautes fréquences se retrouvant généralement pour ces formes dans la plupart des textes, leur repérage ne semblait pas devoir apporter de révélation particulière. On trouvera cependant en annexe la liste des formes ainsi éliminées, avec l’indication de leur fréquence.

La règle a été de ne conserver que les formes dont la fréquence était inférieure à 500 occurrences. Cependant 6 formes ont échappé à cette règle : nous (865) / qui (689) / est (667) / comme (596) / plus (511) et enfin le mot mer, vedette du lexique avec 530 occurrences pour le singulier et 35 pour le pluriel.

L’absence de tout autre filtre permet donc de retrouver toutes les formes significatives pour une étude stylistique et un grand nombre d’éléments pour des analyses linguistiques.

Mais il fallait tenir compte de l’ambiguïté qu’entretiennent les homographes. Pour la lever, dans tous les cas où le problème pouvait se poser, il a donc été nécessaire de retourner au texte et d’examiner le contexte. Remarquons simplement que si cette opération de désambiguïsation est indispensable lorsque l’on veut traiter des mots tels que est (forme verbale) et est (point cardinal), ou pas (substantif) et pas (adverbe de négation), la polysémie sur laquelle joue par nature la poésie, et surtout celle de Perse dans laquelle de lointaines étymologies et tous les jeux phono-sémantiques générés par le contexte travaillent secrètement les mots, cette polysémie ne permet pas de mener, de façon satisfaisante, dans le cadre d’un simple index, une opération de désambiguïsation qui aurait exigé la démultiplication d’un trop grand nombre de formes. Ainsi, par exemple, il n’a pas été possible de déjouer l’antanaclase sous la forme place qui assimile l’élément de l’expression verbale prendre place au substantif place[10]. Mais pour tous les cas où cela était indispensable, la catégorie grammaticale à laquelle appartient la forme – préposition, adjectif, participe passé, adverbe, verbe ou substantif – a été identifiée en sous-entrée.

Il faut reconnaître enfin que les mots composés et les majuscules constituent les limites de la fiabilité de l’indexation car le processus d’Hyperbase ne permettait pas de distinguer le tiret interne des autres séparateurs, et il comptabilisait séparément les mêmes formes selon qu’elles avaient, ou non, la majuscule à l’initiale. Il a donc fallu retrouver “manuellement” les formes composées. Plusieurs vérifications croisées ont limité les risques d’erreur ou d’oubli. Ils n’ont probablement pas été complètement éliminés.

Les mots composés sont indexés en retrait de 5 espacements (pour indiquer que tous leurs éléments sont déjà comptabilisés à leurs entrées respectives) juste après le premier mot de la forme composée. Et ils le remplacent, sans retrait, si ce premier mot n’a aucune autre occurrence.

Si le premier mot n’est pas le mot principal, ils réapparaissent également sous leur forme composée, et en retrait, mais cette fois précédés d’un astérisque, juste après le mot principal du groupe.

Enfin, chacune des autres formes qui les composent est indexée à sa place dans l’ordre alphabétique. Si elle n’a aucune autre occurrence dans le texte, elle apparaît précédée et/ou suivie d’un – selon sa place dans le mot composé. Elle est supprimée si elle introduit artificiellement l’ambiguïté d’un homonyme. Ainsi par exemple bas-fonds est indexé en retrait juste après bas et juste après fonds, mais chauves-souris s’inscrit dès le début de la ligne à la place de chauves, forme inconnue dans les poèmes de Perse, et n’apparaît pas à souris puisque l’œuvre poétique ignore ces vulgaires rongeurs. Quant au nom de la plante Pî-lu, son second élément n’est pas indexé isolément puisqu’il ne peut évidemment pas être considéré comme lu. Il ya déjà suffisamment d’homographes dans les formes simples pour que l’on ne s’aventure pas à en rajouter avec des membres de corps étrangers!

  Si toutes les formes composées ont pu être répertoriées, certaines d’entre elles, créées par le poète pour une seule apparition, ne figurent cependant pas sous leur forme complète. Il en est ainsi pour très-belle / très-blanc (ELOG 7a) / très-maigre (ROIS 65a) / très réelle (AMER 372d) Un-peu-humide (Rois 60a) / Homme-très-attrayant ou Sans-coutume-parmi-nous (ROIS 65f), ou encore pour le syntagme verbal appelait-par-leur-nom (ELOG 25e). Mais c’est surtout pour une raison d’ordre typographique, parce qu’il était trop long, que le si poétique hapax jaune-taché-de-noir- pourpre-à-la-base (ELOG 36b) n’a pas été retenu dans l’index, alors que l’herbe-à-Madame-Lalie parvenait à s’y glisser toute entière!

Quoi qu’il en soit, on retrouve tous les éléments de ces formes composées, comptabilisés et référencés à la place que leur assigne l’ordre alphabétique. Et il suffit d’en croiser deux pour retrouver la référence de l’expression. Il en est de même pour les pronoms composés ceux-là /celle-là, ou les adverbes là-haut / là-bas / par-dessus ou les nombres comme trente-deux.

La majuscule a été uniquement restituée pour les noms dits propres, ou plus précisément pour les noms de personnes, de peuples, de pays, de contrées ou encore de fêtes solennelles. Il n’a pas été possible de répertorier les autres mots(adjectifs substantivés ou noms communs) qui, pourvus d’une majuscule, prenaient soudain l’allure d’un titre ; parfois dans tous leurs emplois comme pour Conteur ou Narrateur, parfois dans certaines occurrences seulement comme pour mers, îles ou chroniques, et souvent au pluriel .

Ainsi limités, les noms à majuscule étaient trop peu nombreux pour constituer une liste à part. Et leur maintien dans l’index général permettait de disposer d’ensembles phonétiquement proches (du moins pour la première syllabe) et qui pouvaient suggérer une piste de recherches.

Mais si le logiciel avait permis d’indexer tous les mots auxquels Perse avait attribué une majuscule, il eût été intéressant de présenter parmi les noms propres, dans une liste particulière, tous les noms communs ainsi anoblis[11], et qui constituent très souvent un hapax, comme tous ces Dénonciateurs, Disputeurs et autres Inquisiteurs. Et on aurait pu voir Dieu surgir soudain en force, onze fois, dans les deux derniers poèmes, alors que, dans Amers, le Poète a toujours le signe graphique de sa noblesse.

Quoi qu’il en soit de toutes ces réserves, les références et les fréquences restent au dessus de tout soupçon. Elles constituent les “amers” de l’index à condition que, d’ île en île, on prenne le temps de visiter tout l’archipel.

Comme tous les autres, cet index permet d’abord de retrouver aisément une citation : à partir d’un mot que l’on a en tête ou, plus vite encore, à partir de deux mots. Il suffit de croiser l’ensemble de leurs références. Dans la grande majorité des cas, une seule d’entre elles leur est commune : c’est celle de la citation cherchée.

On peut encore, à partir de l’index, étudier l’usage des couleurs : lesquelles, surtout, dans quelles œuvres ? Et, par exemple, faire jouer tous les verts[12] de l’ensemble de l’œuvre avec leurs homonymes.

On peut enfin comparer les fréquences et remarquer par exemple que si le substantif rêve a 8 occurrences, rêves n’apparaît jamais. Alors que songes se retrouve 39 fois, loin derrière le songe singulier qui a 134 occurrences. Comment alors ne pas céder à la fascination de ce “trou noir” que Charles Muller appelle la fréquence zéro?

Bref l’index constitue une carte fort utile pour qui part à l’aventure du texte. Mais la traversée commande de savoir où, quand et comment “tirer des bords”. N’est-ce-pas le propre du “Maître d’astres et de navigation” qui, cette fois du moins, pourrait être le chercheur?

Éveline Caduc

[1] L’ouvrage édité par l’auteur à Durham (University Press) en 1966, comportait 290 pages. Mais la seconde édition, à Southampton en 1967, présentait déjà un supplément A de 44 pages.
[2] Voir par exemple, la lettre à Mrs Francis Biddle du 12 décembre 1955 : “… cette question de métrique interne, rigoureusement traitée dans la distribution générale et l’articulation de grandes masses prosodiques (où sont bloqués, par strophes, ou laisses, dans une même et large contraction, avec la même fatalité, tous éléments particuliers traités comme vers réguliers – ce qu’ils sont en réalité). Il est facile, évidemment au lecteur étranger de se méprendre sur cette économie générale d’une versification précise, encore qu’inapparente, et qui n’a absolument rien de commun avec les conceptions courantes du “vers libre”, du “poème en prose” ou avec la grande “prose poétique”. C’est même de tout le contraire qu’il s’agit là ” (Pléiade, Œuvres Complètes, p. 922).
[3] Et la démonstration vient d’être faite que certaines d’entre elles (en particulier des lettres à sa mère, dites d’Asie, et la fameuse lettre à Conrad) ont été composées ou, du moins, largement recomposées pour la publication des Œuvres Complètes. Voir la thèse (encore inédite) de Catherine Mayaux Le référent Chinois dans l’œuvre de Saint-John Perse (Université de Pau et des Pays de l’Adour, juin 1991) ; première partie : “Fausses vraies lettres et vraies fausses lettres d’Asie”.
[4] Lettre à Adrienne Monnier du 26 mars 1948, Pléiade, Œuvres Complètes, p. 552.
[5] Pierrette Uboldi pour la saisie du texte et Jacques Hammerschmitt pour le contrôle technique.
[6] Ce logiciel, conçu par Etienne Brunet, est une adaptation très spécifique du logiciel Hypercard pour l’analyse statistique des données littéraires.
[7] “Amitié du Prince” de Saint-John Perse. Edition critique. Transcription d’états manuscrits. Etudes. Publications de la Fondation Saint-John Perse, N.R.F. Gallimard 1979.
[8] Anabase X p.112.
[9] Malheureusement l’élimination des articles définis a inévitablement entraîné celle de leurs homographes, les pronoms le, la, l’, les.
[10] Cf. Anabase X p.113d.
[11] Ce stylème est l’une des composantes du processus d’inflation que j’ai décrit dans Saint-John Perse Connaissance et Création, J. Corti 1977, p.122-135.
[12] L’étude du vert a fait l’objet d’un premier article que j’ai écrit après avoir achevé la constitution de l’Index “Le vert de Saint-John Perse “, in Alain Vuillemin Les banques de données littéraires (ouvrage en cours d’impression).

Top