Édition critique des textes anciens et représentation d’une tradition multiple
Quelques remarques sur le double défi de l’ecdotique classique au prisme des outils numériques
Bruno Bureau, « Édition critique des textes anciens et
représentation d’une tradition
multiple », dans Robert Alessi, Marcello Vitali-Rosati (dir.), Les
éditions critiques numériques : entre tradition et changement de
paradigme (édition augmentée), Les Presses de l’Université de
Montréal, Montréal, 2023, isbn : 978-2-7606-4857-9, https://www.parcoursnumeriques-pum.ca/12-editionscritiques/chapitre4.html.
version 0, 27/03/2023
Creative
Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)
Si de l’homme à la machine, le statut du texte ancien édité se trouve toujours, comme on vient de le voir, celui d’un texte unique patiemment reconstitué par le travail savant de l’instance éditoriale, il faut garder à l’esprit que ce travail porte sur de multiples témoins qui offrent à son analyse une grande diversité de textes. Le travail d’édition repose donc sur des opérations complexes de classement et de tri, d’identification des fautes dans la transmission, mais aussi de choix entre différentes leçons. En revanche, reconstituer l’histoire du texte revient à mettre l’accent sur la diversité et le foisonnement des variations qui se lisent dans les manuscrits. La technologie change la représentation traditionnelle de l’apparat critique. Cela est particulièrement évident dans la méthode dite de la « segmentation parallèle », qui permet de suivre les variations au fil du texte tout en décrivant avec précision les données encodées. Cette fois, l’apparat n’est plus dissocié du texte : il en suit finement tous les contours, mais il le fait au prix d’une complexité qui dépasse vite les forces de l’encodeur humain. La solution proposée ici consiste à dissocier la phase de collation des témoins de celle de la constitution de l’apparat critique. À partir d’un texte « pivot » entièrement lemmatisé, mais dépourvu de ponctuation, l’éditeur saisit séparément les variations de chaque témoin. La confection de l’apparat est ensuite confiée à un traitement automatique.
Dans les pages qui suivent, nous souhaitons proposer une réflexion sur les conséquences à la fois méthodologiques et épistémologiques des techniques de l’édition numérique de textes anciens.
L’existence aujourd’hui de multiples projets d’édition numérique de textes anciens ou médiévaux et l’attention portée par la plupart des chercheurs et chercheuses qui entrent dans la voie de l’édition critique aux possibilités offertes par les outils numériques, font que nous disposons désormais d’une forme de recul qui montre, non seulement comment l’approche du processus éditorial a pu évoluer dans le cas des textes anciens (Burghart et Rehbein 2012), mais aussi que nous nous trouvons à un moment intéressant d’un point de vue épistémologique. Désormais, la pratique, construite en grande partie ad hoc pour des projets donnés, peut en effet appeler dans la transmission des méthodes éditoriales (par exemple un cours d’édition numérique des textes anciens) une formalisation de règles, ou au moins de recommandations, qui prennent en compte les réussites (et les échecs) des éditions antérieures et orientent le travail de la communauté liée à l’édition.
Nous reviendrons d’abord brièvement sur le processus éditorial lui-même et ses ambiguïtés dans la tradition universitaire classique, pour voir ensuite comment certains outils numériques permettent de faciliter la réalisation par l’éditeur ou l’éditrice du « cahier des charges » attendu pour une édition critique, en même temps qu’ils interrogent l’articulation de l’établissement du texte avec la représentation de l’histoire de celui-ci. Nous verrons alors pour terminer, à partir d’un exemple, comment les deux dimensions peuvent se rejoindre, non sans toutefois remettre de nouveau en question l’objet éditorial et les possibilités qu’il offre.
L’ambiguïté du processus éditorial concernant les textes anciens
L’édition critique des textes anciens, telle qu’elle est conçue depuis le début du XIXe siècle où elle s’est dotée d’une approche méthodique et scientifique, repose sur la recherche, par-delà la diversité des textes fournis par les multiples manuscrits d’une œuvre donnée parvenue jusqu’à nous, de l’état le plus proche possible de ce que l’on suppose avoir été le texte original – ce qui nécessite de rendre compte de l’histoire de ce texte. Ainsi lit-on dans les Règles et recommandations pour les éditions critiques qui constituent le cahier des charges de la collection latine des Belles-Lettres (André 1972), référence francophone des éditions des textes anciens classiques, ces deux exigences complémentaires formulées de la manière la plus claire« l’[édition] entraîne de la part de son auteur l’obligation de réviser soigneusement le classement des manuscrits, et de constituer, à l’aide de tous les éléments utilisables, l’histoire du texte durant l’Antiquité et le Moyen Âge » et un peu plus loin à propos des éléments critiques fournis au lecteur : « l’apparat critique [devra] toujours [être constitué] et disposé de telle sorte qu’on puisse y trouver le reflet des différents états successifs du texte édité. » (André 1972, 3).↩︎. Il existe donc une double exigence qui se présente à l’éditeur : celle, d’une part, de donner un texte et un seul, qui, annulant en quelque sorte la diversité des témoins qui lisent ce texte, propose ce que l’éditeur considère comme le texte le plus correct, c’est-à-dire le plus proche du texte originellement produit ; et, d’autre part, celle de représenter cette diversité qui résulte de la multiplicité, sur le temps parfois très long, de copies produites dans des conditions matérielles, des ères culturelles et des critères de compétences des scribes variés.
Or à y bien réfléchir ces deux mouvements, bien que nécessaires l’un et l’autre, représentent des exigences qui peuvent être contradictoires.
D’un côté en effet, il s’agit de proposer une sorte de généalogie du texte. Il n’est nullement dû au hasard que le vocabulaire de l’ecdotique ancienne emprunte beaucoup de termes à la généalogie : lorsque des manuscrits présentent des particularités communes, par exemple une lacune au même endroit, on parle de « familles », dont on va rechercher « l’ancêtre », mais on invoquera également la « parenté » qui peut exister entre deux familles ou deux témoins, et, si la tradition manuscrite le permet, on essaiera de constituer un stemmaMot grec qui signifie originellement « guirlande », mais qui en vient à désigner, en raison du fait que les noms des divers ancêtres sont reliés par des « guirlandes », ce que nous appelons aujourd’hui un tableau généalogique. Synthèse méthodologique très récente et essentielle dans Handbook of Stemmatology : History, Methodology, Digital Approaches (2020).↩︎. Malgré ces emprunts au vocabulaire de la famille, on ne doit pas s’y tromper : il ne s’agit pas tant, pour établir le texte que l’on proposera comme la version la plus proche de l’original, de reconstituer la totalité de l’arbre généalogique que de procéder par élimination pour remonter jusqu’à l’ancêtre le plus lointain que l’on puisse supposer, autrement dit jusqu’à l’état du texte le plus proche de ce que pouvait être l’originalAinsi, Salomon Reinach (1883) résumait de façon encore parfaitement actuelle ce travail en écrivant : « La tâche de l’éditeur comprend trois parties : le classement des manuscrits, le choix des leçons, la restitution conjecturale des passages altérés. La détermination de la parenté des manuscrits est le fondement de la méthode ecdotique moderne. Collationner tous les manuscrits d’un auteur, accumuler une énorme quantité de variantes puisées indifféremment à toutes les sources, puis choisir celle qui paraissait s’adapter le mieux au contexte, c’était la méthode des siècles précédents ; et elle a régné encore au commencement du nôtre. Aujourd’hui, l’on commence par classer les manuscrits par familles, par déterminer (au moyen des lacunes ou des fautes communes qu’ils peuvent présenter) quels sont ceux qui ne sont que des copies d’originaux encore existants ; et l’on ne tient compte que des manuscrits archétypes ou dérivant d’archétypes perdus. »↩︎.
Dans ce travail, les variantes textuelles observées, inévitables pour des textes recopiés manuellement et parfois sur des modèles de lecture difficile ou en mauvais état, sont l’objet d’un classement axiologique. On y distingue variantes plausibles et variantes à coup sûr erronées (fautes), les variantes plausibles étant à leur tour soupesées pour finir par ne plus maintenir qu’une seule version, faisant ainsi de toutes les autres variantes à des degrés divers des « fautes » ou au moins des « erreurs » dans la transmission du texte.
Le travail de représentation de l’histoire du texte adopte en réalité un point de vue totalement différent, car désormais chaque variation de la transmission présente en soi un intérêtTelle copie que dans la constitution du texte, on jugera comme très médiocre, car pleine de variantes absurdes ou à coup sûr erronées, pourra témoigner soit de la réalisation de la copie par un scribe ignorant, soit encore la réalisation de la copie sur un modèle, soit lui-même déjà très fautif, soit très difficilement lisible en raison soit de la forme de l’écriture, soit des graphies adoptées par le scribe précédent. Un cas intéressant de ce phénomène se rencontre dans la copie d’Arator du manuscrit Chartres, Médiathèque de l’Apostrophe 70 (début du IXe siècle) : le paratexte y est copié sans aucune erreur, car, très probablement, il était parfaitement lisible dans le modèle, tandis que la même main, recopiant le texte lui-même accumule les formes barbares, les mécoupures et autres erreurs grossières, probablement parce que le scribe ne parvient pas à déchiffrer son original et décalque ce qu’il croit voir. Ici le philologue trouvera dans ce témoin, dont il ne tirera rien pour l’édition même du texte, de précieux renseignements sur les conditions de transmission du texte dans un lieu et une période donnée, et sur l’existence possible sinon probable d’un modèle dont le type d’écriture n’était plus familier aux copistes.↩︎.
L’éditeur est alors sans cesse contraint par les présupposés scientifiques de l’exercice à un double mouvement vertical et horizontal : d’un côté, il s’agit de remonter par simplification de la multiplicité des témoins à l’unité du texte original ; de l’autre, il s’agit de rendre compte de cette multiplicité dans la synchronie comme dans la diachronie, d’opérer en quelque sorte des coupes successives dans l’histoire du texte, d’observer ce qu’il y voit et de relier ces strates aux strates antérieures et postérieures qu’il a pu définir. Pour prendre une image simple, d’un côté le travail ecdotique ressemble à un entonnoir : on y fait entrer une multiplicité de témoins présentant tous à des degrés divers des variations du texte , mais il doit n’en sortir qu’un seul texte ; de l’autre il ressemble à l’observation d’un arbre où l’on sera attentif à la fois à la prolifération des branches, et à la manière dont ces branches peuvent se relier entre elles.
Ce qui est vrai du foisonnement du texte lui-même l’est encore plus si l’on considère que beaucoup de manuscrits ne fournissent pas que le texte brut, mais aussi des gloses, des notices, des titres, des sommaires, des paratextes de nature variée, voire des illustrationsSi les remaniements importants touchent rarement les grands textes classiques, sanctuarisés en quelque sorte par le prestige de leur origine et le poids de la tradition scolaire qui les a transmis, les textes techniques, comme par exemple, les commentaires, sont souvent l’objet de remaniements liés à la nécessité de maintenir ou de hausser le niveau technique du texte ou de l’adapter au contraire aux centres d’intérêt et aux compétences des lecteurs.↩︎. De plus, dans certains cas, le texte aura pu être remanié plus ou moins, pour diverses raisonsDeux exemples peuvent illustrer ce processus : le commentaire de Virgile attribué au grammairien Servius (Ve siècle) nous est parvenu en deux versions l’une plus brève, l’autre plus longue (le Servius auctus), et l’origine de ce matériau supplémentaire (à supposer d’ailleurs qu’il soit supplémentaire et que la version courte ne soit pas un abrégé d’une version plus longue, ce qui est très généralement rejeté par la critique mais serait en pure théorie possible) est sujette à de grandes discussions. De même dans le commentaire virgilien dit de Philargyrius (date et origine inconnues) une partie du commentaire des Bucoliques est en fait le commentaire de Servius glissé là sans doute parce que le commentaire originel avait disparu.↩︎.
Ainsi, les nécessités qui se présentent au philologue amènent à une réelle tension entre des exigences que le caractère nécessairement limité de la présentation en livre rend difficile à tenir ensemble. C’est ce que sagement les Règles et recommandations citées plus haut précisent« si le résultat de ce travail [d’examen de l’histoire de la transmission] nécessite la rédaction de prolégomènes trop importants pour être insérés en tête de l’édition proprement dite, ces prolégomènes feront l’objet d’une publication distincte », entérinant ainsi la difficulté à opérer dans le même support les deux facettes du travail. De même lit-on un peu plus haut : « tout ce qui réclame une démonstration sera traité dans un article de revue » et « il conviendra davantage d’exposer les résultats acquis que d’engager une démonstration » (André 1972, 3).↩︎. Pour le dire autrement et en caricaturant un peu, mais à peine, le propos : le but de l’édition critique est finalement de fournir un texte et de justifier ses choix éditoriaux. Le reste n’appartient pas à ce type d’édition et doit donner lieu à des travaux d’un autre genre. Ou encore, pour reprendre notre image : « entre l’entonnoir et l’arbre, si vous ne pouvez pas montrer les deux, privilégiez l’entonnoir ».
L’ecdotique numérique comme possible point de rencontre des deux exigences
L’insertion des outils numériques dans cette représentation double du travail d’édition des textes anciens peut éclairer et faciliter les deux pratiques en même temps qu’elle les interroge. Nous voudrions envisager ici comment des techniques issues des Humanités numériques viennent assister le chercheur dans sa double démarche de reconstitution d’un texte et de représentation d’un foisonnement de la tradition, mais aussi comment, une fois qu’elles sont mises en œuvre, ces techniques interrogent la nature même de l’activité éditoriale et en questionnent les limites.
Les technologies dont disposent aujourd’hui les philologues numériques leur permettent, dans le cadre de l’établissement du texte, d’envisager à plus ou moins long terme la constitution d’une chaîne ecdotique assistée par les outils numériques, depuis la lecture (la collation) des manuscrits jusqu’à l’établissement même du texte.
L’existence d’outils de plus en plus
puissants de reconnaissance des caractères, y compris manuscrits, peut
d’abord contribuer à réduire le temps passé à la collation des
manuscrits. Des outils comme Transkribus« TranskribusLite »,
voir une présentation du logiciel par exemple
ici :
↩︎ donnent sur des écritures
livresques (surtout si elles sont très normées) des résultats d’autant
plus encourageants que l’outil est entraînable et peut donc au fur et
à mesure que l’éditeur corrige les lettres ou abréviations mal
reconnues par la machine gagner en compétence et donc en exactitude
dans sa lecture. Un tel outil ne peut évidemment être utilisé
efficacement que sur des photographies numériques de haute qualité, ce
qui devient relativement courant pour des collections manuscrites de
plus en plus importantes. On peut à ce sujet citer évidemment, entre
autres e-codicesPour d’autres collections digitales de manuscrits
citons par exemple Biblioteca
Medicea Laurenziana - Scaffale Digitale (Biblioteca Medicea
Laurenziana à Florence), Wren
Digital Library (Cambridge, Trinity College Library) etc.↩︎, la Bibliothèque
virtuelle des manuscrits en Suisse, riche aujourd’hui de la
photographie de 2653 manuscrits. La mise à disposition de ces fonds
manuscrits dans des reproductions de haute qualité constitue
évidemment un appui indispensable à l’utilisation de l’HTR, la
reconnaissance des écritures manuscrites. L’outil universel qui lirait
toutes les écritures de toutes les époques dans tous les contextes est
évidemment illusoire, mais les progrès réalisés en quelques années
dans ce domaine permettent d’envisager le recours à cette technologie
dans le cas des écritures normées et relativement régulières. Disposer
ainsi d’un texte au moins partiellement reconnu qu’il doit évidemment
vérifier permet cependant au philologue de se concentrer plus
rapidement sur l’aspect essentiel de son travail, la comparaison des
textes qui lui sont fournis par la tradition manuscrite. Cela est
d’autant plus profitable qu’un outil comme Transkribus
permet un export de la lecture sous le format xml
TEI,
très largement diffusé dans l’édition numérique et qui fournit au
chercheur un texte déjà prêt pour son traitement numérique sur lequel
il va pouvoir exercer directement sur un texte déjà prêt pour son
traitement numérique son travail de repérage des variantes.
À ce stade, la prise en compte des exigences ecdotiques par le consortium TEI fournit au chercheur une très large gamme d’éléments et de processus méthodologiques (Burghart 2016), lui permettant de rendre compte avec précision de ce qu’il lit dans chaque témoinVoir : « Guidelines - TEI : Text Encoding Initiative », que nous utiliserons dans ce qui suit.↩︎. Pourtant de manière significative, la TEI paraît ne pas s’être totalement affranchie de la logique qui était celle de l’édition papierDans « P5 : Guidelines for Electronic Text Encoding and Interchange » (31 août 2021, « Critical apparatus » (s. d.)), on lit en effet, à la suite d’une série de questions qui reprennent celles que nous posions dans le paragraphe précédent : « Different editorial methodologies will produce different answers to these questions, and those answers may influence choices of markup used in the edition. For example, if there will be multiple witness transcriptions and a single apparatus, then the double end-point attachment method may be the best choice of apparatus linking style. The parallel segmentation method may present several advantages to editors producing an edition with a single base text ».↩︎. Lorsqu’on observe les méthodes proposées, on constate en effet qu’elles reproduisent sous la forme d’un encodage xml les pratiques de la constitution d’un apparat dans une édition papier. Trois méthodes sont en fait proposées par la TEI : « double end-point attachment » (attacher à chaque extrémité), « parallel segmentation » (segmenter en parallèle) et « location-referenced » (référencer par emplacement). Le décalque de cette pratique sur les pratiques de l’édition papier est d’ailleurs explicite puisque dans la présentation de cette méthode il est noté : « provides a convenient method for encoding printed apparatus » (offre une méthode appropriée pour encoder un apparat imprimé) ; il s’agit donc ici d’une méthode qui se donne comme un moyen de transcrire en TEI un apparat papier.
Les deux autres méthodes sont plus éloignées du modèle papier mais le lien avec lui demeure quand même substantiel : la méthode double-end point partage avec la méthode précédente la séparation de l’apparat et du texte, mais propose de délimiter le lieu variant par son début et sa fin, autrement dit de cerner « l’unité critique » et non simplement de reproduire un apparat déjà existant« In the double end-point attachment method, the beginning and end of the lemma in the base text are both explicitly indicated. It thus differs from the location-referenced method, in which only the larger span of text containing the lemma is indicated. Double end-point attachment permits unambiguous matching of each variant reading against its lemma. It or the parallel-segmentation method should be used in all cases where this is desired, for example where the apparatus is intended to enable full reconstruction of the text, or of the substantives, of every witness » (« Critical apparatus », s. d., 2, 2).↩︎. Sans être réellement différente de la méthode précédente (l’apparat est disjoint du texte), elle est plus rigoureuse dans la définition des lieux variants comme possibles unités critiques sur lesquelles on peut encoder toutes les différentes leçons fournies par les manuscrits.
La dernière méthode, parallel segmentation, présente un affranchissement bien plus grand de la logique de représentation papier : le texte ici et l’apparat là. Ici on est clairement en face de la constitution d’une méthode d’apparat nativement numérique et non tributaire de la division de la page papier caractéristique de l’édition savante (le texte en haut, l’apparat critique en bas)« This method differs from the double end-point attachment method in that all variants at any point of the text are expressed as variants on one another. In this method, no two variations can overlap, although they may nest. The texts compared are divided into matching segments all synchronized with one another. This permits direct comparison of any span of text in any witness with that in any other witness. With a positive apparatus, it is straightforward for an application to extract the full text of any one witness from the apparatus » (« Critical apparatus », s. d., 2, 2).↩︎. Le lieu variant est présenté comme un point du texte où il se passe quelque chose et ce quelque chose est décrit à l’endroit même où le phénomène se produit. On peut donc imbriquer sur un même segment des observations de nature et d’extension variées. Ce cas de figure extrêmement fréquent en édition de textes anciens est traité de façon parfaitement claire par cette méthode.
Si cette méthode permet la création d’apparats décrivant des phénomènes imbriqués, elle peut tout naturellement déboucher sur la création de niveaux d’apparats différents, suivant ce que l’on observeDans le schéma d’encodage que nous avons créé à partir de l’exemple de l’édition du commentaire de Donat à Térence nous avons ainsi avec cette méthode pu identifier quatre types d’apparat selon l’importance et la nature de la variation : un apparat de type « structure » qui va rendre compte des déplacements ou des modifications dans l’intégrité même du texte (mots inversés, éléments déplacés, omis ou transformés), un apparat de type « substantial » qui va concerner les différentes formes/mots proposés pour une même unité critique, un apparat de type « layout » qui prendra en compte les éléments de mise en page au sens large et un apparat de type « graphic » qui représentera des variations dont on sait par expérience qu’elles sont purement liées à la prononciation / graphie de telle ou telle région ou période.↩︎.
Cette différenciation possible des apparats, rendue aisée par cette méthode, permet en réalité de croiser dans un même acte de collation des éléments qui participent des deux logiques citées en commençant : d’un côté, on observe les variations du texte entre les divers témoins qui le transmettent, mais de l’autre, on décrit avec précision diverses données importantes de chaque témoin, qui, si elles ne sont pas immédiatement mobilisables dans la représentation des variantes, sont essentielles à la reconstruction de l’histoire du texte.
Ici se pose la question évidente de la viabilité de cette méthode dans le cas de traditions présentant de très nombreux manuscrits (et donc multipliant les phénomènes). L’apparat critique y court alors le risque de devenir non seulement impossible à maîtriser par l’encodeur humain, mais même délicat à réaliser en raison de la nécessité permanente d’imbriquer des éléments, ce qui, on le sait, n’est pas forcément aisé en TEI.
Cette difficulté nous conduit en réalité à une ouverture méthodologique intéressante : puisque le propre de ce type d’apparat est à la fois de signaler des variantes et de décrire la matérialité même du texte, il peut être intéressant de dissocier la phase de collation de la phase de constitution de l’apparat critique, et de renvoyer à un traitement par la machine la réunion des données constituant chaque lieu critique.
Ainsi, nous avons expérimenté la collation de chaque manuscrit sous la forme d’un texte pivot (n’importe quelle édition ou transcription du texte) lemmatisé au mot et présenté sous la forme d’une liste de mots sans ponctuation ni aucun autre signe de mise en page (pas de paragraphage ni de majuscules, par exemple). Ce texte, aisément obtenu, est injecté dans un fichier xml TEI qui servira de base à la collation de chacun des témoins, l’éditeur ou l’éditrice créant un nouveau fichier à chaque témoin collationné, sans se préoccuper du tout de ce qui se passe dans les autres témoins. Voici un exemple du début d’un fichier de collation de témoin (le teiHeader a été réduit pour faciliter la lecture) :
teiHeader>...</teiHeader>
<text>
<body>
<div type="book" n="2">
<div type="chapter" n="25">
<div type="summary">
<p n="25"><w xml:id="w1">De</w><w xml:id="w2">eo</w>
<w xml:id="w3">ubi</w><w xml:id="w4">Saulus</w>
<w xml:id="w5">qui</w><w xml:id="w6">et</w>
<w xml:id="w7">Paulus</w><w xml:id="w8">admonente</w> <
Voici un exemple de collation sur un lieu critique telle que réalisée à l’échelle du témoin, avec imbrication de deux types d’apparat :
app type="substantive" from="#w26">
<rdg wit="#A">
<app type="layout" from="#w26">
<rdg wit="#A">
<w corresp="w26">tenent</w>
<pc>.</pc>
<rdg>
</app>
</rdg>
</app> </
Une fois que l’éditeur a collationné le nombre de manuscrits qu’il souhaite lire, une feuille de transformation opère la création soit des quatre apparats à la fois, soit des apparats jugés les plus à même de l’aider dans sa démarche éditoriale. Voici un exemple de deux lieux critiques et de leur apparat associé tel qu’il est construit via la feuille de transformation :
app from="#w1">
<rdgGrp type="layout">
<rdg wit="#M" rend="normal">
<w corresp="w1"><hi rend="capital">p</hi>oeta</w>
<rdg>
</rdg wit="#U #β" rend="underline underline">
<w corresp="w1"><hi rend="decorated-initial">p</hi>oeta</w>
<rdg>
</rdgGrp>
</rdgGrp type="substantive">
<rdg wit="#G">
<w corresp="w1">prologvs poeta</w>
<rdg>
</rdg wit="#δ">
<w corresp="w1">oeta</w>
<rdg>
</rdg wit=" #D"><gap reason="lacuna"/></rdg>
<rdgGrp>
</app>
</app from="#w2">
<rdgGrp type="graphic">
<rdg wit="#A #C"><w corresp="w2">cū</w></rdg>
<rdg wit="#M"><w corresp="w2">eĩm</w></rdg>
<rdg wit="#β"><w corresp="w2">cuƺ</w></rdg>
<rdg wit="#γ"><w corresp="w2"> quom </w></rdg>
<rdg wit="#δ"><w corresp="w2"> cū </w></rdg>
<rdgGrp>
</rdgGrp type="layout">
<rdg wit="#G" rend="underline">
<w corresp="w2">cum</w><w corresp="w3">primum</w>
<w corresp="w4">animum</w><w corresp="w5">ad</w>
<w corresp="w6">scribendum</w>
<w corresp="w7">appulit</w><lb/>
<rdg>
</rdg wit="#U #β" rend="underline underline">
<w corresp="w2">cum</w>
<rdg>
</rdgGrp>
</rdgGrp type="substantive">
<rdg wit="#M"><w corresp="w2">enim</w></rdg>
<rdg wit="#δ"><w corresp="w2"> cum </w></rdg>
<rdg wit=" #D"><gap reason="lacuna"/></rdg>
<rdgGrp>
</app> </
Ce fichier avec apparat lui fournit alors (via des outils relativement simples de visualisation) une photographie des variantes et un apparat critique dans lequel les variantes sont alignées, sans que le choix de celle qui sera retenue soit encore privilégié.
On peut alors, à ce stade, faire intervenir des outils d’aide à la pondération des variantes permettant d’approcher de la constitution d’un stemmaPour un outil permettant une comparaison de variantes dans le cadre d’une collation de variantes voir « Juxta | Collation Software for Scholars ».↩︎. La difficulté est ici de ne retenir que ce qui constitue réellement une variante en éliminant le « bruit », autrement dit les variations qui soit sont sans importance, soit peuvent clairement être le fait du hasardSur la notion de bruit et son traitement voir par exemple Handbook of Stemmatology : History, Methodology, Digital Approaches (2020, chap. 5, p. 345 et suiv.).↩︎. Cette démarche est complexe et demande au philologue une prise en compte de la nature particulière de son texte. Les outils numériques ici ne se substituent pas à la réflexion du philologue, mais permettent en réalité à celui-ci de se poser les bonnes questions avant d’établir les règles qui présideront à la pondération automatique des variantesPlusieurs projets au stade expérimental peuvent être cités, bien qu’ils soient encore à un stade de développement qui ne permet pas forcément leur emploi libre dans des projets distincts de leur institution de production comme par exemple « STAM ».↩︎. Chaque texte et chaque tradition textuelle appellera ainsi une pondération particulière autour de règles précises propres à la nature de chacunVoir à ce sujet : Handbook of Stemmatology : History, Methodology, Digital Approaches (2020, chap. 5 : « Computational methods and tools »).↩︎.
Une fois ces choix opérés (et parfois revus en fonction des résultats obtenus sur les premières tentatives de construction des familles), les calculs réalisés sur un manuscrit face à une famille, ou une famille supposée face à un groupe de manuscrits, permettent de faire émerger des constantes qui guideront le philologue. Cela pourra l’aider dans l’établissement d’un stemma, par exemple, ou encore dans le rejet d’une représentation stemmatique – si les résultats des calculs de proximité des manuscrits montrent que la tradition a été largement contaminée, autrement dit que les copistes ont eu accès à des modèles issus de familles différentes et ont mélangé leurs textes pour tenter, dans un processus éditorial trop souvent sous-estimé, de réaliser une copie plus conforme à l’idée qu’ils se faisaient de la version la meilleure du texteIl n’est pas question ici de rendre compte des débats méthodologiques qui sous-tendent l’élaboration des outils de stemmatologie numérique ; on se reportera pour un panorama clair et complet à Handbook of Stemmatology : History, Methodology, Digital Approaches (2020, 294 et suiv. pour une chronologie de cette réflexion et p. 339 et suiv.).↩︎. L’avantage de ce traitement en partie automatisé, joint à la pratique de la collation envisagée plus haut, est de travailler à la fois sur des données plus vastes (la totalité de la collation de manuscrits qui peuvent être nombreux et non le simple choix de variantes séparatives), et avec un point de vue non impressionniste, puisqu’une fois retirés les éléments qui produiraient du « bruit », le traitement est opéré par la machine sans risque qu’un œil humain ne vienne, même inconsciemment, biaiser les données. Il arrive en effet souvent que, par un réflexe parfaitement compréhensible, le philologue tende à privilégier les éléments qui vont dans le sens de son intuition, et donc à minimiser ceux qui la remettent en cause – ce que le calcul brut réalisé par la machine permet d’éviter, même si ces données, issues d’un pur calcul, appellent évidemment le contrôle d’un œil humain, ne serait-ce que pour vérifier que la pondération établie entre les types de variantes est suffisante pour dégager des résultats significatifs.
Pourvu alors de tous ces éléments de réflexion que sont une moisson
claire et structurée de variantes et des résultats de calculs qui
suggèrent des familles ou au contraire soulignent l’impossibilité d’en
constituer, le philologue peut alors opérer les choix qui feront
qu’une variante (reading, soit en TEI
<rdg>
)
deviendra le texte choisi (lemma, soit en TEI
<lem>
« P5 :
Guidelines for Electronic Text Encoding and Interchange » (31 août
2021, « Critical
apparatus ») (s. d.) : « the term lemma is used here in the text-critical sense of
“the reading accepted as that of the original or of the base text”.
This sense differs from that in which the word is used elsewhere in
the Guidelines, for example as in the attribute lemma where the
intended sense is “the root form of an inflected word”, or “the
heading of an entry in a reference book, especially a
dictionary” ».↩︎), rejetant de fait toutes les
autres leçons dans l’apparat critique. Ce travail, redisons-le, ne
saurait, quant à lui, être automatisé, car toute personne qui a déjà
édité un texte sait qu’un manuscrit, quand bien même il fournirait un
texte supérieur en qualité à tous les autres, ne peut jamais être
suivi aveuglément, et qu’il est donc impossible en bonne méthode de
programmer par exemple une feuille de transformation qui
systématiquement ferait passer le <rdg>
issu
de tel manuscrit au statut de <lem>
. Là
encore, la machine facilite la prise de décision du philologue, elle
ne la remplace pas, et surtout elle lui permet de prendre conscience
de phénomènes qui auraient pu lui échapper et de formuler ses choix de
la manière la plus éclairée possible.
On voit donc ici comment la méthodologie classique de l’édition de textes et ses exigences propres peuvent trouver dans les outils de la philologie numérique un appui qui permette de prendre une vue plus globale des traditions manuscrites (si le travail de collation est facilité) et de réaliser des opérations de classement qui se fondent pour partie sur l’assistance de calculs automatisés qui peuvent être réalisés sur un nombre très important de variantes. Sans forcément « renverser la table », ces nouvelles éditions permettent d’envisager une approche plus précise et mieux documentée de l’évolution du texte et peuvent donc conforter les résultats obtenus par les méthodes anciennes, voire parfois les corriger de manière substantielle. Toutefois, on reste là dans une optique que l’on pourrait qualifier de traditionnelle, où il s’agit de faire émerger de la masse des variantes le texte jugé le plus conforme à la forme que pouvait revêtir l’original.
Cependant, l’encodage en apparats multiples dont nous avons précédemment rendu compte ouvre une autre voie, nettement moins explorée dans la philologie classique. Pourtant, elle l’est depuis longtemps dans la philologie médiévale, par exemple, où la question des manuscrits se pose différemment en raison de la proximité fréquente de certains témoins avec la date de rédaction du texte, et du statut particulier du texte qui est bien moins « protégé » que le texte antique, et donc soumis plus facilement à diverses opérations d’interpolation, d’abrègement ou de transpositionExemplaire est à ce titre la démarche menée par Ariane Pinche dans une thèse très récente ; on y trouvera une passionnante réflexion sur la question des traditions très remaniées (2021).↩︎. Cette voie est celle de l’analyse des témoins d’un texte non pas seulement comme des étapes vers la restitution du texte original, mais comme des moments de sa lecture et de sa diffusion.
Dans cette approche, tout élément qui peut permettre, à partir de l’objet manuscrit lui-même, de le resituer dans un contexte historique et intellectuel prend une importance déterminante. Ainsi la forme du manuscrit, son usage de la majuscule, des rubriques, de la ponctuation par exemple, deviennent de possibles indices de son rattachement à telle période, tel milieu, telle écoleBien qu’il ne comporte pas vraiment de dimension numérique, un exemple de ce type de réflexion peut être fourni par Manuele Berardo et al. (2014).↩︎. Si ces éléments sont pris en compte dans la phase d’établissement du texte, ils le sont pour justifier par des critères extérieurs (de diffusion, de circulation etc.) les observations permettant de regrouper les témoins par famille. Dans ce qui nous occupe actuellement, ces mêmes éléments sont considérés comme étant en eux-mêmes signifiants, dans la mesure où ils témoignent de la réception d’un texte dans un moment donné, dans un lieu donné et par un public donnéÀ titre d’exemple de ce type de travaux voir Bernhard Bischoff et Michael Gorman (2007). Par exemple la réalisation dans le premier quart du IXe siècle dans la France du nord et du nord-est de compilations de poètes chrétiens présentant de troublantes ressemblances tant dans la liste des poètes que dans leur présentation, voire la forme même des copies, témoigne d’une circulation intellectuelle importante entre St Denis par exemple et Reims, ainsi que de la volonté de l’Église de Reims de produire des copies de ces poèmes très exactes et soigneusement revues et enrichies de la science de l’époque qui se diffusent ensuite, avec des modifications liées au changement de lieu et de milieu intellectuel vers le reste de la Francia jusqu’à la région de la Loire et les territoires germaniques. Voir à ce sujet le projet collaboratif autour de ce qui est appelé parfois à tort Libri Manuales.↩︎. Dans de tels cas, l’observation des éléments paratextuels ou extratextuels permet la reconstitution à la fois du rayonnement d’un centre intellectuel, de ses préoccupations et centres d’intérêt propres et de la manière dont ce centre exerce son influence sur d’autres communautés ou d’autres régions.
Dans ce travail, évidemment, l’encodage des données qui ne sont pas des variantes proprement textuelles joue un rôle déterminant. Pouvoir automatiquement regrouper des témoins qui présentent les mêmes éléments formels encodés dans les métadonnéesLa constitution précise des métadonnées est ici essentielle, voir à ce sujet « P5 : Guidelines for Electronic Text Encoding and Interchange » (31 août 2021) : « Manuscript Description » (s. d.) et « Representation of Primary Sources » (s. d.).↩︎ (par exemple, un format comparable ou un paratexte de même nature), constituer à partir des éléments encodés séparément sur chaque témoin et des métadonnées qui leur sont associées une base de données présentant des types de mise en page, d’écriture, d’annotation etc., tout cela constitue une aide considérable pour l’historien de la culture et de sa transmission. On prend en compte ici des éléments que le philologue aurait, pour son travail purement ecdotique, tendance à laisser de côté ou à reporter dans la notice descriptive des manuscrits qu’il utilise dans son édition, sans forcément opérer les recoupements et les rapprochements qui intéressent l’historien de la culture, mais qui, pour lui, sont secondaires par rapport au regroupement par familles textuelles par exemple.
Dans ce qui suit, nous voudrions, à partir de l’exemple du paratexte, envisager la manière dont l’ecdotique numérique permet de replacer le texte ancien au centre d’un écosystème dont les contours, s’ils doivent être précisément définis par l’éditeur pour éviter la dispersion, peuvent être considérablement plus larges que ceux de l’édition dite traditionnelle.
Le traitement numérique du paratexte dans le cadre de l’insertion du texte dans un écosystème éditorial élargi
En philologie, le paratexte est souvent considéré au mieux comme une aide à la détermination de la provenance d’un manuscrit, le plus souvent comme un élément qui ne présente qu’un intérêt très limité, bien inférieur en tout cas aux données fournies par le texte proprement dit. Or ce paratexte est évidemment l’élément essentiel lorsqu’il s’agit de comprendre la réception d’un texte, car il témoigne de la manière dont on en accompagne ou oriente la lecture, et de la fonction qu’on assigne à l’œuvre recopiée. On se souviendra ici que cette dimension d’histoire de la réception faisait partie du « cahier des charges » de l’édition critique tel que présenté en commençant, mais qu’il se trouve très souvent réduit dans les éditions papier en raison de la difficulté même à représenter ce matériau – à moins de donner une édition fac-similaire.
Dans ce qui suit, nous voudrions partir de l’exemple du paratexte que constituent les gloses pour comprendre l’apport de la philologie numérique à la connaissance de l’histoire des textes à partir de l’examen de leurs paratextes.
Les gloses se présentent, on le sait, comme des commentaires interlinéaires ou marginaux qui n’appartiennent pas au texte, mais représentent sa réception dans le cadre d’une institution donnée, le plus souvent l’école, ou d’un milieu donné, dans le cas de gloses écrites pour lui-même sur son exemplaire par un éruditPour une bonne illustration de la place de ce paratexte voir l’imposant appareil de gloses sur un manuscrit du type de Cambridge Trinity College Library B 14.3 disponible sur le site Wren Digital Library.↩︎. Ce matériau est par essence volatil, car, à moins que ces éléments ne soient « protégés » par la signature d’un grand maître, leur exploitation est soumise à l’arbitraire des lecteurs (donc des copistes et de leurs commanditaires), qui vont décider que tel commentaire est important et tel autre, moins. On trouvera ainsi une infinie variation textuelle, tant dans le nombre que dans la place que dans le texte même des gloses, la condensation et/ou l’amplification y étant la norme dans le passage d’un exemplaire à un autre.
Fournir l’édition de ce matériau en format papier est une
entreprise à vrai dire illusoire, car le seul moyen de le faire serait
de choisir d’éditer les gloses d’un manuscrit donné et rien d’autre.
Car dès qu’on entre dans la représentation d’un apparat critique de
ces gloses, le nombre et la profondeur des remaniements et variantes
observables font que l’apparat critique de quelques lignes
nécessiterait plusieurs pages. Que dire, alors, d’une tentative de
représenter sur de nombreux témoins les mécanismes de diffusion et de
remaniement de ce matériauVoir une tentative d’édition des gloses d’Arator,
Aratoris Subdiaconi Historia apostolica (2006),
qui malgré l’intérêt majeur du texte mis à disposition montre bien la
difficulté d’éditer ce matériau en format papier car le volume est
difficilement lisible et l’apparat a dû se limiter à un nombre réduit
de témoins et de lieux.↩︎ ? Dans ce cas
extrême, seul un apparat numérique permettant de choisir tel(s) ou
tel(s) témoin(s), voire tel ou tel type de variante ou encore d’isoler
les marginalia des interlinéaires, ou de ne prendre en compte
qu’un certain type de glosesCelles qui comprennent une explication lexicale par
exemple, ou celles qui comprennent des realia etc.↩︎, permet une
navigation profitable dans ce matériau dont trop souvent la philologie
ignore la richesse, car il ne porte pas tant sur le texte lui-même que
sur la reconstitution de sa réception. Car l’enjeu est bien là dans
l’écriture de la réception du texte, qui ne peut passer, pour nous
modernes, que par les traces laissées par les interprétations
successives de ce texte, autrement dit par ce matériau paratextuel
(interne ici mais externe parfois dans les commentaires séparés) qui
éclaire la manière dont telle époque, dans tel lieu, recevait une
œuvre. On peut donc envisager de réaliser, par extension de la méthode
décrite plus haut, une collation des gloses de chaque manuscrit,
chaque glose constituant une unité textuelle qui pourra être
doublement rattachée, en fonction de sa position physique dans le
manuscrit, et en fonction de sa position logique (sur quel mot ou
groupe de mots elle porte)On peut adapter à cet usage précis l’élément
<gloss>
de la TEI,
qui fournit tous les éléments nécessaires pour ce travail et peut de
plus contenir les éléments spécifiques à l’apparat critique comme
<app>
et les éléments qui en dépendent.↩︎. Cet encodage se
réalisera comme le précédent, à partir d’une forme donnée (n’importe
quelle version du texte glosée) qui donnera lieu à la constitution
d’un pivot autour duquel s’articuleront les collations successives de
ce matériau exactement comme pour le texte lui-même – la seule
différence étant que, dans l’immense majorité des cas, la personne qui
encode ne pourra pas partir d’un texte préexistant. Une fois réalisée
cette collation, les mêmes feuilles pourront servir à construire les
apparats et donc à fournir la masse de données critiques dont on a vu
qu’elle pouvait devenir proliférante et donc rendre l’édition papier
irréalisable. C’est ici que pourront s’appliquer des traitements
automatiques d’écart entre les versions, recherchant cette fois, non
seulement les phénomènes de proximité, mais aussi ceux d’éloignement,
car les deux ont du sens dans le cas des glosesSi deux ou plusieurs témoins présentent un matériau
assez proche, ils témoignent probablement d’une origine commune de ce
matériau (c’est évident), mais aussi d’une manière semblable de le
recevoir, autrement dit d’une forme de communauté dans la réception.
Au contraire un cas de grand éloignement entre deux ou plusieurs
corpus de gloses aura pour origine soit deux ou plusieurs traditions
interprétatives nettement imperméables les unes aux autres, soit dans
le cas de similitudes quand même observables, une orientation
différente de la réception à un moment et dans un milieu donné. Il en
ira de même du changement de distribution du matériau quand des gloses
passeront (souvent avec remaniement) des marginales aux interlinéaires
ou vice-versa. L’articulation axiologique entre le matériau
interlinéaire (explication élémentaire) et le matériau marginal
(commentaire du fond ou des points essentiels) prendra sens dans
l’optique d’une histoire de la réception qui pour bien des textes, y
compris des grands textes classiques, reste à faire.↩︎.
Or l’histoire du texte, perçue ainsi au travers du prisme des gloses, peut à son tour élargir encore la portée du travail éditorial, par exemple en invitant à des rapprochements avec d’autres textes plus ou moins cités ou évoqués dans les gloses en appui du texte commenté. Le processus ouvre donc à la perception d’un réseau à la fois de circulation du matériau et de construction de passerelles entre les textes, qui relève de la reconstitution d’un contexte culturel (que lit-on ? comment ? pourquoi ?), à mettre à son tour en rapport avec d’autres types de sources si elles existent comme les catalogues de bibliothèques, par exemple, ou les listes d’ouvrages cités par tel ou tel contemporainCe processus, dans le cas du latin, peut d’ailleurs documenter aussi le poids acquis par les langues vernaculaires avec l’apparition de gloses en d’autres langues que le latin et leur possible circulation.↩︎.
Toute la question devient alors non plus de savoir comment relier le texte à d’autres éléments, mais quelle limite donner à cette expansion éditoriale. Plusieurs possibilités s’offrent, suivant l’approche textuelle qui sera proposée et qui est souhaitée par le philologue. Celle que nous avons proposée plus haut à partir des gloses constitue une approche possible par l’insertion du texte dans un contexte culturel via son utilisation dans l’enseignement antique ou médiéval, mais il peut en exister d’autresPar exemple dans le cas de textes subissant de forts remaniements, comme on le voit régulièrement dans certains textes en vernaculaires, mais comme on peut le voir aussi dans du matériau latin comme les vies de saints, on peut envisager de connecter les différents textes issus de la collation des manuscrits à des outils d’analyse textométrique qui fourniront par exemple des vocabulaires fréquentiels qui, une fois débarrassés comme il se doit du « bruit » produit par les mots outils ou à faible contenu sémantique, donneront une idée de l’évolution des centres d’intérêt en fonction des remaniements (ce travail a été en partie mené avec de vraies opportunités de développement par Ariane Pinche (2021). Un tel travail pourrait d’ailleurs avec profit être mené sur le matériau des gloses, car une observation simplement empirique montre que les modifications que l’on fait subir aux gloses vont souvent introduire de nouvelles notions (théologiques ou scientifiques par exemple) et ne vont nullement se contenter d’un toilettage formel.↩︎.
On le voit, la question devient alors, s’agissant de fixer les bornes que l’on va se fixer, de savoir quelle vue du texte on va privilégier et jusqu’où on va pousser l’enquête et l’enrichissement des données dans ce domaine, de manière à ce que le projet conçu demeure à la fois maîtrisable par ses concepteurs et surtout utile à ceux qui viendront consulter les visualisations des résultats. La masse d’information proposée peut, surtout si elle est insuffisamment structurée, produire sur le visiteur une impression d’« infobésité » qui décourage sa recherche et rend finalement le projet moins performant, en termes de diffusion de connaissance, qu’un autre projet plus modeste dans la production de connaissance, mais plus facile à manier du côté de l’utilisateur.
Se pose ici évidemment la question de la visualisation des objets créés, car les possibilités de création de connaissance et de liens entre les connaissances qui s’offrent au philologue numérique sont extrêmement vastes et peuvent partir dans de multiples directions.
Conclusions et ouvertures
Pour résumer ce qui a fait ici notre propos, le philologue numérique peut d’abord se définir comme un philologue qui se situe dans la tradition de l’édition savante, mais en tirant parti des aides que peuvent lui apporter les technologies numériques, de la collation des manuscrits au classement des variantes et des témoins et à la réalisation concrète des apparats. Ainsi, la philologie numérique peut d’abord se voir comme une mutation technologique permettant au philologue de mieux mettre en pratique les règles de l’édition scientifique.
Sur un autre plan, les technologies numériques, parce qu’elles excellent à rendre compte de la diversité, permettent d’envisager comme réalisables et publiables des travaux que le support papier conduisait à limiter dans leur ampleur ou leur richesse. Considérer chaque manuscrit (ou au moins certains jugés particulièrement importants) comme représentants d’une étape de la réception textuelle, appréhender cette réception et la mettre en lien avec d’autres éléments internes ou externes à la tradition textuelle, constitue à notre sens un des éléments fondamentalement innovants de l’ecdotique numérique. Aux côtés de la dimension verticale de l’établissement du texte, cela rend en effet possible et réalisable une dimension horizontale d’observation d’une tradition dans la synchronie et l’interrogation de cette synchronie confrontée à d’autres moments de l’histoire textuelle. Ainsi, les très nombreux manuscrits issus des écoles carolingiennes peuvent par exemple, autour de projets textuels précis, être interrogés et mis en réseau pour identifier mieux les éléments de savoir, les méthodes utilisées et la circulation des connaissances.
Le choix est alors de déterminer ce qui sera visualisé, où et comment, ainsi que la manière d’exploiter quand même ce qui ne sera pas immédiatement accessible à la visualisation. Il y a sans doute là une réflexion à mener collectivement entre philologues pour définir une sorte de modèle éditorial à géométrie variable, mais obéissant à des principes communs. De même que les grandes collections d’éditions papier reposent sur des règles établies progressivement et acceptées par la communauté scientifique, de même il est sans doute important pour les philologues de définir mieux pour aujourd’hui (et demain, tant les mutations technologiques sont rapides) des « règles et recommandations pour la philologie numérique » qui permettent à la fois à chacun de situer son projet dans un cadre préexistant, non contraignant mais éclairant pour sa propre pratique, et surtout de transmettre aux nouvelles générations d’éditeurs (qui seront très probablement forcément confrontés à la question de l’ecdotique numérique) des pistes de réflexion, mais aussi des procédures et des outils éprouvés.
Contenus additionnels
Guidelines - TEI : Text Encoding Initiative
Références
Bruno Bureau
Professeur de langue et littérature latine à l’Université Jean-Moulin Lyon 3 (France). Ses travaux de recherches portent principalement sur deux axes : la poésie latine tardive (IVe-VIe siècles), chrétienne ou profane, et la littérature latine de commentaire. Dans le cadre de ces travaux il a publié une édition numérique du commentaire de Térence attribué à Aelius Donat et une édition critique dans la collection des Universités de France de l’Historia Apostolica d’Arator.