Présentation du Thesaurus Ichtya

 

Le thesaurus des poissons et créatures aquatiques est le troisième volet du projet Ichtya, à côté des éditions de textes et de la Bibliothèque Ichtya, avec laquelle il est étroitement lié. Ce thesaurus a pour but de recenser tous les noms de poissons et d’animaux aquatiques figurant dans les textes de la bibliothèque, principalement des noms latins.

L’intérêt du pôle Document numérique pour les questions d’indexation et de constitution de bases d’autorités a permis de constituer un thesaurus des noms de poissons et d’animaux aquatiques. Les notices sont encodées en XML-TEI et stockées sur un serveur dans une base de données XML (BaseX). Un outil collectif (PluCo) conçu au pôle Document numérique permet de créer, corriger, ces notices de manière collaborative. L’environnement de travail permet ensuite de lier ces notices aux sources textuelles.

Le contenu du thesaurus

Les noms retenus sont essentiellement des noms latins, mais nous avons également décidé de retenir les noms grecs et les noms vernaculaires lorsque ceux-ci figurent dans un traité latin et sont présentés comme synonymes d’un terme latin, par exemple le De animalibus d’Albert le Grand ou le dialogue Ichtyologia de Carolus Figulus. Les noms sont caractérisés par leur origine géographique. Pour les noms grecs, nous avons établi de ne retenir comme « noms grecs » que les termes écrits en caractères grecs. Les autres termes issus du grec, qu’ils soient simplement translittérés (ophidion, cnide) ou latinisés grâce à l’ajout de désinences latines (orcynus, belona), sont considérés comme latins à partir du moment où ils figurent en caractères latins dans le texte. Dans l’index comme dans les fiches, on a choisi d’accompagner les termes grecs d’une translittération latine entre parenthèses afin de faciliter la lecture.

La structure des notices

Chacun des noms est lié à une fiche sur laquelle figure toujours la référence précise à la source dans laquelle il apparaît. Cette indication de source s’accompagne, autant que possible, d’une ou plusieurs identifications et, pour les appellations latines et grecques, de la référence scientifique qui valide ces identifications. On peut par ailleurs trouver aussi, si l’occasion s’y prête, une note de commentaire ainsi que deux sortes de renvois sous forme de liens : d’une part à la forme principale en cas de paronymie, de variante orthographique ou de forme vernaculaire, indication qui figure en tête de la fiche, à la place de l’identification ; de l’autre aux autres termes désignant le même animal sous un autre nom. L’indexation par le biais du format XML permet de faire des liens directement d’une forme à l’autre. Ce thesaurus fournit un outil de première utilité pour l’étude des synonymies et polyonymies entre les noms de poissons dans les traités ichtyologiques.

Un double accès aux notices

L’encodage en XML-TEI et l’utilisation de l’outil PluCo permettent à la fois la constitution d’index traditionnels pour la consultation transversale de la Bibliothèque Ichtya, mais également la consultation de cette base de noms de poissons. Ainsi, l’accès aux fiches du thesaurus peut se faire de deux manières : soit directement, par le thesaurus et son sommaire ; soit lors de la lecture des textes dans la bibliothèque : les termes indexés apparaissent alors en couleur et un simple clic permet d’afficher la notice, soit temporairement sous forme de pop-up, soit durablement. Une fois sur la fiche, les liens permettent de naviguer d’un terme à l’autre sans repasser par le sommaire.

Le traitement des variations graphiques

Afin de mieux rendre compte des variations lexicales qui affectent les noms de poissons au fil de leur transmission, il a été décidé de faire figurer dans le sommaire toutes les graphies rencontrées. Cependant, afin d’alléger la présentation des fiches, lorsque plusieurs formes très proches sont en concurrence, nous avons choisi de faire des fiches principales ou « mères », sur lesquelles figurent l’ensemble des informations et liens, et des fiches secondaires ou « filles », qui ne comportent que le nom de l’animal, la source où il figure et le renvoi à la forme principale. Pour les termes de la latinité classique, la forme « principale » est celle donnée par le dictionnaire Gaffiot : ainsi, pour le thon, la fiche principale est Thynnus ; c’est elle qui porte les différentes identifications et les liens avec les autres noms (pas de la même famille) désignant le même animal. Juste au-dessous du nom, en haut de la fiche, apparaissent en caractères différents les variations graphiques : Thinnus, Tunnus, etc. Ces noms-ci, considérés comme des « variantes graphiques » font l’objet de fiches « secondaires » : en face du nom figure l’indication « voir Thynnus », avec un lien et, au-dessous, la référence exacte de la source où figure la variante. Lorsque le nom de poisson est un terme non-classique, par exemple translittéré du grec et/ou de l’arabe, on retient comme fiche principale la première forme dans l’ordre alphabétique : ainsi, Galalca sera considérée comme la forme « référente » et porte l’ensemble des informations et des liens, tandis que les formes Galalea et Galata sont considérées comme des variantes graphiques.

Les identifications retenues dans le thesaurus

L’identification des animaux aquatiques mentionnés dans les textes anciens est un exercice difficile qui demande une grande prudence. Aussi l’objectif de ce thesaurus n’est-il pas de décréter des identifications mais de présenter celles qui ont pu être faites par des savants, ichtyologues, latinistes et éditeurs, à partir de passages précis des sources. Il arrive qu’un poisson ne soit pas identifié, faute d’éléments déterminants, et une note de commentaire permet alors d’expliquer pourquoi. Il arrive souvent que la réalité décrite sous un même nom diffère selon les sources (le leo marinus peut ainsi désigner parfois un phoque et parfois une langouste) ou que, à propos d’une même source, les spécialistes ne s’accordent pas sur une identification : la fiche présente alors toutes les possibilités que nous avons trouvées dans les études et les commentaires. Pour la période de la Renaissance, l’insertion de nombreux termes vernaculaires dans les traités d’ichtyologie incite à une circonspection accrue. Les Synonymia de Peter Artedi, quoiqu’ils constituent une source inestimable pour l’ichtyonymie, associent parfois les dénominations vernaculaires, voire régionales, à des termes latins de manière complètement erronée. Il arrive aussi qu’il soit impossible de trouver les informations sur les appellations répertoriées par Artedi. Nous n’avons donc repris les liens établis par celui-ci entre noms latins et appellations vernaculaires que lorsqu’il nous est apparu qu’ils étaient fondés et, pour l’identification des synonymes vernaculaires d’Artedi, nous avons gardé une extrême prudence, en nous appuyant notamment sur les ouvrages naturalistes du xviiie siècle et sur les appellations vernaculaires encore en vigueur.

Grâce à son caractère collaboratif, le thesaurus des poissons et créatures aquatiques est appelé à s’enrichir constamment, soit par l’ajout de nouvelles créatures, au fur et à mesure que la Bibliothèque Ichtya intégrera de nouveaux textes, soit par l’ajout de nouvelles identifications à des fiches déjà existantes. Toutes les sources n’étant pas encore accessibles au public, quoique les noms de poissons y figurant aient déjà été indexés, il peut exister un décalage entre le thesaurus, où l’on trouvera la totalité des noms provenant des textes sources, et la bibliothèque. L’écart se comblera au fur et à mesure que les textes seront rendus accessibles. Pour rappel, la bibliothèque et le thesaurus sont conçus comme des laboratoires ; ils sont en constante évolution et leur contenu évolue au fil du travail des ingénieurs et des chercheurs.

Une modélisation par graphes

La constitution des données du thesaurus nous a conduits à une nouvelle expérimentation : la constitution de graphes à partir de la forme principale de chaque notice, sa langue, les identifications des poissons par les chercheurs et les notices en relation. Pour chaque notice, le lecteur peut accéder à un graphe montrant la place de cette notice dans le contexte du thesaurus tout entier et notamment à quelles autres notices celle-ci est rattachée. La notice centrale est symbolisée par le nom du poisson dans une ellipse jaune. Les notices auxquelles elle est rattachée sont symbolisées par le nom du poisson dans une ellipse bleue. Les liens entre ces notices sont symbolisées par des flèches dont les valeurs vont être : 1) « a pour variante » pour les variantes graphiques, 2) « a pour traduction » pour les termes traduits par les auteurs du corpus et 3) « est lié à » quand les notices ont été liées entre elles en notes de relation. Dans les deux premiers cas, il s’agit généralement du même poisson et les identifications, qui apparaissent au sein de carrés bleu clair, vont être les mêmes. Concernant le troisième cas [« est lié à »], les identifications vont pouvoir être semblables ou différentes : les notices peuvent être en relation parce qu’il s’agit du même poisson, ou bien de poissons de la même famille, ou bien de poissons qui ont été identifiés par des ichtyologues ou les compilateurs anciens comme étant les mêmes mais dont les scientifiques ont établi depuis qu’il s’agit de poissons différents.