Présentation de la Bibliothèque Ichtya
La bibliothèque ichtyologique numérique Ichtya constitue le deuxième axe du programme Ichtya. Dans ce cadre, l’objectif des auteurs n’est pas d’élaborer ou de réunir des éditions critiques, dont certaines existent d’ailleurs déjà, mais de mettre en ligne, à disposition de la communauté de chercheurs s’intéressant au savoir ichtyologique, un corpus de textes latins consacrés à ce sujet, indexés et balisés, sous forme de site web interrogeable par moteur de recherche.
Un ensemble de textes, allant du ier siècle au xvie siècle a d’abord été répertorié, océrisé et pré-encodé en XML-TEI au CRAHAM et au Pôle Document Numérique de la MRSH. Ce corpus est constitué des textes de Pline l’Ancien, Ausone, Ovide, Solin, Basile de Césarée, Ambroise de Milan, Isidore de Séville, Alexandre Nequam, Barthélemy l’Anglais, Vincent de Beauvais, Arnold de Saxe, Marcus d’Orvieto, Carolus Figulus, Jean Ursin, Pierre Belon, Peter Artedi, du livre 4 de l’Hortus sanitatis, du livre 24 du De animalibus d’Albert le Grand et des livres 6 et 7 du De naturis rerum de Thomas de Cantimpré. Il est marqué par une certaine hétérogénéité : certains textes sont des parties d’une œuvre, d’autres, plus rares, constituent une œuvre complète ; certains sont déjà bien édités et étudiés, d’autres ne le sont pas. L’ensemble représente un volume textuel de près de 1 400 000 caractères.
Ce corpus a ensuite été traité de manière à répondre à deux objectifs : créer un lexique des noms de poissons latins à travers les siècles, d’une part ; mais aussi, de l’autre, permettre de cerner avec précision comment se fait la transmission des savoirs au fil des siècles. Il a donc été décidé d’indexer en priorité les noms de poissons et de créatures aquatiques, afin de permettre aux visiteurs de faire une recherche par nom et d’accéder immédiatement à tous les passages du corpus Ichtya dans lequel ce nom apparaît, d’en connaître les variantes et les synonymes. Mais, parallèlement, dans la plus grande partie des textes, on s’attache aussi à identifier les citations ou emprunts à des œuvres antérieures, à contextualiser ces fragments et à expliciter, dans la mesure du possible, la manière dont ces fragments ont été transmis, parfois de manière déformée. Dans ce but, on a donc veillé à respecter la même granularité de description des textes, du traité jusqu’au segment de citation, pour permettre des traitements automatiques et semi-automatiques du corpus par la suite.
L’utilisation du langage XML à la fois pour les éditions, la bibliothèque Ichtya et la base de noms de poissons et créatures aquatiques au moyen des recommandations de la Text Encoding Initiative (TEI) permet une interopérabilité totale. Chaque élément indexé dans une édition de texte, dans le corpus de la bibliothèque Ichtya ou dans l’index des zoonymies se trouve ainsi immédiatement traité et actif dans les données des deux autres supports : un nom de poisson indexé dans un texte de la bibliothèque se trouve immédiatement relié à une fiche dans le thesaurus ; une citation balisée dans un texte permet d’accéder directement à la source de celle-ci ou à la bibliothèque des citations du même auteur dans le corpus. Cette utilisation du langage XML permet aussi un partenariat avec le projet Sourcencyme, consacré à la constitution d’un corpus annoté en ligne des encyclopédies médiévales latines et piloté par l’IRHT ; les textes indexés et balisés à Caen peuvent ainsi être versés dans la base Sourcencyme à peu de frais.
Le corpus de la Bibliothèque Ichtya est un corpus de textes latins. Certains textes sont cependant accompagnés d’une traduction française lorsqu’ils ont fait l’objet d’une traduction effectuée par les membres du groupe Ichtya. Tous les textes n’ont pas encore été traités dans leur totalité. Ils seront ouverts au public au fur et à mesure de l’avancement des travaux de l’équipe.