sources et workflow : de l’encodage tei renaissance à l

14
Centre d'Études Supérieures de la Renaissance Université François Rabelais, Tours - UMR 6576 du CNRS – MSH de Tours http://www.cesr.univ-tours.fr/ Sources et workflow : De l’encodage TEI Renaissance à l’usage PhiloLogic Caen, 21 Octobre 2011 Jorge Fins Ingénieur d’étude Bibliothèques Virtuelles Humanistes

Upload: others

Post on 03-Nov-2021

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Sources et workflow : De l’encodage TEI Renaissance à l

Centre d'Études Supérieures de la RenaissanceUniversité François Rabelais, Tours - UMR 6576 du CNRS – MSH de Tourshttp://www.cesr.univ-tours.fr/

Sources et workflow :De l’encodage TEI Renaissance

àl’usage PhiloLogic

Caen, 21 Octobre 2011

Jorge FinsIngénieur d’étude

Bibliothèques Virtuelles Humanistes

Page 2: Sources et workflow : De l’encodage TEI Renaissance à l

Processus Epistemon

Source

Transcription

Texte brut

Fichier TEI

Encodage

Version PhiloLogic

Publication

Page 3: Sources et workflow : De l’encodage TEI Renaissance à l

Spécificités de la TEI RenaissanceUn affichage quasi-diplomatique, une gestion d’ états variables de texte :

- Encodage des formes originales et régularisation (<orig><reg>)

<l>Pource que rire est le propre de <choice><orig>lhõme</orig><reg>l’homme</reg></choice>.</l>(Rabelais, Gargantua, 1542)

Page 4: Sources et workflow : De l’encodage TEI Renaissance à l

-Respect des césures (<lb>)

Ne vous suffisoit nous avoir<lb/>ainsi morc<unclear hand="#MainX">r</unclear>ocassebezassevezassegrigueli-<lb/>guoscopapopondrillé tous les membres<lb/>superieurs a grand coups de bobelins, sans<lb/>nous donner telz morderegrippipiotabi-<lb/>rofreluchamburelurecoquelurintimpane-<lb/>mens sus les grefves a belles poinctes de<lb/>houzeaulx?

(Rabelais, Quart Livre, 1552)

Spécificités de la TEI RenaissanceUn affichage quasi-diplomatique, une gestion d’ états variables de texte :

Page 5: Sources et workflow : De l’encodage TEI Renaissance à l

-Respect des césures et indication des césures non marquées par un tiret (<lb>)

Ainsi signé sur le re$<lb/>ply, Par le Roy, Vous present <name>de Lomenie</name>, &amp; seelé à double queue du grand seau,<lb/>de cire jaune.(Ronsard, Elegie sur les troubles d’Amboise, Paris, 1563)

Spécificités de la TEI RenaissanceUn affichage quasi-diplomatique, une gestion d’ états variables de texte :

Page 6: Sources et workflow : De l’encodage TEI Renaissance à l

- Emploi de la foliotation/pagination originale (<fw>)

<fw place="top-right" type="pageNum">FEUIL.<choice><sic>LXX.</sic><corr>LIX.</corr></choice></fw>(Tory, Champ fleury, 1529)

Spécificités de la TEI RenaissanceUn affichage quasi-diplomatique, une gestion d’ états variables de texte :

Page 7: Sources et workflow : De l’encodage TEI Renaissance à l

- Encodage des illustrations (<figure>), - Respect de la mise en forme (<hi>)

<figure><graphic url="b410186201_i65_0048_image_02.jpg" height="0.37" rend="right"/></figure>

<lb/><note place="margin-left">Ordon-<lb/>nance des<lb/>sept Ars<lb/>liberaulx<lb/>&amp; <name>Apol-<lb/>lo</name>.</note>

<lb/><hi rend="larger">J</hi>E n’ay encores oublye, Dieu mer-(Tory, Champ fleury, 1529)

Spécificités de la TEI RenaissanceUn affichage quasi-diplomatique, une gestion d’ états variables de texte :

Page 8: Sources et workflow : De l’encodage TEI Renaissance à l

-Encodage des formes abrégées (<abbr><expan>)

<head rend="center">A <name><choice><abbr>M. C. D. B. L.</abbr><expan>Mademoiselle Clémence de Bourges Lyonnaise </expan></choice></name></head>(Labé, Oeuvres, 1555)

Spécificités de la TEI RenaissanceUn affichage quasi-diplomatique, une gestion d’ états variables de texte :

Page 9: Sources et workflow : De l’encodage TEI Renaissance à l

-Distinction entre texte original, notes (<note>) et ajouts/corrections manuscrites (<add @hand> ou <corr @hand > )

< si <choice><sic>ne</sic><corr hand="#Main1">me</corr></choice>le vouliez vendre, ou quel-

<lb/>que aultre du bas cueur.(Rabelais, Quart Livre, 1552)

Spécificités de la TEI RenaissanceUn affichage quasi-diplomatique, une gestion d’ états variables de texte :

Page 10: Sources et workflow : De l’encodage TEI Renaissance à l

-Encodage des erreurs (<sic><corr>) , omissions(<gap>) et restitutions (<supplied>)

<l><choice><sic>L’ache</sic><corr>Lache</corr></choice> desur l’oreille à ses chevaux les brides,</l><l>Et son char baille en garde aux cinquante

Phorcydes<gap></gap><supplied>.</supplied></l>(Ronsard, Réponse aux injures et calomnies de je ne sais quels prédicants et ministres de Genève, sur son Discours et Continuation des misères de ce temps, 1563)

Spécificités de la TEI RenaissanceUn affichage quasi-diplomatique, une gestion d’ états variables de texte :

Page 11: Sources et workflow : De l’encodage TEI Renaissance à l

Le choix de PhiloLogic

-Besoin d’un outil d’analyse pour nos fichiers (histoire de la langue).

- Fonctions de recherche expertes insuffisantes avec XTF(ex : PhiloLogic peut distinguer les accents graves des accents aigus, et peut gérer les apostrophes).

- Affichage quasi-diplomatique/Texte régularisé : nécessité d’une version de fichier et d’un moteur différent.

- Des fonctions précieuses comme la recherche par similarité ou les tables de collocation croisées à des requêtes sur les métadonnées, ainsi que sur la typologie des sections d’ouvrage.

Page 12: Sources et workflow : De l’encodage TEI Renaissance à l

Nettoyage des fichiers

Des choix :

-Ne conserver que le « corps du texte » (suppression des <note>,<add>, <gap>, <fw>),- sans autre média (<figure>),- sans mise en forme (<hi> et @rend).

- Un état sans abréviation(<expan>), - détildé et dissimilé (<reg>) - corrigé(<corr> ou <sic> si seul), - et sans césure (mots coupés en fin de ligne recollés).

Page 13: Sources et workflow : De l’encodage TEI Renaissance à l

Nettoyage des fichiers

Des adaptations:

- La numérotation originale des pages/feuillets déplacée (<fw@pageNum > => <pb @n>-Les esperluettes (caractère spécial pour PhiloLogic) sont transformées en "et"- L’encodage des métadonnées bibliographiques (ex : <name> au lieu de <persName> pour <author> et <publisher>, contrairement à l’encodage TEI Renaissance).- Ajout de <head> dans les <div> n’en contenant pas-Suppression des <lb/> dans les <head>

Page 14: Sources et workflow : De l’encodage TEI Renaissance à l

Centre d'Études Supérieures de la RenaissanceUniversité François Rabelais, Tours - UMR 6576 du CNRS – MSH de Tourshttp://www.cesr.univ-tours.fr/

Résultat

!

Jorge FinsIngénieur d’étude

Bibliothèques Virtuelles Humanistes

http://www.bvh.univ-tours.fr/Epistemon/philologic.asp