expériences d ’ encodages teienssibal.enssib.fr/bibliotheque/documents/travaux/exper... ·...

22
1 1 Expériences d ’ encodages TEI . 1) Un court exemple. Nécessité d'un encodage. Quel type d'encodage? Comment procéder? 2) La TEI. Comment est construit un fichier , quels sont le les éléments qui structurent un texte, qui le caractérisent 3) Les textes littéraires se prêtent- t’ils à ce type traitements ? Quels sont les éléments spécifiques qui leur sont réservés ? 4) Développements. Conclusions. Jean-Luc BENOIT INaLF définitions Encodage. (ling.): l’un des processus de la communication. (opération de transmutation du message en une forme codée qui permet sa transmission). Rendre un texte explicite en décrivant sa structure grâce •à une syntaxe. •à des caractères. 3 Remarque. N’est pas un langage de formatage des données qui se concentre sur l’affichage final du document. Ex. Rich Text Format. N’est pas un langage de programmation (ensemble d’instructions interprétées ou compilées dans un programme . Ex. Java) 4 Ex. Hyper Text Markup Langage. Standard Generalized Markup Langage. eXtensible Markup Langage

Upload: others

Post on 08-Aug-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Expériences d ’ encodages TEIenssibal.enssib.fr/bibliotheque/documents/travaux/exper... · 2001-04-24 · Quels sont les éléments spécifiques qui leur sont réservés ? 4) Développements

1

1

Expériences d ’ encodages TEI.

1 ) U n c o u r t e x e m p l e . N é c e s s i t é d ' u n e n c o d a g e . Q u e l t y p ed ' e n c o d a g e ? C o m m e n t p r o c é d e r ?

2 ) L a T E I . C o m m e n t e s t c o n s t r u i t u n f i c h i e r , q u e l s s o n t l e sl e s é l é m e n t s q u i s t r u c t u r e n t u n t e x t e , q u i l e c a r a c t é r i s e n t ?

3 ) L e s t e x t e s l i t t é r a i r e s s e p r ê t e n t - t ’ i l s à c e t y p et r a i t e m e n t s ? Q u e l s s o n t l e s é l é m e n t s s p é c i f i q u e s q u il e u r s o n t r é s e r v é s ?

4 ) D é v e l o p p e m e n t s . C o n c l u s i o n s .

Jean-Luc BENOIT

INaLFJean-Luc BENOIT

INaLF

2

définitions

Encodage. (ling.): l’un des processus de la communication. (opération de transmutation du message en une forme codée qui permet sa transmission).

•Rendre un texte explicite en décrivant sa structure grâce•à une syntaxe. •à des caractères.

3

Remarque.

• N’est pas un langage de formatage des données qui se concentre sur l’affichage final du document. Ex. Rich Text Format.

• N’est pas un langage de programmation (ensemble d’instructions interprétées ou compilées dans un programme . Ex. Java)

4

Ex.

Hyper Text Markup Langage.Standard Generalized Markup Langage. eXtensible Markup Langage

Page 2: Expériences d ’ encodages TEIenssibal.enssib.fr/bibliotheque/documents/travaux/exper... · 2001-04-24 · Quels sont les éléments spécifiques qui leur sont réservés ? 4) Développements

2

5

Expériences d ’ encodages TEI.

1) Un court exemple. Nécessité d'un encodage. Quel typed'encodage? Comment procéder?

2) La TEI. Comment est construit un fichier , quels sont lesles éléments qui structurent un texte, qui le caractérisent?

3) Les textes littéraires se prêtent- t’ils à ce typetraitements ? Quels sont les éléments spécifiques quileur sont réservés ?

4) Développements. Conclusions. Jean-Luc BENOIT

INaLFJean-Luc BENOIT

INaLF

6

1.Un bref exemple.

Un fichier texte généré par un lecteur optique.

7

Au bord de la cressonnière, Antigone, tu étais encore trèspetite et Ismène au berceau. Tes frères faisaient desricochets sur l'eau, ils m'assaillaient de leurs cris pour que jedise qui en avait fait le plus ou avait lancé le plus loin.... J'airamassé une pierre et je t'ai dit: "Essaie." Tu as hésité, puistu as pris la pierre mais tu étais encore si petite, la pierre n'apas ricoché et est tombée tout près. Tu n'as pas pleuré maisj'ai senti ta déception. J'ai ramassé une346

8

autre pierre et je t'ai dit : "Essaie encore,lance-la seulement. Tu peux!" Tu m'asregardée, interdite et tu as demandé : 'jepeux, maman ?" J'ai redit: "Tu peux." Tuas lancé la pierre un peu plus loin. Tu étaisfière mais chaque fois que je te donnais unnouveau caillou, tu me demandais : "jepeux ?" Et tu ne bougeais pas avant que jete dise: "Tu peux."

Page 3: Expériences d ’ encodages TEIenssibal.enssib.fr/bibliotheque/documents/travaux/exper... · 2001-04-24 · Quels sont les éléments spécifiques qui leur sont réservés ? 4) Développements

3

9

Soudain les larmes me sont venues auxyeux, je me suis demandé: Est-ce quequelque chose opprime cette enfant pourqu'elle ait tant besoin de ma permission.J'ai compris que je te mesurais trop monattention, toujours sollicitée par l'espritaventuré et menaçant d'Œdipe. ... Alors jet'ai dit en plongeant mon regard dans letien : "Dorénavant donne-toi la permissiontoute seule, Antigone. Tu peux!"

(Henri Bauchau, Antigone,p.346-347)

10

Remarques:

Au bord de la cressonnière, Antigone, tu étais encore très petite et Ismène au berceau. Tes frèresfaisaient des ricochets sur l'eau, ils m'assaillaient de leurs cris pour que je dise qui en avait fait leplus ou avait lancé le plus loin.... J'ai ramassé une pierre et je t'ai dit: "Essaie." Tu as hésité, puis tuas pris la pierre mais tu étais encore si petite, la pierre n'a pas ricoché et est tombée tout près. Tun'as pas pleuré mais j'ai senti ta déception. J'ai ramassé une 346autre pierre et je t'ai dit : "Essaie encore, lance-la seulement. Tu peux!" Tu m'as regardée, interditeet tu as demandé : 'je peux, maman ?" J'ai redit: "Tu peux." Tu as lancé la pierre un peu plus loin.

Tu étais fière mais chaque fois que je te donnais un nouveaucaillou, tu me demandais : "je peux ?" Et tu ne bougeais pasavant que je te dise: "Tu peux."Soudain les larmes me sont venues aux yeux, je me suisdemandé: Est-ce que quelque chose opprime cette enfant pourqu'elle ait tant besoin de ma permission. J'ai compris que je te mesurais tropmon attention, toujours sollicitée par l'esprit aventuré et mena- çant d'Œdipe. ...Alors je t'ai dit enplongeant mon regard dans le tien : "Dorénavant donne-toi la permission toute seule, Antigone. Tupeux!"

(Henri Bauchau, Antigone, p.346-347)

La structure du texte est marquée par des espaces blancs

11

Remarques:

La structure du texte est marquée par des espaces blancs

I

LE TEMPLE ROUGE

Depuis la mort d'Œdipe, mes yeux et ma pen-sée sont orientés vers la mer et c'est près d'elleque je me réfugie toujours.

12

remarques

Au bord de la cressonnière, Antigone, tu étais encore très petite et Ismène au berceau. Tes frèresfaisaient des ricochets sur l'eau, ils m'assaillaient de leurs cris pour que je dise qui en avait fait le plusou avait lancé le plus loin.... J'ai ramassé une pierre et je t'ai dit: "Essaie." Tu as hésité, puis tu as pris

la pierre mais tu étais encore si petite, la pierre n'a pas ricoché et est tombée tout près. Tu n'aspas pleuré mais j'ai senti ta déception. J'ai ramassé une346autre pierre et je t'ai dit : "Essaie encore, lance-la seulement. Tupeux!" Tu m'as regardée, interdite et tu as demandé : 'je peux, maman ?" J'ai redit: "Tu peux." Tuas lancé la pierre un peu plus loin. Tu étais fière mais chaque fois que je te donnais un nouveaucaillou, tu me demandais : "je peux ?" Et tu ne bougeais pas avant que je te dise: "Tu peux."Soudain les larmes me sont venues aux yeux, je me suis demandé: Est-ce que quelque chose opprimecette enfant pour qu'elle ait tant besoin de ma permission. J'ai compris que je te mesurais trop monattention, toujours sollicitée par l'esprit aventuré et mena- çant d'Œdipe. ...Alors je t'ai dit enplongeant mon regard dans le tien : "Dorénavant donne-toi la permission toute seule, Antigone. Tupeux!"

(Henri Bauchau, Antigone, p.346-347)

N°de page intégré au texte

Page 4: Expériences d ’ encodages TEIenssibal.enssib.fr/bibliotheque/documents/travaux/exper... · 2001-04-24 · Quels sont les éléments spécifiques qui leur sont réservés ? 4) Développements

4

13

1.Un bref exemple.

Le fichier texte généré par un lecteur optiquerestitue le texte fidèlement dans sa forme

mais il ne renseigne pas sur la sructure du texte,

Il n’ajoute rien au texte .

14

Marque des divisions.

<div> <head>I<head>

<head>LE TEMPLE ROUGE<head>

Depuis la mort d'Œdipe, mes yeux et ma pen-sée sont orientés vers la mer et c'est près d'elleque je me réfugie toujours.

15

Marque des divisions.

<div> <p>...tu medemandais : "je peux ?" Et tu ne bougeais pasavant que je te dise: "Tu peux. " </p><p>Soudain les larmes me sont venues aux yeux,...

16

Marques des numéros de page

Tu as hésité, puis tu as pris la pierre mais tu étais encore si petite, la pierre n'a pas ricoché et est tombée tout près. Tu n'as pas pleuré mais j'ai senti ta déception. J'ai ramassé une <pb n= "346 " >autre pierre et je t'ai dit : "Essaie encore, lance-la seulement.

Page 5: Expériences d ’ encodages TEIenssibal.enssib.fr/bibliotheque/documents/travaux/exper... · 2001-04-24 · Quels sont les éléments spécifiques qui leur sont réservés ? 4) Développements

5

17

Rendre un texte explicite au moyen:

• D’une syntaxe.

• De caractères.

18

jeux de caractères, signes diacritiques, …le rôle des entités.

- lig=ligature- uml =umlaut - acute=aigu- grave=grave- circ=circonflexe- tilde =tilde

-

19

jeux de caractères, signes diacritiques, ...

J'ai compris que je te mesu&shy;rais trop mon attention, toujours sollicitée parl'esprit aventuré et menaçant d ’OElig;dipe.

20

jeux de caractères, signes diacritiques, ...

J'ai ramassé

346

une autre pierre et je t'ai dit : "Essaie encore" ,lance-la seulement. "Tu peux!" Tu m'as regardée,...

signes typographiques

Page 6: Expériences d ’ encodages TEIenssibal.enssib.fr/bibliotheque/documents/travaux/exper... · 2001-04-24 · Quels sont les éléments spécifiques qui leur sont réservés ? 4) Développements

6

21

jeux de caractères, signes diacritiques, ....

Au bord de la cressonnière, Antigone, tu étais encore très petite et Ismène au berceau. Tes frères faisaient des ricochets sur l'eau, ils m'assaillaient de leurs cris pour que je dise qui en avait fait le plus ou avait lancé le plus loin&hellip. J'ai ramassé une pierre et je t'ai dit: &laquo;Essaie. &raquoTu as hésité, puis tu as pris la pierre mais tu étais encore si petite, la pierre n'a pas ricoché et est tombée tout près.Tu n'as pas pleuré mais j'ai senti ta déception.

22

jeux de caractères, signes diacritiques, ...

On note ainsi:

les tirets de dialogues.

Les mots inachevés qui se terminent par …

Les différentes sortes de guillemets.

23

À retenir: la normalisation différencie la structure et le contenu.

• Présentation

• Contenu

• Structure

transcription normalisation

Présentation

Contenu

Structure

24

La transcription et ses limites

Numéros de pages et références,titres courants mêlés .

Hétérogénéité du texte

Page 7: Expériences d ’ encodages TEIenssibal.enssib.fr/bibliotheque/documents/travaux/exper... · 2001-04-24 · Quels sont les éléments spécifiques qui leur sont réservés ? 4) Développements

7

25

La transcription et ses limites

Jeux de caractères, signes diacritiques locaux.

transfert à travers les réseaux impossibles

26

La transcription et ses limites

paragraphes , titres marquées par des blancs,

fin de ligne forcées introduites au bout de chaque ligne.

tout changement de taille de police lors de l ’impression du texte engendrera des problèmes de mises en page

27

Expériences d ’ encodages TEI.

1) Un court exemple. Nécessité d'un encodage. Quel typed'encodage? Comment procéder?

2) La TEI. Comment est construit un fichier , quels sont lesles éléments qui structurent un texte, qui le caractérisent?

3) Les textes littéraires se prêtent- t’ils à ce typetraitements ? Quels sont les éléments spécifiques quileur sont réservés ?

4) Développements. Conclusions. Jean-Luc BENOIT

INaLFJean-Luc BENOIT

INaLF

28

TEI

• Un document TEI est constitué d ’un ensemble de blocs d ’informations.

• Les blocs d ’information d ’un document TEI sont constitués de balises et de caractères.

• Les balises permettent de définir la structure logique d ’un document et d ’en encoder le format de stockage.

Page 8: Expériences d ’ encodages TEIenssibal.enssib.fr/bibliotheque/documents/travaux/exper... · 2001-04-24 · Quels sont les éléments spécifiques qui leur sont réservés ? 4) Développements

8

29

I

LE TEMPLE ROUGE

Depuis la mort d'Œdipe, mes yeux et mapensée sont orientés vers la mer et c'estprès d'elle que je me réfugie toujours.

<div type=« chapitre »>

<head> </head>

<head> </head>

<p>

</p>

30

1 Décrire la structure du texte

• <div>

• <div>

• <div>

• <div>

• </div>

• </div>

• </div>

• </div>

• <div>

• <p>

• <p>

• <p>

• </p>

• </p>

• </p>

• </p>

• </div>

31

1.Décrire la structure du texte.

<div type ="partie" n="1"> <head> I</head> <head> LE TEMPLE ROUGE </head></div>

<div type ="partie" n="2"><head> II</head><head> LA FORÊT </head></div>

<div type ="partie" n="3"><head> III</head><head> ANTIGONE NE SE RETOURNE PAS </head></div>

32

Marque des titres

<div> <head>LE TEMPLE ROUGE<head>

Depuis la mort d'Œdipe, mes yeux et ma pen-sée sont orientés vers la mer et c'est près d'elleque je me réfugie toujours.

Page 9: Expériences d ’ encodages TEIenssibal.enssib.fr/bibliotheque/documents/travaux/exper... · 2001-04-24 · Quels sont les éléments spécifiques qui leur sont réservés ? 4) Développements

9

33

marque des paragraphes

<p>Au bord de la cressonnière, Antigone, tu étais encore très petite et Ismène au berceau. Tes frères faisaient des ricochets sur l'eau, ils m'assaillaient de leurs cris pour que je dise qui en avait fait le plus ou avait lancé le plus loin... J'ai ramassé une pierre et je t'ai dit: “Essaie.” Tu as hésité, puis tu as pris la pierre mais tu étais encore si petite, lapierre n'a pas ricoché et est tombée tout près .Tu n'as pas pleuré mais j'ai senti ta déception.</p>

34

<q> est circonscrit à<p>

<p><q who="jocaste">Au bord de la cressonnière, Antigone, tu étaisencore très petite et Ismène au berceau.</q><q> Tes frères faisaient des ricochets sur l'eau, ils m'assaillaient de leurs cris pour que je disequi en avait fait le plus ou avait lancé le plus loin...</q><q> J'ai ramassé une pierre et je t'ai dit:”Essaie.”</q><q> Tu as hésité, puis tuas pris la pierre mais tu étais encore si petite, la pierre n'a pas ricochéet est tombée tout près</q>. <q>Tu n'as pas pleuré mais j'ai senti ta déception.</q>

35

1.Décrire la structure du texte.

• <p><q who="jocaste">Au bord de la cressonnière, Antigone, tu étais encore très petite et Ismène auberceau.</q><q> Tes frères faisaient des ricochets sur l'eau, ils m'assaillaient de leurs cris pour que je dise qui enavait fait le plus ou avait lancé le plus loin...</q><q> J'ai ramassé une pierre et je t'ai dit:”Essaie.”</q><q> Tu ashésité, puis tu as pris la pierre mais tu étais encore si petite, la pierre n'a pas ricoché et est tombée tout près</q>. <q>Tu n'as pas pleuré mais j'ai senti ta déception.</q>

36

2. Marquage d ’éléments caractérisants.

• Changements des styles de caractères ou alternances typographiques

• <hi> : highlighted

• <foreign>: identifie un mot comme appartenant à une langue autre que celle du texte qui l ’entoure

• <emph>: marque des mots qui sont accentués, mis en valeur...

• <title> :contient le titre d ’une œuvre...

Page 10: Expériences d ’ encodages TEIenssibal.enssib.fr/bibliotheque/documents/travaux/exper... · 2001-04-24 · Quels sont les éléments spécifiques qui leur sont réservés ? 4) Développements

10

37

<hi> : highlightedmarque un mot ou une expression comme étant graphiquement distinct.

• lang : attribut global indiquant la langue utilisée.

• rend : indique une typographie distincte.

38

2. Marquage d ’éléments caractérisants.

Marque de l’italique , du gras.

… car j'entendsdes mots, ceux d'Œdipe peut-être, qui compo-sent un poème :

<hi rend=" italique ">Seigneur des chevaux et des hommesdieu de l'arc noirprotège le peuple thébainprotège le peuple nomade…. </hi>

39

2. Marquage d ’éléments caractérisants.

<abbr> : Abbreviations .

• expan : donne le développement de l ’abréviation.

• type: classe l ’abréviation:

-contraction.

-suspension.

-acronym.

40

2. Marquage d ’éléments caractérisants.

<abbr> : Abbreviations .

N'écoute personne sauf Ismèneet mon ami <name><abbr type="anonyme"expan="?"<abbr>K. </abbr></name>

Page 11: Expériences d ’ encodages TEIenssibal.enssib.fr/bibliotheque/documents/travaux/exper... · 2001-04-24 · Quels sont les éléments spécifiques qui leur sont réservés ? 4) Développements

11

41

2. Marquage d ’éléments caractérisants.

Interventions éditoriales

<l>Puis, lorsqu'<sic corr=’ils' resp=JLB>il</sic> il ont jasé tous ensemble à leur aise,</l><l>Ils font soudain, les grands s'appuyant à ma chaise,</l><l>Et les petits toujours groupés sur mes genoux,</l><pb n="39"><l>Un silence, et cela veut dire : “ Parle-nous. “</l>

42

2. Marquage d ’éléments caractérisants. Marquage des noms, des dates des chiffres.

• <name> contient un nom propre.

Type:

-nom de personne.

-collectif.

-nom de lieu.

43

2. Marquage d ’éléments caractérisants.

Les noms propres.

Au bord de la cressonnière, <name>Antigone</name>, tu étais encore très petite et <name>Ismène</name> au berceau. Tes frères faisaient des ricochets sur l'eau, ils m'assaillaient de leurs cris pourque je dise qui en avait fait le plus ou avait lancé le plus loin. J'ai ramassé une pierre et je t'ai dit: “Essaie.” Tu as hésité, puis tu as prisla pierre mais tu étais encore si petite, la pierre n'a pas ricoché et est tombée tout près. Tu n'as pas pleuré mais j'ai senti ta déception.

44

2. Marquage d ’éléments caractérisants.

Les noms propres.

En l'embrassantje lui redis les paroles d'Œdipe à <name>Colone</name>: "Tu esroi, mon fils, tu es plus, tu es le roi, comme tamère était la reine."

Page 12: Expériences d ’ encodages TEIenssibal.enssib.fr/bibliotheque/documents/travaux/exper... · 2001-04-24 · Quels sont les éléments spécifiques qui leur sont réservés ? 4) Développements

12

45

transcription vs normalisation

transcription normalisation

Normaliser un texte c’est permettre de différencier le contenu et la structure d ’un document de sa présentation sans aucune perte d ’information.

C ’est enrichir le texte en repérant ses éléments spécifiques.

46

conséquences.

Le fichier texte normalisé par un langage debalisage isole la stucture du texte et les traits

spécifiques du texte.

Baliser et lire procèdent de la même démarche.

Le texte reçoit une plus-value.

47

Quelles types de « normalisations » ont été apportées?1.Structuration du document.

• Divisions du texte (parties, paragraphes...explicites

• Références d ’entités utilisées.

• Divisions en pages, lignes... par un seul élément vide <pb>,<lb>,<cb>.

48

Quelles types de « normalisations » ont été apportées?2.Marquage du document.

• Changements des styles de caractères ou alternances typographiques.

• Noms propres , dates.

• Citations et éléments associés.

Page 13: Expériences d ’ encodages TEIenssibal.enssib.fr/bibliotheque/documents/travaux/exper... · 2001-04-24 · Quels sont les éléments spécifiques qui leur sont réservés ? 4) Développements

13

49

Quelles types de « normalisations » ont été apportées?2.Marquage du document.

• repentirs .

• Corrections de l ’éditeur.

• Corrections sur l ’édition.

• Ajouts de renvois .

• Création de tables.

50

Quel système adopter?

• Les descriptions fondamentales d’un texte puissent être facilement modifiées..

51

Quel système adopter?• Les descriptions fondamentales d’un texte facilement changeées

• Les descriptions spécialisées puissent être facilement ajoutées ou supprimées d’un texte.

• La même caractèristique d’un texte puisse être encodée en

• parallèle de plusieurs façons

• La richesses du balisage puisse être déterminée par l’utilisateur de la façon la plus simple possible.

• Une documentation relative au texte et à la façon dont il a été codé soit fournie.

52

Quel système adopter?• Les descriptions fondamentales d’un texte facilement

modifiables

• Les descriptions specialisées puissent être facilement ajoutées ou supprimées d’un récit.

• La même caractéristique d’un texte puisse être encodée en parallèle de plusieurs façons.

• La richesses du balisage puisse être déterminée par l’utilisateur de la façon la plus simple possible.

• Une documentation relative au texte et à la façon dont il a été codé soit fournie.

Page 14: Expériences d ’ encodages TEIenssibal.enssib.fr/bibliotheque/documents/travaux/exper... · 2001-04-24 · Quels sont les éléments spécifiques qui leur sont réservés ? 4) Développements

14

53

Quel système adopter?• Les descriptions fondamentales d’un texte facilement

changeables.

• Les descriptions specialisées puissent être facilement ajoutées ou supprimées d’un récit.

• La même caractèristique d’un texte puisse être encodée en parallèle de plusieurs façons

• La richesses du balisage puisse être déterminée par l’utilisateur de la façon la plus simple possible.

• Une documentation relative au texte et à la façon dont il a été codé soit fournie.

54

Quel système adopter?• Les descriptions fondamentales d’un texte facilement

changeables.

• Les descriptions specialisées puissent être facilement ajoutées ou supprimées d’un récit.

• La même caractèristique d’un texte puisse être encodée en parallèle de plusieurs façons

• La richesses du balisage puisse être déterminée par l’utilisateur de la façon la plus simple possible.

• Une documentation relative au texte et à la façon dont il a été codé soit fournie.

55

• Indépendant des systèmes informatiques.

• Reposant sur une norme internationale: Standard

Generalized Markup Langage(SGML)• Assure au document

Text Encoding Initiative

Lisibilité.

Pérennité

Facilitation des échanges.

56

3. balisage généraliste et balisage spécialisé.

Prose

Théâtre

Poésie

Page 15: Expériences d ’ encodages TEIenssibal.enssib.fr/bibliotheque/documents/travaux/exper... · 2001-04-24 · Quels sont les éléments spécifiques qui leur sont réservés ? 4) Développements

15

57

Structure d'un document TEI

<text><front>[avant-textes...] </front>

<body>[corps du texte...]</body><back>[annexes...]</back>

<teiheader>[informations contenues dans le header...]

58

Le header

• Originalité

• Contrainte: oblige à décrire:

• Fait pour favoriser l’échange de documents.

• Description détaillée.

Le fichier élecronique.

les règles de codages utilisées

informations relatives la création du texte codé

résume l’historique du fichier.

59

header

fileDesc

encodingDesc

profileDesc

revisionDesc

60

Page de titre élecroniqueDescription bibliographique complète du fichier électronique.

Documente le rapport entre le texte électronique et la source dont il dérive

Décrit des aspects non bibliographiques d ’un texte spécialement les langues,les circonstances de sa production

Résume l’historique des révisions du fichier.

Page 16: Expériences d ’ encodages TEIenssibal.enssib.fr/bibliotheque/documents/travaux/exper... · 2001-04-24 · Quels sont les éléments spécifiques qui leur sont réservés ? 4) Développements

16

61

fileDesc

• <titleSmt> titre, auteur, responsabilités,…

• <editionSmt> statut de l’édition provisoire ou non.

• <extent> taille du document.

• <publicationSmt> numéro idno, diffusion.

• <seriesSmt>information sur la collection ou la série.

• <notesSmt>annotations non bibliographiques...

• <sourceDesc>62

<sourceDesc>

• Description bibliographique du ou des textes originaux à partir desquels un texte électronique a été généré.

63

<sourcedesc default="no" teiform="sourceDesc"><biblstruct default="no" teiform="biblStruct">

<monogr teiform="monogr"><title level="m" teiform="title">Antigone</title><author teiform="author">Bauchau, Henry</author><imprint teiform="imprint">

<date teiform="date">octobre 1997</date><publisher teiform="publisher">Actes Sud</publisher><pubplace teiform="pubPlace">Paris</pubplace>

</imprint></monogr>

</biblstruct></sourcedesc> date de l’achevé d’imprimerDate de l’achevé d’imprimer.

<sourceDesc>

64

<profiledesc teiform="profileDesc"><creation teiform="creation">

<date teiform="date">août 1997</date><name type="lieu" teiform="name">Paris</name>

</creation><langusage default="no" teiform="langUsage">

<language id="LAT"teiform="language">latin</language>

<language id="IT”…Date de première édition

<profileDesc>

Page 17: Expériences d ’ encodages TEIenssibal.enssib.fr/bibliotheque/documents/travaux/exper... · 2001-04-24 · Quels sont les éléments spécifiques qui leur sont réservés ? 4) Développements

17

65

Expériences d ’ encodages TEI.

1) Un court exemple. Nécessité d'un encodage. Quel typed'encodage? Comment procéder?

2) La TEI. Comment est construit un fichier , quels sont lesles éléments qui structurent un texte, qui le caractérisent?

3) Les textes littéraires se prêtent- t’ils à ce typetraitements ? Quels sont les éléments spécifiques quileur sont réservés ?

4) Développements. Conclusions. Jean-Luc BENOIT

INaLFJean-Luc BENOIT

INaLF

66

3.balisage généraliste et balisage spécialisé.

Prose

Théâtre

Poésie

67

Structure d’un texte poétique.

• Élément communs àtous les types de textes: “tagset”

• Remarque: plusieurs spécificités peuvent être conjuguées.

• <lg> (i.e. line group)

• Description: strophe définie soit par le nombre de vers qu’elle comprend, soit par la fonction qu’elle occupe dans le poème.

Éléments spécifiques

68

<div><head>La mort des amants </head><lg type="sonnet">

<lg type="quatrain"> <l>Nous aurons des lits pleins d'odeurs légères,</l><l>Des divans profonds comme des tombeaux, </l><l>Et d'étranges fleurs sur des étagères,</l><l>Ecloses pour nous sous des cieux plus beaux. </l></lg>

<lg type="quatrain"><l>Usant à l'envi leurs chaleurs dernières,</l><l>Nos deux coeur seront deux vastes flambeaux,</l><l>Qui réfléchiront leurs doubles lumières</l><l>Dans nos deux esprits, ces miroirs jumeaux.</l>

</lg>/...

Page 18: Expériences d ’ encodages TEIenssibal.enssib.fr/bibliotheque/documents/travaux/exper... · 2001-04-24 · Quels sont les éléments spécifiques qui leur sont réservés ? 4) Développements

18

69

Structure d’un vers

• Marque de la césure. <l>Nous aurons des lits<caesura> pleins d'odeurs légères,</l>

• <l>Hélas !<caesura> laissez les pleurs couler de mapaupière,</l>

70

<head>(1830-1843)</head>

<div type="liminaire">

<lg1 type="poeme"><lg type="quatrain">

<l>Un jour je vis<caesura>, debout au bord desflots mouvants,</l>

<l>Passer,<caesura> gonflant ses voiles,</l> <l>Un rapide navire<caesura> enveloppé de

vents,</l> <l>De vagues <caesura>et d'étoiles; </l> </lg>/…

71

Structure d’un vers

• Marque d’un enjambement.

<l>L'homme suivait des yeux les lueurs de la faulx.</l><l enjamb="y">Et les triomphateurs sous les arcs triomphaux</l><l>Tombaient ;

72

Métrique d’un vers .

• Disposition des accents.

<lg type="quatrain" met=“+-+-+/+-+-+”><l>Nous aurons des lits pleins d'odeurs légères,</l><l>Des divans profonds comme des tombeaux, </l><l>Et d'étranges fleurs sur des étagères,</l><l>Ecloses pour nous sous des cieux plus beaux. </l></lg>

Page 19: Expériences d ’ encodages TEIenssibal.enssib.fr/bibliotheque/documents/travaux/exper... · 2001-04-24 · Quels sont les éléments spécifiques qui leur sont réservés ? 4) Développements

19

73

Métrique d’un vers .

• Disposition des rimes.

<lg type="quatrain" rhyme="abab"><l>Nous aurons des lits pleins d'odeurs légères,</l><l>Des divans profonds comme des tombeaux, </l><l>Et d'étranges fleurs sur des étagères,</l><l>Ecloses pour nous sous des cieux plus beaux. </l></lg>

74

Poésie (métrique)

<l part=“i”>Hélas !</l>

<l part=“f”>Cet avocat plaide toutes les causes ;</l>

<l>Il rit des généreux qui désirent savoir</l>

<l>Si blanc n'a pas raison, avant de dire noir ;</l>

75

<div><lg1 type="poeme">

<lg2 type="quatrain" rhyme="abab"> <l met="-+-+/-+-+-+-+/">Un jour je vis<caesura>,

debout au bord des flots mouvants,</l> <l met="-+-+-+">Passer,<caesura> gonflant ses

voiles,</l> <l met="---+-+/-+-+-+"/>Un rapide navire<caesura>

enveloppé de vents,</l> <l met="-+---+/">De vagues et d'étoiles; </l> </lg2>

76

3.balisage généraliste et balisage spécialisé.

Prose

Théâtre

Poésie

Page 20: Expériences d ’ encodages TEIenssibal.enssib.fr/bibliotheque/documents/travaux/exper... · 2001-04-24 · Quels sont les éléments spécifiques qui leur sont réservés ? 4) Développements

20

77

Structurer un texte dramatique.

• <speaker>: nom d ’un ou de plusieurs locuteurs

• <sp>: contient une réplique.

• <stage> contient toute sorte d ’indications scéniques.

Éléments spécifiques

78

<castlist>: liste des personnages référencés.

<castlist teiform="castList">

<castitem><roleid="ALB"><name>ALBINE</name></role><roledesc>, confidented'<name>Agrippine</name>.</roledesc></castitem><castitem><role>GARDES.</role></castitem></castlist><<pb n="263"></div>

79

<sp who >: contient une réplique.<body teiform="body"><div part="N" sample="complete" org="uniform" type="acte" n="1" id="I"><head>ACTE I.</head><div part="N" sample="complete" org="uniform" type="scène" n="1" id="Ia"><head>SCÈNE PREMIÈRE.</head><stage>AGRIPPINE, ALBINE.</stage>

<sp who="ALB"><speaker>ALBINE.</speaker><l n="1">Quoi ? tandis que <name>Néron</name> s'abandonne ausommeil,</l><l n="2">Faut-il que vous veniez attendre son réveil ?</l><l n="3">Qu'errant dans le palais sans suite et sans escorte,</l><l n="4">La mère de <name>César</name> veille seule à sa porte ?</l><l n="5">Madame, retournez dans votre appartement.</l></sp>

<sp who="AGRI"><speaker>AGRIPPINE.</speaker><l n="6"><name>Albine</name>, il ne faut pas s'éloigner unmoment.</l><l n="7">Je veux l'attendre ici. Les chagrins qu'il me cause</l><l n="8">M'occuperont assez tout le temps qu'il repose.</l><pb n="264">

80

<stage contient une didascalie>

<stage type="mix" teiform="stage">La scène est à<name>Rome</name>, dans une chambre du palais de<name>Néron</name>.</stage>

Page 21: Expériences d ’ encodages TEIenssibal.enssib.fr/bibliotheque/documents/travaux/exper... · 2001-04-24 · Quels sont les éléments spécifiques qui leur sont réservés ? 4) Développements

21

81

Expériences d ’ encodages TEI.

1) Un court exemple. Nécessité d'un encodage. Quel typed'encodage? Comment procéder?

2) La TEI. Comment est construit un fichier , quels sont lesles éléments qui structurent un texte, qui le caractérisent?

3) Les textes littéraires se prêtent- t’ils à ce typetraitements ? Quels sont les éléments spécifiques quileur sont réservés ?

4) Développements. Conclusions. Jean-Luc BENOIT

INaLFJean-Luc BENOIT

INaLF

82

Développements. Conclusions.

• Le document décrit peut être affiché de différentes façons.

• Les utilisateurs de ces documents peuvent les manipuler sur leur poste sans que le serveur soit interrogé à nouveau.

• Les recherches sont facilitées et beaucoup plus puissantes.

• Des documents provenant de plusieurs sources peuvent être intégrées et manipulées.

83 84

Page 22: Expériences d ’ encodages TEIenssibal.enssib.fr/bibliotheque/documents/travaux/exper... · 2001-04-24 · Quels sont les éléments spécifiques qui leur sont réservés ? 4) Développements

22

85

Développements. Conclusions.

• Le codage repose sur un standard uniforme et indépendant des éditeurs de logiciels

• le passage à XML (eXtensible MarkupLangage) est aisé. (document bien formé).

• La TEI bénéficie d ’un guide en ligne .

86

Développements. Conclusions.

• Collaborations interdisciplinaires.

• Elaboration de bases de données selon des normes largement reconnues.

• Possibilité d ’échanges , d ’enrichissements.

• Compatibité avec XML

87

Des liens utiles

• http://etext.virginia.edu/TEI.html

• http://www.unicode.org/

• http://www.w3.org/

• http://www.info.unicaen.fr/bnum/jelec/Solaris/index.html