les outils d'annotation et l'édition scientifique de corpus textuels - planches

85
ÉCOLE NATIONALE DES CHARTES _________ Johanna DANIEL Licenciée ès histoire Diplômée de l’École du Louvre Diplômée de master muséologie LES OUTILS D’ANNOTATION ET L’ÉDITION SCIENTIFIQUE DE CORPUS TEXTUELS L’exemple du projet « Les Guides de Paris (les historiens des arts et les corpus numériques) » Sous la direction de Jean-Baptiste Camps et d’Emmanuel Château VOLUME DE PLANCHES & ANNEXES Version corrigée février 2015 Mémoire pour le diplôme de master « Technologies numériques appliquées à l’histoire » 2014

Upload: johanna-daniel

Post on 20-Jul-2015

420 views

Category:

Education


3 download

TRANSCRIPT

Page 1: les outils d'annotation et l'édition scientifique de corpus textuels - planches

ÉCOLE NATIONALE DES CHARTES

_________

Johanna DANIEL Licenciée ès histoire

Diplômée de l’École du Louvre

Diplômée de master muséologie

LES OUTILS D’ANNOTATION ET L’ÉDITION

SCIENTIFIQUE DE CORPUS TEXTUELS

L’exemple du projet « Les Guides de Paris (les historiens des arts et

les corpus numériques) »

Sous la direction de Jean-Baptiste Camps et d’Emmanuel Château

VOLUME DE PLANCHES & ANNEXES

Version corrigée – février 2015

Mémoire pour le diplôme de master

« Technologies numériques appliquées à l’histoire »

2014

Page 2: les outils d'annotation et l'édition scientifique de corpus textuels - planches
Page 3: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche I

Planche I. Evolution de la production des guides de Paris

CHABAUD Gilles, « Les guides de Paris du XVIIe siècle au début du XIXe siècle. Remarques sur une construction historique »,

in Les guides imprimés du XVIe au XXe siècle. Villes, paysages, voyages [actes du colloque, 3-5 décembre 1998, Université

Paris VII-Denis Diderot], Paris, Belin, 2000, p. 71-80.

Page 4: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche II. Corrozet, les Antiquitez, histoire et singularitez de Paris (1550)

CORROZET, Gilles, Les antiquitez, histoires et singularitez de Paris, Paris, Gilles Corrozet, 1550. Exemplaire de

Paul lacombe, passé en vente chez Eric Gangeon, http://www.ericgrangeon.com/home/57-corrozet-gilles-.html

CORROZET, Gilles, Les antiquitez, histoires et singularitez de Paris, Paris, Gilles Corrozet, 1561. Exemplaire

conservé à l’INHA. http://www.purl.org/yoolib/inha/3847 Frontispice et extraits de la liste des rues et de la liste

des fontaines.

Page 5: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche III

Planche III. Du Breul, Le Théâtre des antiquitez de Paris (1639)

DU BREUL, Jacques, Le théâtre des antiquitez de Paris, Paris, 1639, exemplaire conservé à la BnF.

http://gallica.bnf.fr/ark:/12148/bpt6k10401137/f5.image

Page 6: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche IV. Brice, Description nouvelle de ce qu'il y a de plus remarquable dans la

ville de Paris (1684)

BRICE, Germain, Description nouvelle de ce qu'il y a de plus remarquable dans la ville de Paris, 1684, exemplaire

conservé à la BnF, http://gallica.bnf.fr/ark:/12148/bpt6k853965d/f9.image

Page 7: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche V

Planche V. Brice, Description de la ville de Paris (1752)

BRICE, Germain, Description de la ville de Paris, et de tout ce qu'elle contient de plus remarquable, Paris, Minard,

1752, exemplaire conservé à l’INHA, http://www.purl.org/yoolib/inha/3516

Page 8: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche VI. Dechuyes, La Guide de Paris (1647)

DECHUYES, Georges, La guide de Paris : contenant le nom & l'adresse de toutes les ruës de ladite ville & faux-bourgs,

avec leurs tenans & aboutissans, 1656, exemplaire conservé à la BnF http://gallica.bnf.fr/ark:/12148/bpt6k5652113d

Page 9: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche VII

Planche VII. Jeze, Etat ou tableau de la ville de Paris (1765)

JEZE, Etat ouTableau universel et raisonné de la ville de Paris, 1765, exemplaire conservé à la BnF,

http://gallica.bnf.fr/ark:/12148/bpt6k65253595

Page 10: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche VIII. Hurtaut et Magny, Dictionnaire historique de la ville de Paris (1779)

HURTAUT et MAGNY, Dictionnaire historique de la ville de Paris et de ses environs, 1779, exemplaire conservé à

la BnF http://gallica.bnf.fr/ark:/12148/bpt6k1040243q

Page 11: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche IX

Planche IX. Sauval, Histoire et recherches des antiquités de la ville de Paris (1724)

SAUVAL, Henri, Histoire et recherches des antiquités de la ville de Paris, Paris, C. Moette, 1724, exemplaire

conservé à la BnF.

Page 12: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche X. Tableau analytique de la réédition de la Description de Paris de Germain

Brice par Michel Fleury

Cet index qui précède le fac similé de la dernière édition de la Description de Paris par Germain Brice précise,

pour chaque entrée, les pages dans chacune des 9 éditions de l’ouvrage. Cela facilite au chercheur le repérage

des passages dans les différentes éditions, permet de noter les apparitions et disparitions de passage. A cet

index de 150 pages est adjoint un tableau recensant les éditions conservées dans les bibliothèques parisiennes.

FLEURY, Michel (pref.), BRICE Germain, Description de la ville de Paris: et de tout ce qu’elle contient de plus

remarquable, 9e éd, Genève Paris, Droz Minard, 1971, 561 p.

Page 13: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XI

Planche XI. Exemple d’encodage en TEI

Encodage en cours de l’édition de 1724 de Histoire et recherches des antiquités de la ville de Paris d’Henri Sauval par Emmanuel Château.

Page 14: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XII. #MarginaliaMonday sur Twitter

L’annotation marginale dans les ouvrages fait l’objet d’un hashtag sur twitter : tous les lundis, les amateurs de

livres anciens postent leurs trouvailles avec le hashtag #MarginaliaMonday (capture d’écran au 2 septembre

2014)

Page 15: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XIII

Planche XIII. Annotated Books Online

Deux captures d’Annotated Books Online

JAHJAH Marc, « Annotated Books Online : découvrir les annotations des premiers siècles de l’imprimerie », carnet de

recherche, Marginalia - Savoir(s) d’annotateurs, 31 janvier 2013. URL : http://marginalia.hypotheses.org/21562

NETHERLANDS ORGANIZATION FOR SCIENTIFIC RESEARCH, Annotated Books Online | A digital archive of early modern annotated

books, [s.d.]. URL : http://www.annotatedbooksonline.com/ .

Page 16: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XIV. Piganiol de la Force, La Description de Paris illustré par Gabriel de

Saint-Aubin

Pages extraites de La Description de Paris en 8 volumes par Piganiol de la Force (1742), illustrées par Gabriel de

Saint-Aubin entre 1770 et 1779. Ville de Paris, Petit Palais.

Gabriel de Saint-Aubin (1724-1780) a, tout au long de sa vie, enrichi les marges d’ouvrages imprimés de milliers

d’images. Si ses catalogues de vente illustrés sont très connus, on sait moins qu’il a également annoté les pages

de deux guides de Paris : La Description de Paris en 8 volumes par Piganiol de la Force (1742) et la Description

historique des curiosités(1763) de l'Eglise de Paris. Les ouvrages contiennent des dessins et des corrections :

Gabriel de Saint-Aubin relève les erreurs des auteurs, signale les bâtiments détruits ou nouvellement construits.

Ces livres sont conservés au Petit Palais (musée des Beaux-Arts de la ville de Paris) et à la Bibliothèque

historique de la ville de Paris mais ne sont pas numérisés. Voir : MUSEE DU LOUVRE et FRICK COLLECTION, Gabriel de

Saint-Aubin, 1724-1780, Paris, The Musée du Louvre éd, 2007, 319 p. et AUBERT Marcel, « Un guide de Notre-

Dame, illustré par Gabriel de Saint-Aubin », Société d’iconographie parisienne, vol. 3, 1911, p. 1-12. URL :

http://gallica.bnf.fr/ark:/12148/bpt6k5446112g/f46.image.

Page 17: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XV

Planche XV. Piganiol de la Force illustré par Gabriel de Saint-Aubin (suite)

Pages extraites de La Description de Paris en 8 volumes par Piganiol de la Force (1742), illustrées par Gabriel de

Saint-Aubin entre 1770 et 1779. Ville de Paris, Petit Palais.

Page 18: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XVI. Exemples d’annotations : pratiques de lecture contemporaines

Henrik Berggren, Catherinas Ulysses, licence CC BY-NC-SA 2.0

Annotation anonyme, collectée par Marc Jahjah sur les réseaux sociaux

Page 19: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XVII

Planche XVII. Exemples d’annotations : la collecte de Marc Jahjah

Dans le cadre de sa thèse de doctorat, Marc Jahjah a réalisé une veille des images d’annotations postées sur les

réseaux sociaux et les a collecté dans un tableau Pinterest (capture d’écran en haut). En dessous deux exemples

représentatifs : annotation numérique sur un travail d’étudiant en cours d’élaboration (probablement les

annexes d’un mémoire) et mise en scène d’une lecture outillée (livre, annotations marginales, prise de notes sur

indépendante et restitution par un compte rendu saisi dans un traitement de texte).

Voir son compte-rendu : JAHJAH Marc, « Images d’annotations postées sur les réseaux (I) : la pile et le tas, le

poisson et la baleine », carnet de recherche, Marginalia - Savoir(s) d’annotateurs, 5 novembre 2012. URL :

http://marginalia.hypotheses.org/20887 . Consulté le 30 mai 2014.

Tableau pinterest : JAHJAH Marc, « Collecte d’annotations postées sur Instagram par Marc Jahjah - sur le tableau

virtuel Pinterest », Pinterest, [s.d.]. URL : http://www.pinterest.com/sobookonline/collecte-d-annotations-

postees-sur-instagram/ . Consulté le 30 mai 2014.

Page 20: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XVIII. Cabanac, Comparaison des systèmes d’annotation (1989-2008)

« Comparaison des systèmes d’annotation », in CABANAC Guillaume, Fédération et amélioration des activités

documentaires par la pratique d’annotation collective, Thèse de doctorat, Toulouse, Université Paul Sabatier,

2008, p. 36-37. URL : http://tel.archives-ouvertes.fr/tel-00344947.

Page 21: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XIX

Planche XIX. Cabanac, Comparaison des systèmes d’annotation (1989-2008), suite.

« Comparaison des systèmes d’annotation », in CABANAC Guillaume, Fédération et amélioration des activités

documentaires par la pratique d’annotation collective, Thèse de doctorat, Toulouse, Université Paul Sabatier,

2008, p. 36-37. URL : http://tel.archives-ouvertes.fr/tel-00344947

Page 22: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XX. Cabanac, Comparaison des systèmes d’annotation (légende)

« Comparaison des systèmes d’annotation », in CABANAC Guillaume, Fédération et amélioration des activités

documentaires par la pratique d’annotation collective, Thèse de doctorat, Toulouse, Université Paul Sabatier,

2008, p. 34-35. URL : http://tel.archives-ouvertes.fr/tel-00344947.

Page 23: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XXI

Planche XXI. Cabanac, Cycle de vie du document

« Les six activités du cycles de vie du document », in CABANAC Guillaume, Fédération et amélioration des activités

documentaires par la pratique d’annotation collective, Thèse de doctorat, Toulouse, Université Paul Sabatier,

2008, p. 8. URL : http://tel.archives-ouvertes.fr/tel-00344947.

Page 24: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XXII. ComMentor et iMarkup

Capture d’écran de ComMentor, in CABANAC Guillaume, Annotation de ressources électroniques sur le Web :

formes et usages., Rapport de Master 2 Recherche, Toulouse, IRIT – Université Paul Sabatier, 2005, p. 37. URL :

ftp://ftp.irit.fr/IRIT/SIG/2005_M2R_C.pdf

Capture d’écran de iMarkup, in CABANAC Guillaume, Annotation de ressources électroniques sur le Web : formes

et usages., Rapport de Master 2 Recherche, Toulouse, IRIT – Université Paul Sabatier, 2005, p. 37-38. URL :

ftp://ftp.irit.fr/IRIT/SIG/2005_M2R_C.pdf

Page 25: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XXIII

Planche XXIII. CritLink

Figure tirée de YEE Ka-Ping, CritLink: Advanced Hyperlinks Enable Public Annotation on the Web, 2002. URL :

http://zesty.ca/crit/yee-crit-cscw2002-demo.pdf .

Page 26: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XXIV. Annotea

Trois captures d’écran d’Annotea trouvées sur google.

Page 27: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XXV

Planche XXV. ThirdVoice

Captures d’écran de ThirdVoice trouvé sur http://www.jerf.org/writings/communicationEthics/node10.html

Page 28: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XXVI. GoogleSidewiki

Capture d’écran de GoogleSidewiki dans CHITU Alex, « Google Sidewiki », Google Operating System, unofficial

news and tips about Google, 23 septembre 2009. URL : http://googlesystem.blogspot.fr/2009/09/google-

sidewiki.html

Page 29: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XXVII

Planche XXVII. Application de lecture sociale : Copia

Capture d’écran de l’application Copia, dans JAHJAH Marc, « Annotation sur Copia, reconnaissons la valeur des

humeurs des lecteurs », carnet de recherche, So Book online, juin 2012. URL :

https://web.archive.org/web/20130522080835/http://www.sobookonline.fr/annotation/numerique/annotatio

ns-sur-copia-12-reconnaissons-la-valeur-des-humeurs-des-lecteurs/

Page 30: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XXVIII. Application pédagogique d’annotation : Co-ment

Démo d’un usage pédagogique, ici sur le texte de Gargantua, avec le logiciel Co-ment. http://www.co-

ment.com/fr/voir/

Page 31: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XXIX

Planche XXIX. Annotation et classement de ressources numériques : Pearltrees.

Nouvelle interface de Pearltrees, un service de sauvegarde et d’organisation de liens .

Ancienne interface de Peartrees.

Page 32: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XXX. Annotation de flux vidéo et son : SoundCloud et Lignes de temps.

Capture d’écran de SoundCloud. Exemple d’annotation localisé sur un flux sonore.

Capture d’écran du logiciel lignes de temps. INSTITUT DE LA RECHERCHE ET DE L’INNOVATION, « Lignes de temps | IRI »,

Institut de recherche et d’innovation, décembre 2009. URL : http://www.iri.centrepompidou.fr/outils/lignes-de-

temps/

Page 33: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XXXI

Planche XXXI. Modèle Open Annotation : Baseline Model

Modèle « classique » d’une annotation in OPEN ANNOTATION COMMUNITY GROUP, SANDERSON, Robert et CICCARESE,

Paolo et VAN DE SOMPEL, Herbert, (dir.), « Open Annotation Data Model, Community Draft », Open Annotation,

février 2013. URL : http://www.openannotation.org/spec/core/

Exemple tiré de HASLHOFER Bernhard, The Open Annotation Collaboration (OAC) Model, Diaporama présenté à

MMWeb 2011, Graz. URL : http://fr.slideshare.net/bhaslhofer/the-open-annotation-collaboration-oac-model

Page 34: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XXXII. Modèle Open Annotation : Typage

Modèle du typage in OPEN ANNOTATION COMMUNITY GROUP, SANDERSON, Robert et CICCARESE, Paolo et VAN DE

SOMPEL, Herbert, (dir.), « Open Annotation Data Model, Community Draft », Open Annotation, février 2013.

URL : http://www.openannotation.org/spec/core/

Page 35: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XXXIII

Planche XXXIII. Modèle Open Annotation : Tag

Page 36: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XXXIV. Modèle Open Annotation : Target et Body

Modèle d’une annotation sans <body> in OPEN ANNOTATION COMMUNITY GROUP, SANDERSON, Robert et CICCARESE,

Paolo et VAN DE SOMPEL, Herbert, (dir.), « Open Annotation Data Model, Community Draft », Open Annotation,

février 2013. URL : http://www.openannotation.org/spec/core/

Modèle d’une annotation à multiple <body> et <target> in OPEN ANNOTATION COMMUNITY GROUP, SANDERSON,

Robert et CICCARESE, Paolo et VAN DE SOMPEL, Herbert, (dir.), « Open Annotation Data Model, Community Draft »,

Open Annotation, février 2013. URL : http://www.openannotation.org/spec/core/

Page 37: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XXXV

Planche XXXV. Modèle Open Annotation : Agent

Modèle « Agent » in OPEN ANNOTATION COMMUNITY GROUP, SANDERSON, Robert et CICCARESE, Paolo et VAN DE

SOMPEL, Herbert, (dir.), « Open Annotation Data Model, Community Draft », Open Annotation, février 2013.

URL : http://www.openannotation.org/spec/core/

Page 38: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XXXVI. Modèle Open Annotation : Provenance

Modèle « Provenance » in OPEN ANNOTATION COMMUNITY GROUP, SANDERSON, Robert et CICCARESE, Paolo et VAN DE

SOMPEL, Herbert, (dir.), « Open Annotation Data Model, Community Draft », Open Annotation, février 2013.

URL : http://www.openannotation.org/spec/core/

Page 39: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XXXVII

Planche XXXVII. Modèle Open Annotation : Motivation

Modèle « Motivation » in OPEN ANNOTATION COMMUNITY GROUP, SANDERSON, Robert et CICCARESE, Paolo et VAN DE

SOMPEL, Herbert, (dir.), « Open Annotation Data Model, Community Draft », Open Annotation, février 2013.

URL : http://www.openannotation.org/spec/core/

Page 40: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XXXVIII. Modèle Open Annotation : spécification de sérialisation en JSON-LD

Open Annotation JSON-LD Context Specification. OPEN ANNOTATION COMMUNITY GROUP, SANDERSON, Robert et

CICCARESE, Paolo et VAN DE SOMPEL, Herbert, (dir.), « Module : publication », Open Annotation Data Model, février

2013. URL : http://www.openannotation.org/spec/core/publishing.html

Page 41: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XXXIX

Planche XXXIX. Modèle Open Annotation : spécification de sérialisation en JSON-LD

Page 42: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XL. Modèle Open Annotation : FragmentSelector

Page 43: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XLI

Planche XLI. Modèle Open Annotation : Sélection par comptage dans une chaine de

caractères

Page 44: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XLII. Outils étudiés dans le cadre du Benchmarking

Logo des outils étudiés.

Page 45: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XLIII

Planche XLIII. Les répertoires DIRT et TAPoR

Capture d’écran : présentation d’Annotation Studio sur les répertoires DIRT et TAPoR.

Page 46: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XLIV. Annotator (1)

Capture d’écran : test d’Annotator sur Gallica à l’aide du bookmarklet AnnotateIt

Structure d’Annotator

Page 47: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XLV

Planche XLV. Annotator (2)

Exemple de sérialisation d’une annotation en JSON

Page 48: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XLVI. Annotation Studio (1)

Test de l’outil d’annotation sur un texte de Conan Doyle.

Tableau de bord permettant de naviguer au sein des documents, des annotations et des groupes.

Page 49: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XLVII

Planche XLVII. Annotation Studio (2)

Captures d’écran promotionnelles issues du site web.

Page 50: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XLVIII. Domeo

Capture d’écran d’une implémentation de Domeo

Page 51: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche XLIX

Planche XLIX. Domeo (2)

Architecture de Domeo

Page 52: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche L. Annotopia (1)

Présentation d’une implémentation d’Annotopia

Page 53: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche LI

Planche LI. Annotopia (2)

Architecture de stockage d’Annotopia

Architecture de l’outil

AnnotopiaSérialisation des annotations en JSON,

selon le modèle et les vocabulaires définis par

Open Annotation

Page 54: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche LII. Pundit (1)

Capture de démonstration de Pundit

Page 55: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche LIII

Planche LIII. Pundit (2)

Illustration de la relation entre les éléments

Architecture de Pundit

Page 56: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche LIV. Pundit (3)

Architecture du système Pundit

Page 57: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche LV

Planche LV. Textus (1)

Capture d’écran d’Open Philosophie, où a été testé Textus

Capture d’une démo de Textus

Page 58: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche LVI. Textus (2)

Architecture de Textus

Sérialisation d’une annotation en JSON

Page 59: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche LVII

Planche LVII. Synthèse du Benchmarking (1)

Vue d’ensemble des outils : complexité des usages et de l’architecture

Vue d’ensemble des outils selon 7 critères.

0

1

2

3

4

5

0 1 2 3 4 5

Co

mp

lexi

té d

e l'u

sage

et

des

fo

nct

ion

nal

ités

Complexité de l'architecture

Annotator

Annotation Studio

Annotopia

Domeo

Pundit

Textus

0 1 2 3 4 5

Etendue des fonctionnalités d'annotation

Complexité des référentiels et vocabulaires

Gestion des droits

Dynamisme de la communauté

Qualité de la documentation

Complexité de l'architecture

Type de pointage

Annotator

Annotation Studio

Annotopia

Domeo

Pundit

Textus

Page 60: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche LVIII. Synthèse du benchmarking (2)

0

2

4

6

Etendue des fonctionnalités d'annotation

Complexité des référentiels et vocabulaires

Gestion des droits

Dynamisme de la communauté

Qualité de la documentation

Complexité de l'architecture

Type de pointage

Annotation Studio

0

2

4

6

Etendue des fonctionnalités d'annotation

Complexité des référentiels et vocabulaires

Gestion des droits

Dynamisme de la communauté

Qualité de la documentation

Complexité de l'architecture

Type de pointage

Annotator

0

2

4

6

Etendue des fonctionnalités d'annotation

Complexité des référentiels et vocabulaires

Gestion des droits

Dynamisme de la communauté

Qualité de la documentation

Complexité de l'architecture

Type de pointage

Annotopia

Page 61: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche LIX

Planche LIX. Synthèse du benchmarking (3)

0

2

4

6

Etendue des fonctionnalités d'annotation

Complexité des référentiels et vocabulaires

Gestion des droits

Dynamisme de la communauté

Qualité de la documentation

Complexité de l'architecture

Type de pointage

Domeo

0

2

4

6

Etendue des fonctionnalités d'annotation

Complexité des référentiels et vocabulaires

Gestion des droits

Dynamisme de la communauté

Qualité de la documentation

Complexité de l'architecture

Type de pointage

Pundit

0

2

4

6

Etendue des fonctionnalités d'annotation

Complexité des référentiels et vocabulaires

Gestion des droits

Dynamisme de la communauté

Qualité de la documentation

Complexité de l'architecture

Type de pointage

Textus

Page 62: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche LX. Le client annotator : code source de la page HTML de démonstration

Code source de la page de démonstration.

Page 63: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche LXI

Planche LXI. Le client annotator : affichage de la page de démonstration

Utilisation du client annotator : affichage de la page de démonstration -

http://pecccadille.alwaysdata.net/BriceSaintGervais.html

Page 64: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche LXII. Stockage des annotations sur le magasin Annotator

Affichage des annotations sérialisée en RDF stockées dans le magasin Annotator installé sur la machine.

Page 65: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche LXIII

Planche LXIII. Le client Pundit : démonstration

Démonstration du client Pundit : code source et page HTML.

Page 66: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche LXIV. Structure en couche (texte, TEI et annotation)

Structure de la TEI (schéma provenant d’une présentation d’Emmanuel Château)

Page 67: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche LXV

Planche LXV. Annoter avec Annotator : commentaire et images

Deux annotations réalisées avec Annotator

Page 68: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche LXVI. Les images dans le projet Digital Mellini

Mockup de la plateforme Digital Mellini

Page 69: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche LXVII

Planche LXVII. Les images dans le projet Van Gogh Letters

Cap

ture

d’é

cran

de

la p

late

form

e V

an G

ogh

Let

ters

Page 70: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche LXVIII. Carte du Paris littéraire et Historypin

Carte du Paris littéraire (créée en juillet 2012 et mise

à jour en octobre 2013) : http://goo.gl/maps/7O7B

Capture d’écran de l’application HistoryPin

Page 71: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche LXIX

Planche LXIX. Locating London

Cap

ture

d’é

cran

du

sit

e L

oca

tin

g Lo

nd

on

’s P

ast.

Page 72: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche LXX. Projet ALPAGE

Cap

ture

d’é

cran

du

sit

e A

LPA

GE

Page 73: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche LXXI

Planche LXXI. JUXTA visualisation

Utilisation du logiciel Juxta pour la visualisation des variantes d’un texte (démonstration disponible sur le site de

l’outil http://juxtacommons.org/shares/ym0F00/heatmap?base=1700&top=0.14669421487603307 ).

Page 74: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche LXXII. Wittgenstein Source

Interface du projet WittgensteinSource http://www.wittgensteinsource.org/

Page 75: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche LXXIII

Planche LXXIII. Correspondance Delacroix. Une entrée de l’index Nominum

http://www.correspondance-delacroix.fr/outils-pedagogiques/index-des-

correspondants/bdd/correspondant/28

Page 76: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche LXXIV. Entrée par nom dans Sandrart.net

Page 77: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Planche LXXV

Planche LXXV. Visualisation du Linked Open Data en 2011

Page 78: les outils d'annotation et l'édition scientifique de corpus textuels - planches
Page 79: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Tables des planches

Tables des planches

Planche I. Evolution de la production des guides de Paris ....................................................................................... I

Planche II. Corrozet, les Antiquitez, histoire et singularitez de Paris (1550) ............................................................ II

Planche III. Du Breul, Le Théâtre des antiquitez de Paris (1639) ............................................................................. III

Planche IV. Brice, Description nouvelle de ce qu'il y a de plus remarquable dans la ville de Paris (1684) ............. IV

Planche V. Brice, Description de la ville de Paris (1752) .......................................................................................... V

Planche VI. Dechuyes, La Guide de Paris (1647) ..................................................................................................... VI

Planche VII. Jeze, Etat ou tableau de la ville de Paris (1765) ................................................................................. VII

Planche VIII. Hurtaut et Magny, Dictionnaire historique de la ville de Paris (1779) .............................................. VIII

Planche IX. Sauval, Histoire et recherches des antiquités de la ville de Paris (1724) ............................................... IX

Planche X. Tableau analytique de la réédition de la Description de Paris de Germain Brice par Michel Fleury ...... X

Planche XI. Exemple d’encodage en TEI ................................................................................................................. XI

Planche XII. #MarginaliaMonday sur Twitter ........................................................................................................ XII

Planche XIII. Annotated Books Online .................................................................................................................. XIII

Planche XIV. Piganiol de la Force, La Description de Paris illustré par Gabriel de Saint-Aubin ............................. XIV

Planche XV. Piganiol de la Force illustré par Gabriel de Saint-Aubin (suite) .......................................................... XV

Planche XVI. Exemples d’annotations : pratiques de lecture contemporaines .................................................... XVI

Planche XVII. Exemples d’annotations : la collecte de Marc Jahjah .................................................................... XVII

Planche XVIII. Cabanac, Comparaison des systèmes d’annotation (1989-2008) ................................................ XVIII

Planche XIX. Cabanac, Comparaison des systèmes d’annotation (1989-2008), suite. .......................................... XIX

Planche XX. Cabanac, Comparaison des systèmes d’annotation (légende) ........................................................... XX

Planche XXI. Cabanac, Cycle de vie du document ................................................................................................ XXI

Planche XXII. ComMentor et iMarkup ................................................................................................................. XXII

Planche XXIII. CritLink ......................................................................................................................................... XXIII

Planche XXIV. Annotea ....................................................................................................................................... XXIV

Planche XXV. ThirdVoice...................................................................................................................................... XXV

Planche XXVI. GoogleSidewiki ............................................................................................................................ XXVI

Planche XXVII. Application de lecture sociale : Copia ........................................................................................ XXVII

Planche XXVIII. Application pédagogique d’annotation : Co-ment ................................................................... XXVIII

Planche XXIX. Annotation et classement de ressources numériques : Pearltrees. ............................................. XXIX

Planche XXX. Annotation de flux vidéo et son : SoundCloud et Lignes de temps. ............................................... XXX

Planche XXXI. Modèle Open Annotation : Baseline Model ................................................................................. XXXI

Planche XXXII. Modèle Open Annotation : Typage ............................................................................................ XXXII

Planche XXXIII. Modèle Open Annotation : Tag ................................................................................................ XXXIII

Planche XXXIV. Modèle Open Annotation : Target et Body .............................................................................. XXXIV

Planche XXXV. Modèle Open Annotation : Agent.............................................................................................. XXXV

Planche XXXVI. Modèle Open Annotation : Provenance .................................................................................. XXXVI

Planche XXXVII. Modèle Open Annotation : Motivation ................................................................................. XXXVII

Planche XXXVIII. Modèle Open Annotation : spécification de sérialisation en JSON-LD ................................. XXXVIII

Planche XXXIX. Modèle Open Annotation : spécification de sérialisation en JSON-LD ..................................... XXXIX

Planche XL. Modèle Open Annotation : FragmentSelector ................................................................................... XL

Planche XLI. Modèle Open Annotation : Sélection par comptage dans une chaine de caractères ....................... XLI

Planche XLII. Outils étudiés dans le cadre du Benchmarking ............................................................................... XLII

Planche XLIII. Les répertoires DIRT et TAPoR ...................................................................................................... XLIII

Page 80: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Annexes

Planche XLIV. Annotator (1) ............................................................................................................................... XLIV

Planche XLV. Annotator (2) ................................................................................................................................. XLV

Planche XLVI. Annotation Studio (1) ................................................................................................................... XLVI

Planche XLVII. Annotation Studio (2) ................................................................................................................. XLVII

Planche XLVIII. Domeo ..................................................................................................................................... XLVIII

Planche XLIX. Domeo (2) .................................................................................................................................... XLIX

Planche L. Annotopia (1) ......................................................................................................................................... L

Planche LI. Annotopia (2) ....................................................................................................................................... LI

Planche LII. Pundit (1) ............................................................................................................................................ LII

Planche LIII. Pundit (2) .......................................................................................................................................... LIII

Planche LIV. Pundit (3) ......................................................................................................................................... LIV

Planche LV. Textus (1) ........................................................................................................................................... LV

Planche LVI. Textus (2) ......................................................................................................................................... LVI

Planche LVII. Synthèse du Benchmarking (1) ....................................................................................................... LVII

Planche LVIII. Synthèse du benchmarking (2) ..................................................................................................... LVIII

Planche LIX. Synthèse du benchmarking (3) ......................................................................................................... LIX

Planche LX. Le client annotator : code source de la page HTML de démonstration .............................................. LX

Planche LXI. Le client annotator : affichage de la page de démonstration ........................................................... LXI

Planche LXII. Stockage des annotations sur le magasin Annotator ..................................................................... LXII

Planche LXIII. Le client Pundit : démonstration .................................................................................................. LXIII

Planche LXIV. Structure en couche (texte, TEI et annotation) ............................................................................ LXIV

Planche LXV. Annoter avec Annotator : commentaire et images ........................................................................ LXV

Planche LXVI. Les images dans le projet Digital Mellini ...................................................................................... LXVI

Planche LXVII. Les images dans le projet Van Gogh Letters ............................................................................... LXVII

Planche LXVIII. Carte du Paris littéraire et Historypin ....................................................................................... LXVIII

Planche LXIX. Locating London ........................................................................................................................... LXIX

Planche LXX. Projet ALPAGE ................................................................................................................................ LXX

Planche LXXI. JUXTA visualisation ....................................................................................................................... LXXI

Planche LXXII. Wittgenstein Source ................................................................................................................... LXXII

Planche LXXIII. Correspondance Delacroix. Une entrée de l’index Nominum .................................................. LXXIII

Planche LXXIV. Entrée par nom dans Sandrart.net ........................................................................................... LXXIV

Planche LXXV. Visualisation du Linked Open Data en 2011 ............................................................................... LXXV

Page 81: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Annexes en ligne

Les livrables sont consultables à l’adresse suivante : https://github.com/guidesDeParis/annotation

Répertoire de travail sur l'annotation du corpus (stage de Johanna). Il contient l'ensemble des

documents de travail produits durant le stage et est organisé comme il suit :

Documents livrables

Le dossier fiches contient des fiches de travail élaborées au cours du stage. Les fiches sont

numérotées de la façon suivante :

o 1_ : notes à propos des guides

o 2_ : notes à propos de l'annotation

o 3_ : notes à propos des critères d'évaluation

o 4_ : notes à propos de l'utilisation possible de l'annotation dans le cadre du projet "Les guides de

Paris"

o 5_ : notes à propos des tests de Pundit et d'Annotator

o 9_ : fiches diverses sur des sujets annexes au stage

Le dossier annexes contient :

o Le glossaire

o La liste des outils étudiés

o La liste des projets étudiés

o Les tableaux comparatifs des différents outils benchmarké

o Un compte-rendu du projet Mellini, publié premièrement sur mon blog Orion en aéroplane.

Documents de travail

Le dossier contient 4 fichiers intitulés crStage2014-mm-jj créés par Emmanuel lors de nos 4 réunions

"point étape" en avril, mai et juillet. Le fichier planning transcrit le planning fixé au début du stage.

Le dossier journalDeBord contient les notes prises à mesure du stage.

Le dossier installation contient les notes prises au moment de l'installation de Pundit et d'Annotator

Le dossier "images" contient l'intégralité des images qui illustrent les différents fichiers contenus dans ce

dossier de travail.

Le dossier mémoire contient les documents produits au moment de la rédaction du mémoire.

Page 82: les outils d'annotation et l'édition scientifique de corpus textuels - planches
Page 83: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Annexe : tableau comparatif des 6 outils

Nom de l'outil

Fonctionnalités

Standards

Annotation libre

/structurée Typage des annotations

Référentiels Gestion droit/accès

Annotation des images

Gestion des entrées biblio

Reconnaissance des entitées

nommées Tag / Référentiel

Possibilité de faire évoluer les référentiels

Gestion des conflits

Gestion des droits

Gestion des accès

Process de validation

Annotator libre oui, via un plugin tag - - oui oui ?

oui - plugin dédié non non OA

Annotation Studio libre tag - - oui oui ?

oui, possibilité de charger des images dans les ressources non non OA

Annotopia libre ou structurée surement?

vocabulaires contrôlés ? ? oui oui oui oui - spécifique oui oui OA

Domeo libre ou structurée Oui

vocabulaires contrôlés ? ? oui oui ? oui oui oui OA

Pundit libre ou structurée oui

vocabulaires contrôlés oui

? non pas encore oui oui non oui non oui OA

Textus libre

pas documenté, ne semble pas

taggage désiré dans les cas d'utilisation, indiqué comme implémenté mais pas clairement exprimé dans la doc - - oui oui

cas d'utilisation désiré : évaluation des annotations. Fonctionnalité non documentée non

désiré dans les cas d'utilisation mais pas documenté non OA

LEGENDE

Information documentée

Information non documentée

Page 84: les outils d'annotation et l'édition scientifique de corpus textuels - planches

Annexes

Nom de l'outil

Acteur projet Licence Technique

Porteur/ Financeme

nt

Lancement/ dernière

maj

Communauté

Qualité de la

documentation Type

Gratuit Payant Architecture

Langage Ressources à annoter Annotation Référentiels Technique

s d'ancrage/

système de

localisation Client

Serveur Format

Stockage

Format Stockage

Format

Stockage

Annotator OKF

Actif récemment 5 4

MIT Open source Gratuit briques Js/jquerry

python 2.6 ou superieur HTML aucun. Json

API Rest/ serveur propre ou sur Annotateit - - XPATH

Annotation Studio

Hyperstudio MIT univ

opérationnel 2 2

Open source GPL 2 Gratuit briques

HTML/CSS/js

Ruby on Rails Postgre SQL

encapsulation d'un texte versé doc ou txt

Géré par Annotation Studio Json ?

Api Rest / Mongo DB - - XPATH

Annotopia

Massachussets Hospital En cours - -

Apache licence v. 2.0 ? briques

Api ouverte utopia annotator, js, domeo

Java (Grails)

HTML et PDF ?

Json LD

Triplestore Jena / virtuoso

OWL / Skos

Externe URI?

Domeo

Massachussets Hospital

Gros redécoupage courant 2013, va devenir client de Annotopia 2 2

Open source? ? ? ? ?

XML / HTML ? ? ? ? ? ?

Pundit

Semlib (programme UE) + Net7 privé

En cours. Déjà des versions opérationnelles 2

4 Api formellement bien décrite / d'autres parties plus floues

Open source CC 3.0 AGPL 3.0

Gratuit sauf derniers développements pour le serveur

briques ; client, bookmarklet, client d'annotation, serveur de stockage, gestionnaire de référentiel, gestionnaire d'annotation Js Java

HTML/Image/segment RDFa exprimant des id XML (ancres dans le HTML)

font copie des fragments

Graph RDF

Serveur triplestore Sesame / API REST

Référentiels simples : SKOS/ RDFs?

Gestion Korbo /API REST

URI X pointer

Textus OKF En cours? 2

2 beaucoup de chose mais pas mise à jour

Mit Licence Gratuit briques Js / HTML

Node.js / Elastic Search Json

Dans l'outil d'annotation Json

URL puis comptage des caractères

Page 85: les outils d'annotation et l'édition scientifique de corpus textuels - planches