meta archivesetatdel art
DESCRIPTION
présentation des normes de métadonnées utilisables dans le cadre de projets de conservation numérique ou d'archivage électroniqueTRANSCRIPT
Pascal Romain CC-By-Sa 1
● Le modèle FRBR● MARC● MODS
Métadonnées archivistiques : état de l'art
Description, pérennisation, interopérabilité
Pascal Romain CC-By-Sa 29/03/2011 journées Arkhéia
Pascal Romain CC-By-Sa 29/03/2011 2 / 29
μετάMétadonnées archivistiques : état de l'art
Plan
Modèles conceptuelsPaquets d'information
Contextualisation
Pascal Romain CC-By-Sa 29/03/2011 3 / 29
μετάMétadonnées archivistiques : état de l'art
Modèles conceptuels > définition
Métadonnée : Une métadonnée est une donnée servant à définir ou décrire une autre donnée quel que soit son support (papier ou électronique).Porteuse d'information sur le contexte, le sens et la description de la ressource informationnelle portée par la donnée brute.
OAIS : (open archival information system) système ouvert d'information archivistique. Modèle conceptuel décrivant les entités et leurs relations organisant le cycle de vie des données en vue de leur conservation à long terme.
RDF : (resource description framework) cadre de description de ressources RDF est un outil d'unification conceptuelle et technique de la métadonnée. C'est un langage de métadonnées qui a pour but d'exprimer de façon standard les métadonnées sous forme de propriétés des ressources.
Pascal Romain CC-By-Sa 29/03/2011 4 / 29
μετά
OAIS
RDF
Métadonnées
Modèles conceptuels > définition
Métadonnées archivistiques : état de l'art
Pascal Romain CC-By-Sa 29/03/2011 5 / 29
μετάMétadonnées archivistiques : état de l'art
Modèles conceptuels > OAISsystème ouvert d'archivage
Pascal Romain creative commons 29/03/2011 6 / 29
μετά
RDF : un modèle conceptuel de données basé sur la notion de triplet (Ressource à décrire – propriété applicable à l'objet – valeur de la propriété)
base de données relationnellesPar exemple Oracle ou MySQL
base de données hiérarchiquePar exemple fichiers XML
base de données en graphePar exemple RDF
Métadonnées archivistiques : état de l'art
Modèles conceptuels > RDFCadre de description de ressources
prédicatprédicat
prédicatprédicat
prédicatprédicat
objetobjet
sujetsujet
sujetsujet
sujetsujet
sujetsujet
objetobjet
prédicatprédicatobjetobjet
objetobjet
objetobjet
objetobjet
objetobjet
objetobjet
objetobjetsujetsujet
objetobjetobjetobjet
Pascal Romain CC-By-Sa 29/03/2011 7 / 29
μετάMétadonnées archivistiques : état de l'art
Plan
Modèles conceptuelsPaquets d'information
Contextualisation
Pascal Romain CC-By-Sa 29/03/2011 8 / 29
μετάMétadonnées archivistiques : état de l'art
Paquets d'information > SIP et AIPPaquet d'information à verser ou à archiver
versementversement
stockagestockage
gestiongestion
La donnée à prendre en charge est décrite par des propriétés:- producteur- identifiant- contenu- ...
Intégrée au système d'archivage elle dispose d'attributs:- date de création- localisation- droits d'accès- description- …
Elle est décrite au sein d'un cadre de description contextuel qui doit garantir son intelligibilité, son intégrité et son interopérabilité informationnelle
Pascal Romain CC-By-Sa 29/03/2011 9 / 29
μετάMétadonnées archivistiques : état de l'art
Modèle conceptuel > OAIS > SIPPaquet d'information à verser
versementversement
stockagestockage
gestiongestion
Plusieurs schémas de données décrits dans le format XML permettent de décrire les propriétés et les attributs des paquets d'information pris en charge par le système d'archivage.
Le schéma SEDA (Schéma d’Échange des Données d'Archivage) permet de décrire les relations entre le service versant et le service d'archives au cours des opérations de transfert, de communication, de modification, d'élimination ou de restitution d’archives.
Le schéma METS (Metadata Extensible Transport System) vise à fournir un méta-modèle pour l'encapsulation d'autres formats de métadonnées. Il peut servir de carte d'identité et de suivi du versement au stockage
Le schéma PREMIS (Preservation Metadata: Implementation Strategies) répond au besoin de pérennisation de l'information numérique et de conservation du cycle de vie des données (import dans un entrepôt de donnée, migration, gestion d'intégrité, liens entre différentes représentations d'un même document).
Plusieurs schémas de données décrits dans le format XML permettent de décrire les propriétés et les attributs des paquets d'information pris en charge par le système d'archivage.
Le schéma SEDA (Schéma d’Échange des Données d'Archivage) permet de décrire les relations entre le service versant et le service d'archives au cours des opérations de transfert, de communication, de modification, d'élimination ou de restitution d’archives.
Le schéma METS (Metadata Extensible Transport System) vise à fournir un méta-modèle pour l'encapsulation d'autres formats de métadonnées. Il peut servir de carte d'identité et de suivi du versement au stockage
Le schéma PREMIS (Preservation Metadata: Implementation Strategies) répond au besoin de pérennisation de l'information numérique et de conservation du cycle de vie des données (import dans un entrepôt de donnée, migration, gestion d'intégrité, liens entre différentes représentations d'un même document).
Pascal Romain CC-By-Sa 29/03/2011 10 / 29
μετάMétadonnées archivistiques : état de l'art
Paquets d'information > SIPPaquet d'information à verser: SEDA
Le schéma SEDA permet d'automatiser les procédure d'échange d'information en décrivant les règles contractuelles qui régissent le versement et la prise en charge d'un paquet d'information. Les schémas SEDA décrivent les contraintes (format, support, identification) et fournissent un historique des opérations effectuées (transfert, réception, destruction, modification, etc...)La grammaire XML permet de définir des règles formelles vérifiables par les machines (est égal à, ne peut pas être différent de, n'existe qu'en un seul exemplaire, provient de, etc...)
ObjetObjetDescriptionDescription
ArchiveArchive
VersementVersement
ServiceService
ArchiveArchive
Pascal Romain CC-By-Sa 29/03/2011 11 / 29
μετάMétadonnées archivistiques : état de l'art
Paquets d'information > SIP et AIPPaquet d'information à verser ou à archiver: METS
Le schéma METS vise à fournir un méta-modèle pour l'encapsulation d'autres formats de métadonnées. Ce schéma XML composé de 7 section est extrêmement flexible. Il permet notamment de représenter l'information sous forme de carte de structure et s'implémenter le modèle conceptuel OAIS. Maintenu par la Bibliothèque du Congrès, il constitue un format pivot entre la logique de diffusion et celle de conservation de l'information.
FichierFichierDescriptionDescription
ArchiveArchive
structurestructure
DroitsDroits
ArchiveArchive
Pascal Romain CC-By-Sa 29/03/2011 12 / 29
μετάMétadonnées archivistiques : état de l'art
Paquets d'information > SIP et AIPPaquet d'information à verser ou à archiver: METS
METS : le modèle de données
Basé sur un système de liens internes entre les différentes sections, il peut également être utilisé pour faire référence à des informations stockées dans d'autres fichiers XML.Il est notamment utilisé lorsque l'information conservée dans le système d'archivage dispose de plusieurs représentations (PDF/A, OCR ALTO, jpeg, Tiff) ou que l'on souhaite décrire l'information avec une granularité plus fine (article, partie d'article, pièce)
Pascal Romain CC-By-Sa 29/03/2011 13 / 29
μετάMétadonnées archivistiques : état de l'art
METS : exemple de structuration :
- un fichier METS par article ou monographie
- métadonnées descriptives en EAD, SEDA ou RDF
- métadonnées administratives en MIX et PREMIS
- carte de structure physique pour les fichiers images et les éventuels fichiers texte
- carte de structure logique permettant de décrire des parties d'article
Paquets d'information > SIP et AIPPaquet d'information à verser ou à archiver: METS
Pascal Romain CC-By-Sa 29/03/2011 14 / 29
μετά
Le modèle de données PREMIS
Entités intellectuelles
Objets
DéclarationDe
droits
Agents
Evénements
exemple
Métadonnées archivistiques : état de l'art
Paquets d'information > AIPPaquet d'information à archiver: PREMIS
Pascal Romain CC-By-Sa 29/03/2011 15 / 29
μετά
Le modèle de données PREMIS : objet Les objets décrits en PREMIS disposent d'un identifiant unique. Les règles de conservation peuvent y être décrites (preservationLevelValue) et les résultats des contrôles d'intégrité peuvent y être conservés
Métadonnées archivistiques : état de l'art
Modèle conceptuel > OAIS > AIPPaquet d'information à archiver: PREMIS
INTÉGRITÉ<premis:messageDigestAlgorithm>MD5<premis:messageDigest>bbae8bf648f794b1329af31 <premis:messageDigestOriginator>SAE AD33
OBJET <premis:object xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:type="premis:file" xmlID="FILE1_object">
IDENTIFIANT<premis:objectIdentifier><premis:objectIdentifierType>local<premis:objectIdentifierValue>FRAD033_44W064_0001
Pascal Romain CC-By-Sa 29/03/2011 16 / 29
μετά
Le modèle de données PREMIS : eventL'ensemble des évènements affectant le paquet d'information pris en charge au sein du système d'archivage peut être documenté. Chaque événement est lié à un objet et à un agent
Métadonnées archivistiques : état de l'art
EVENEMENT<eventIdentifierType>INTERNAL_XML_ID
<eventIdentifierValue>PROV2</eventIdentifier><eventType>METADATA_MODIFICATION<eventDateTime>2010-09-22<eventDetail>métadonnées descriptives modifiées manuellement
EVENEMENT<eventIdentifierType>INTERNAL_XML_ID
<eventIdentifierValue>PROV2</eventIdentifier><eventType>METADATA_MODIFICATION<eventDateTime>2010-09-22<eventDetail>métadonnées descriptives modifiées manuellement
AGENT<linkingAgentIdentifier LinkAgentXmlID="APP3_AGENT1"><linkingAgentIdentifierType>URI<linkingAgentIdentifierValue> mailto:[email protected] <linkingAgentRole>EVENT_INITIATOR</linkingAgentIdentifier>
AGENT<linkingAgentIdentifier LinkAgentXmlID="APP3_AGENT1"><linkingAgentIdentifierType>URI<linkingAgentIdentifierValue> mailto:[email protected] <linkingAgentRole>EVENT_INITIATOR</linkingAgentIdentifier>
IDENTIFIANT<eventIdentifier><eventIdentifierType>INTERNAL_XML_ID
<eventIdentifierValue>PROV1</eventIdentifier>
IDENTIFIANT<eventIdentifier><eventIdentifierType>INTERNAL_XML_ID
<eventIdentifierValue>PROV1</eventIdentifier>
Paquets d'information > AIPPaquet d'information à archiver: PREMIS
Pascal Romain CC-By-Sa 29/03/2011 17 / 29
μετά
Le modèle de données PREMIS : agentLes agents sont uniques au sein du système d'archivage et peuvent être de type homme ou machine
Métadonnées archivistiques : état de l'art
TYPE<agentType>PERSON</agentType><agentType>SOFTWARE</agentType>
TYPE<agentType>PERSON</agentType><agentType>SOFTWARE</agentType>
AGENT<agentName>Pascal Romain</agentName><agentName> Aide au classement v3.4 </agentName>
AGENT<agentName>Pascal Romain</agentName><agentName> Aide au classement v3.4 </agentName>
IDENTIFIANT<agentIdentifier><agentIdentifierType>URI<agentIdentifierValue> mailto:[email protected]</agentIdentifier>
IDENTIFIANT<agentIdentifier><agentIdentifierType>URI<agentIdentifierValue> mailto:[email protected]</agentIdentifier>
Paquets d'information > AIPPaquet d'information à archiver: PREMIS
Pascal Romain CC-By-Sa 29/03/2011 18 / 29
μετάMétadonnées archivistiques : état de l'art
Paquets d'information > AIP et DIPPaquet d'information à archiver et à diffuser
gestiongestion
stockagestockage
diffusiondiffusion
La donnée à gérer est décrite par des propriétés:- producteur- identifiant- contenu- contexte
Lors des demandes de communication, elle est caractérisée par des attributs:- format- localisation- droits d'accès- description- …
Elle est décrite au sein d'un cadre de description qui doit permettre son accès, sa sécurité et sa mise en relation contextuelle
La donnée à gérer est décrite par des propriétés:- producteur- identifiant- contenu- contexte
Lors des demandes de communication, elle est caractérisée par des attributs:- format- localisation- droits d'accès- description- …
Elle est décrite au sein d'un cadre de description qui doit permettre son accès, sa sécurité et sa mise en relation contextuelle
Pascal Romain CC-By-Sa 29/03/2011 19 / 29
μετάMétadonnées archivistiques : état de l'art
Paquets d'information > DIPPaquet d'information à diffuser: Dublin Core
<dc:title>Port de Bordeaux : entrée des navires (1645-1647)</dc:title><dc:creator>Amirauté de Guyenne</dc:creator><dc:subject xml:lang="fre">Bordeaux</dc:subject><dc:description>Rapports à l'entrée des navires dans le port de Bordeaux.</dc:description><dc:publisher>Archives départementales de la Gironde</dc:publisher><dc:date>1645-1647</dc:date><dc:type>text</dc:type><dc:format>image/jpeg</dc:format><dc:identifier>FRAD033_6B_64</dc:identifier><dc:source>6 B 215</dc:source><dc:language>FR_fre</dc:language><dc:relation>Amirauté de Guyenne.Attribution Administratives</dc:relation><dc:coverage>Bordeaux. 1645-1647</dc:coverage><dc:rights>domaine public</dc:rights>
<dc:title>Port de Bordeaux : entrée des navires (1645-1647)</dc:title><dc:creator>Amirauté de Guyenne</dc:creator><dc:subject xml:lang="fre">Bordeaux</dc:subject><dc:description>Rapports à l'entrée des navires dans le port de Bordeaux.</dc:description><dc:publisher>Archives départementales de la Gironde</dc:publisher><dc:date>1645-1647</dc:date><dc:type>text</dc:type><dc:format>image/jpeg</dc:format><dc:identifier>FRAD033_6B_64</dc:identifier><dc:source>6 B 215</dc:source><dc:language>FR_fre</dc:language><dc:relation>Amirauté de Guyenne.Attribution Administratives</dc:relation><dc:coverage>Bordeaux. 1645-1647</dc:coverage><dc:rights>domaine public</dc:rights>
Dublin Core : permet l'interopérabilité entre des données d'un domaine ou entre des domaines hétérogènes (PPDC)
Pascal Romain CC-By-Sa 29/03/2011 20 / 29
μετά
EAD: Encoded Archivistic Description
L'EAD permet de décrire un fonds d'archives ou d'ouvrages de manière hiérarchique du général au particulier. Il permet d'indexer les notices descriptives et de lier ces descriptions à des substituts numériques
Paquets d'information > DIPPaquet d'information à diffuser: EAD/EAC
Métadonnées archivistiques : état de l'art
EadheaderEadheader Archdesc / CArchdesc / C
daodaocontrolAccesscontrolAccessIdentifiantIdentifiant producteurproducteur
Pascal Romain CC-By-Sa 29/03/2011 21 / 29
μετά
EAC (Encoding Archival Creator) : ce schéma vise à décrire les producteurs d'archives en s'appuyant sur la norme de description internationale ISAAR-CPF et en utilisant un schéma XML pour retracer l'historique d'une entité administrative ou morale. [http://eac.staatsbibliothek-berlin.de/]●Il permet une redéfinition de la notion de contexte de production et d’utilisation des archivesl'EAC-CPF se concentre seulement sur la description des Collectivités, des personnes et des familles. Il est basé sur une approche de modélisation orientée-objet et utilise les normes XML (schéma, Xlink, attributs)
Paquets d'information > DIPPaquet d'information à diffuser : EAD/EAC
Métadonnées archivistiques : état de l'art
eac-cpfcontrol
cpfDescription
recordId
sources
identity
description
relations
multipleIdentities
cpfDescription
functionplace
occupation
biogHist
existDates
Pascal Romain CC-By-Sa 29/03/2011 22 / 29
μετάMétadonnées archivistiques : état de l'art
Plan
Modèles conceptuelsPaquets d'information
Contextualisation
Pascal Romain CC-By-Sa 29/03/2011 23 / 29
μετά
Contextualisation > semantiquePaquet d'information semantique: RDF
Métadonnées archivistiques : état de l'art
➢RDF n'est pas lié à une syntaxe particulière mais c'est en XML que sont publiés la plupart des vocabulaires standard (RDFS, FOAF, SKOS, OWL) qui utilisent le modèle de données en graphe.<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:aspect="http://www.linkeddatatools.com/vetements-aspects#"><rdf:Description rdf:about="http://www.linkeddatatools.com/vetement#chemise">Je décrit un sujet « chemise » et je lui donne un identifiant unique http://www.linkeddatatools.com/vetement#chemise <aspect:taille>42</feature:taille>Je donne sa taille <aspect:couleur rdf:resource="http://www.linkeddatatools.com/couleur#blanc"/>et sa couleurC'est-à-dire ce sujet (chemise) a un prédicat (propriété) dont le nom est « feature:color » avec un objet faisant référence au sujet dont l'identifiant unique est http://www.linkeddatatools.com/colors#white"
<rdf:Description rdf:about="subject"><predicate rdf:resource="object" /> prédicat de type objet<predicate>literal value</predicate> prédicat de type litéral
<rdf:Description>
Un sujet dans un document RDF peut aussi être référencé comme un objet d'une propriété (dans l'attribut ressource) dans une autre déclaration RDF
RDF : un cadre conceptuel de description
Pascal Romain CC-By-Sa 29/03/2011 24 / 29
μετά
Contextualisation > sémantiquePaquet d'information sémantique: RDF
Métadonnées archivistiques : état de l'art
Le modèle RDF EAD
Pascal Romain CC-By-Sa 29/03/2011 25 / 29
μετά
Contextualisation > thésauriiPaquet d'information indexé: SKOS
Métadonnées archivistiques : état de l'art
SKOS (Simple Knowledge Organisation System) est construit sur la base du langage RDF, et son principal objectif est de permettre la publication facile de vocabulaires structurés pour leur utilisation dans le cadre du Web sémantique. SKOS est actuellement développé dans le cadre du W3C et cherche à être au maximum compatible avec les standards qui définissent les thésaurus.Le thésaurus W existe en SKOS http://www.archivesdefrance.culture.gouv.fr/gerer/classement/normes-outils/thesaurus/
3.1 MESSAGERIE TELEDIFFUSION EP chaîne de télévision EP télévision EP télévision câblée EP télévision numérique TA REDEVANCE PARAFISCALE (1.4.) SOCIETE DE TELEDIFFUSION PRIVEE TA ENTREPRISE DE SPECTACLE (11.1.)
<skos:Concept rdf:about="http://$base/resource/T1-228"> <skos:prefLabel xml:lang="fr">télédiffusion <skos:altLabel xml:lang="fr">télévision numérique
<skos:altLabel xml:lang="fr">télévision câblée <skos:altLabel xml:lang="fr">télévision <skos:altLabel xml:lang="fr">chaîne de télévision <skos:broader rdf:resource="http://$base/resource/T1-915"/> <skos:narrower rdf:resource="http://$base/resource/T1-219"/> <skos:related rdf:resource="http://$base/resource/T1-1350"/> <skos:inScheme rdf:resource="http://$base/resource/Matiere"/> </skos:Concept> <skos:Concept rdf:about="http://$base/resource/T1-219"> <skos:prefLabel xml:lang="fr">société de télédiffusion privée <skos:broader rdf:resource="http://$base/resource/T1-228"/> <skos:related rdf:resource="http://$base/resource/T1-1350"/> <skos:inScheme rdf:resource="http://$base/resource/Matiere"/>
Pascal Romain CC-By-Sa 29/03/2011 26 / 29
μετά
Contextualisation > mise en relationPaquet d'information aligné: OWL
Métadonnées archivistiques : état de l'art
OWL: langage d'ontologie pour le web (OWL 1 et 2)
Ontologie: défini de manière formelle, pour un domaine de connaissance, les concepts qui permettront de décrire les « choses » de façon non ambiguë, et les règles contraignant ces descriptions
Cette norme comprend les éléments suivants : - les types de choses : classesEx : Document, Livre, Personne- les propriétés ou attributs des chosesEx : auteur, date de publication- les contraintes éventuelles qui relient celles-ci à celles-làEx : Un livre est un document, un livre a au moins un auteur, une personne n'est pas un document
OWL: langage d'ontologie pour le web (OWL 1 et 2)
Ontologie: défini de manière formelle, pour un domaine de connaissance, les concepts qui permettront de décrire les « choses » de façon non ambiguë, et les règles contraignant ces descriptions
Cette norme comprend les éléments suivants : - les types de choses : classesEx : Document, Livre, Personne- les propriétés ou attributs des chosesEx : auteur, date de publication- les contraintes éventuelles qui relient celles-ci à celles-làEx : Un livre est un document, un livre a au moins un auteur, une personne n'est pas un document
Pascal Romain CC-By-Sa 29/03/2011 27 / 29
μετά
Contextualisation > mise en relationPaquet d'information dynamique: SPARQL
Métadonnées archivistiques : état de l'art
SPARQL est le couteau suisse du web sémantique
Comme SQL, SPARQL sélectionne les données retournées par la requête en utilisant la déclaration SELECT pour déterminer quel sous-ensemble de donnés doit être retourné.
SPARQL utilise également la clause WHERE pour définir les modèles de graphes pour trouver une réponse au sein du jeu de réponse.
Un modèle de graphe dans la clause SPARQL WHERE consiste dans un triplet sujet, propriété objet pour trouver une réponse dans les données
La requête SELECT requiert de retourner la variable ?type.En SPARQL, les noms des variables sont préfixées par le symbole point d'interrogation("?") . Dans un modèle de requête de graphe , ils correspondent à n'importe quel noeud – une ressource ou un litéral
Pascal Romain CC-By-Sa 29/03/2011 28 / 29
μετά
Contextualisation > web de donnéesPaquet d'information diffusé: RDF
Métadonnées archivistiques : état de l'art
Le web de données ou semantic Web doit permettre aux machines de comprendre le contenu des notices archivistiques et d'offrir à terme des agents intelligents autorisant des nouveaux usages des données
Pascal Romain CC-By-Sa 29
Merci pour votre attentioncontact : [email protected] ou @keronos