adbs2012presentation 120527125034-phpapp02

203
Mutation des formats bibliographiques à l’ère du numérique et du web de données ou .. « du catalogage à l’encodage » Formation ADBS (29-30 mai 2012) Intervenante : Christine Fleury

Upload: abes

Post on 17-Jul-2015

106 views

Category:

Education


0 download

TRANSCRIPT

Mutation des formats bibliographiques

à l’ère du numérique et du web de données

ou .. « du catalogage à l’encodage »

Formation ADBS (29-30 mai 2012)

Intervenante : Christine Fleury

Dispositif pédagogique

• Cette présentation (en ligne sur SlideShare)

• Dossier documentaire :

– Petit lexique de survie

– Focus

– sélection d‟articles

• Visites de ressources

• Démonstrations – utilisation d‟outils dédiés

• TP – manipulation et analyse de données

(en ligne sur ISSUU)Ce dispositif est placé sous licence :

Au programme• Introduction : comprendre les facteurs de

transformation de la sphère bibliographique

• Irruption dans la sphère bibliographique : XML et

les métadonnées

• Accompagner la transition numérique : nouveaux

enjeux interprofessionnels -- cas concrets

• Renouvellement des modèles et des règles de

catalogage : D‟FRBR en RDA

Focus : L‟importance des identifiants

• Vers le web de données : Introduction à RDF

Un contexte en ébullition

Introduction

en pleine ®évolution numérique

Mars 1989 :

Tim Berners-Lee

donne naissance au

World Wide Web

CERN

Le Web, un univers en expansion

L’hégémonie de la « sainte trinité »

….

Et cependant …

Comment lutter ??!!!

---- rappel

De la Dématérialisation des supports

télévision / radio

téléphonie

photographie

cinéma

musique

lecture

A partir de 1980 :

révolution numérique

qui impacte (presque)

l’ensemble des objets

culturels

À l’ère de la numérisation de masse

Source : Olivier Erzscheid – les Bibliothèques numériques

Se situer dans la chaîne numérique

Crédit photo : C.Fleury (cc)- couverture Arabesques n°53 - 2009 – Documents numériques : conservation et accès pérenne

De la Bibliothèque physique

• Des USAGESDes ESPACES

Des ARCHITECTURES

source : Olivier Ertzscheid

À la Bibliothèque numérique

Des USAGES Des ESPACES Des ARCHITECTURES techniques

source : Olivier Ertzscheid

Missions numériques : valorisation

médiation diffusion dissémination

• faciliter l‟accès aux ressources numériques

• Valoriser les données bibliographiques

• exposer ses données aux moteurs de recherche

= renouvellement des interfaces des catalogues

+ revisite des formats de données

Vers le Metadata management

Missions numériques : préservation

archivage pérenne

• Préserver le patrimoine par la numérisation

• Garantir l‟intégrité des données numériques

• Garantir la pérennité des données numériques

(Source : Silvère Mercier)

= «e-Bibliothécaire » ?

Missions

numériques :

médiation

Irruption dans la sphère

bibliographique :

XML et les métadonnées

Explosion de la notion de notice

Données libérées = ???

Un contexte en ébullition

À suivre …

Prologue : le quizzRègles modèles

normes

formats identifiants Langages et

protocoles

informatiques

Web

sémantique

ISO 2709 métadonnées ISBN HTTP Open linked data

ISBD DTD / schémas ISSN XML RDF

FRBR MARCXML ISNI URL / Open

URL

SKOS

FRAD Dublin Core DOI Z3950 FOAF

AACR EAD ARK SRU / SRW Geoname

RDA METS URI / PURL OAI-PMH OWL

Part 1 –

Irruption dans la sphère

bibliographique :

XML et les métadonnéessommaire

au générique : l'interopérabilitéProduction :

Dans les rôles principaux :

• XML = lingua franca informatique

• XSLT : le traducteur universel

• Unicode = Babel des écritures

• Dans l’ordre d’apparition : TEI, EAD, Dublin Core, MarcXML, MODS, MADS, METS, TEF, LOM...

= métadonnées en partage

• OAI – PMH = hors de la tour d’ivoire des savoirs

• OAIS = la garantie de l’avenir

Focus sur les protocoles

• un objectif : l‟intéropérabilité des systèmes

d‟échanges de données pour permettre leur circulation

• Z39-50 : le pionnier (= interrogation à distance)

• FTP : transport entre serveurs

• HTTP : la navigation sur le Web

• TCP/IP : le transport des données du web

• SRU/SRW : Z39-50 sur le Web

De l’encodage universel

48 C3 A9 74 C3 A9 72 6F 67 C3 A8 6E 65غير متجانسة

异质異種のமாறிலி

= hétérogène

כעטערַאדזשיניַאס

ετερογενής

XML - Au royaume du mapping

....

• le cycle de transformations des données

– XML : un langage

– XSLT : un traducteur

– DTD (MarcXml, Dublin Core, TEF, EAD...) : des vocabulaires

– Schémas : des structures

• « Rien ne se perd, rien ne se crée, tout se transforme » (Lavoisier)

… et du Mash up

• application composite qui combine des contenus ou des services provenant de diverses applications et sites

webservices et API

RSS

XML – berceau des métadonnées

Extensible Markup Language

1998 : Standard W3C

http://www.w3.org/XML/

Famille des langages “à balises” < />

+ ouvert (non propriétaire)

+ hiérarchique (structuré)

= format d‟échange

= interopérabilité

= langage pivot

XML – une structure hiérarchique

<balise parent>

<balise fils>donnée</balise fils>

</balise parent>

<annuaire>

<personne class = " bibliothecaire">

<nom>Fleury</nom>

<prenom>Christine</prenom>

<telephone>555-123456</telephone>

<email>[email protected]</email>

</personne>

</annuaire>

XML – une syntaxe souple• Head = prologue

– Référence à la version

– Encodage (UTF8 par défaut)

– Déclaration d‟espace de nom

• Éléments – <baLiSe>Donnée</baLiSe>

– <_balise attribut9='valeur'/>

• Exemple :

<?xml version="1.0" standalone="yes"?>

<magasin>

<service>

<produit> Vaisselle </produit>

<couleur produit = „bleue‟>

</service>

</magasin>

<biblio>

<livre> <!-- Élément enfant titre -->

<titre>Les Misérables</titre>

<auteur>Victor Hugo</auteur>

<nb_tomes>3</nb_tomes>

</livre>

<livre>

<titre>L'Assommoir</titre>

<auteur>Émile Zola</auteur>

<couverture couleur="rouge" />

</livre>

<livre lang="en">

<titre>David Copperfield</titre>

<auteur>Charles Dickens</auteur>

</livre>

</biblio>

TP : parser (analyser) avec Editix 2010

= élément racine / nœud / parent

= éléments

= commentaire

= attribut

XML – DTD …DTD : Document Type Definition

= structure logique permettant de vérifier la conformité du document XML

Exemple :

<!DOCTYPE annuaire [ <!ELEMENT personne (nom,prenom,telephone,email? > <!ELEMENT nom (#PCDATA) > <!ELEMENT prenom(#PCDATA) > <!ELEMENT telephone(#PCDATA) > <!ELEMENT email (#PCDATA) > <personne> <nom> </nom><prenom> Prénom</prenom> <telephone>Tel </telephone> <email>Courriel</email></personne>

<?xml version="1.0" encoding="UTF-8"?>

<ex:collection xml:lang="fr" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns="http://www.w3.org/1999/xhtml"

<élément>Texte</élément>

<dc:title>Astérix le Gaulois</dc:title>

<ex:livre attribut="valeur" type="BD">

<dc:title>Astérix chez les Belges</dc:title>

<!-- élément répété -->

<dc:creator>René Goscinny</dc:creator>

<dc:creator>Albert Uderzo</dc:creator>

<dc:description> Astérix chez les Belges est un album de <ahref="http://fr.wikipedia.org/wiki/ Bande_dessinée">bande dessinée</a> de la série Astérix

le Gaulois créée par René Goscinny et Albert Uderzo.

</dc:description>

</ex:livre>

</ex:collection>

= espaces de nom

= schéma de référence

= encodage

= commentaire

XML – … et Schémas « métier »

• Observer

TEI

DOCBOOK

DITA

internes

= schémas d‟encodage

externes généralistes

Dublin Core

MARCXML

MODS / MADS

EAD dédiés

TEF

LOM

« au-delà des données »

• Du grec « meta » : au-delà-de

• Selon ISO (2003) : « donnée qui définit et

décrit une autre donnée »

• Selon NISO (2004) : « information

structurée qui décrit, explique, localise la

ressource et en facilite la recherche, l‟usage

et la gestion »

Les métadonnées multitâches

• décrire,

• identifier,

• organiser,

• gérer,

• référencer,

• rapprocher,

• archiver,

• chercher,

• authentifier,

• accéder,

• évaluer,

• échanger,

• réutiliser….

des ressources (numériques ...et autres…

Des balises <META>

Schémas et DTD – Dublin Core

• = 15 méta-informations pour faciliter

–l'identification

–la recherche

–l‟accès

aux ressources numériques 

• Createur

• Contributeur

• Editeur

• Titre

• Date

• Langue

• Format

• Sujet

• Description

• Identifiant

• Relation

• Source

• Type

• Couverture

• Droits

Dublin Core metatdata elements set

• <link rel="schema.dc" href="http://purl.org/DC/elements/1.1/"/>

• <link rel="schema.cndp" href="http://www.cndp.fr/standards/meta/1.0/" />

• <meta name="dc.title" content="Dossier documentaire sur les métadonnées " />

• <meta name="dc.description" content="mise en perspective - nouveaux formats bibliographique - renouvellement du cadre normatif - modèle FRBR/règles RDA, un assouplissement et un enrichissement des données - XML / métadonnées - une (r)évolution technique - numérique et web de données - connaître les bouleversements en cours, comprendre les enjeux pour la description bibliographique dans ce contexte (numérisation, édition électronique..), mettre en perspective les différents éléments métier ( modèles et normes, schémas et structures, environnements techniques et juridique...)" />

• <meta name="dc.creator" content="Fleury, Christine" />

• <meta name="cndp.niveau" content="licence professionnelle;maîtrise;master;DUTdiplôme universitaire de technologie" />

• <meta name="cndp.discipline" content=" enseignement renforcé des langues; éducation à l'image; éducation aux médias; formation à la maîtrise de l'information; culture scientifique et technique" />

• <meta name="dc.subject" scheme="DCC" content="formation" />

• <meta name="dc.subject" content="e-learning" />

• <meta name="dc.date" content="2012-04-18" />

• <meta name="dc.type" scheme="dcMIType" content="Interactive ressource" />

• <meta name="dc.rights" content="creative common - CC - " />

• <meta name="dc.language" content="fr" />

• <meta name="cndp.public" content="Enseignant" />

• <meta name="cndp.statut" content="Document de travail" />

Schémas et DTD « métier »

• MARCXML

– http://www.loc.gov/standards/marcxml/

• METS - Metadata Encoding & Transmission Standards

– http://www.loc.gov/standards/mets/

• MADS - Metadata Authority Description Schema

– http://www.loc.gov/standards/mads/

• MODS - Metadata Object Description Schema

– http://www.loc.gov/standards/mads/

• Mapping mode d‟emploi

Schémas et DTD « métier »

• TEI - Text Encoding Initiative

• http://www.tei-c.org/

• http://www.tei-c.org/release/doc/tei-p5-doc/fr/html/

= système pour faciliter la création, l'échange,

l'intégration de données textuelles informatisées

« Il ne s'agit pas d'une spécification (DTD ou Schéma) en

soi mais plutôt d'un cadre (framework) pour en

développer des particulières. »

TEI vu de l’intérieur• En-tête :

– <fileDesc> : Description bibliographique de la ressource dans le même style que celle proposée par les RCAA (titre, auteur, édition, taille, etc.)

– <encodingDesc> : Renseignements sur la manière dont le texte a été encodé.

– <profileDesc> : Autres types d‟indications au sujet de la ressource (langue, participants à la création, thèmes abordés, etc.)

– <revisionDesc> : Mises à jour effectuées sur la ressource et intermédiaires responsables de sa modification.

• Texte : – <front> : Rassemble des données qui se trouvent avant le début du

texte (page de titre, préface, dédicace, etc.)

– <group> : Permet d‟associer ensemble plusieurs textes unitaires ou des groupes de textes.

– <body> : Comprend le texte en tant que tel, mis à part les annexes et les données préliminaires.

– <back> : Combine toutes les annexes auxquelles fait allusion le texte principal.

TEI vu de l’intérieur <div type="Act" n="I"><head>Acte II</head> <divtype="Scene" n="1"><head>Scène 2</head> <sp><speaker>Rodrigue</speaker> <l part="i">À moi, comte, deux mots.</l></sp> <sp><speaker>Comte</speaker> <l part="m">Parle</l></sp> <sp><speaker>Rodrique</speaker> <l part="f">Ôte-moi d'un doute</l></sp> <sp><speaker>Comte</speaker> <l part="i">Connais-tu bien Don Diègue ?</l></sp> <sp><speaker>Comte</speaker> <l part="m">Oui</l></sp> <sp><speaker>Rodrigue</speaker> <l part="f">Parlons bas, écoute.</l> <l>Sais-tu que ce vieillard fut la même vertu,</l> <l>La vaillance et l'honneur de son temps ? Le sais-tu ?</l></sp> ... </div> ... </div>

Schémas et DTD « métier »

• EAD - Encoded Archival Description

–http://www.loc.gov/ead

• Visite guidée :

– Calames http://www.calames.abes.fr/pub/

• Démo : Xmetal pour Calames

• Boite à Outils

http://www.archivists.org/saagroups/ead

EAD de l’intérieur• <ead>

<eadheader> l‟entête<frontmatter> les préliminaires

<archdesc> la description<did>

<admininfo> <bioghist> <scopecontent>

<add> <dsc>

<c01> les composants</c01>

<c02> </c02>

</dsc> </archdesc>

</ead>

Schémas et DTD « métier »

• TEF - Thèses Electroniques Françaises

– Recommandation AFNOR – CG46

– http://www.abes.fr/abes/documents/tef/

• Démo : STAR et STEP - outils pour la

production de données en TEF• http://www.abes.fr/abes/documents/tef/recommandation/ex1_theseSimplePDF.xml

• Visite guidée : theses.fr moteur de

recherche des thèses françaises

Schémas et DTD « métier »

OAI : une philosophie

• = Open Archives Initiative

– concepts clés : archive ouverte et libre accès aux

données de la science

– http://www.openarchives.org/

– http://www.openarchives.org/OAI/2.0/guidelines-oai-

identifier.htm

• Philosophe en convergence avec l‟Open source

OAI-PMH : une réponse informatique

• OAI- PMH : protocole for metadata harvesting

= protocole basé sur XML et le Dublin Core pour

l'échange de métadonnées entre fournisseurs de

données et fournisseurs de services

• Répertoires OAI - visites guidées

• http://tel.ccsd.cnrs.fr/oai/oai.php

http://www.openarchives.org/Register/BrowseSites

• Tester : http://re.cs.uct.ac.za/

Visite guidée • Soit l‟image :

http://cdsweb.cern.ch/record/1269064

• En MARC : http://cdsweb.cern.ch/record/1269064/export/hm?ln=fr

• En MARCXML : http://cdsweb.cern.ch/record/1269064/export/xm?ln=fr

• En Dublin Core : http://cdsweb.cern.ch/record/1269064/export/xd?ln=fr

En savoir plus

• OAI-PMH http://www.culture.gouv.fr/culture/dll/OAI-PMH.htm

• schémas de métadonnées « métier » http://bibliodoc.francophonie.org/article.php3?id_article=178

• Métadonnées : mutations et perspectives –Séminaire INRIA - 29 sept./ 3 oct. 2008 – Dijon – ADBS Editions

Part 2 - Accompagner la transition

numérique : nouveaux enjeux

interprofessionnels

-- cas concretssommaire

Le cas de l‟e-book

Convergences éditeurs /libraires/bibliothècaires

formats

droits d‟auteur

77Source : ebooksgratuits.com/

Convergence des métadonnées - ONIX

• ONIX* for books » : norme qui définit un format

d’échange de métadonnées des fichiers numériques

• élaborée et maintenue par le groupe international

EDItEUR

Visite guidée :

• http://www.onixedit.com/fr/Accueil.aspx

• http://publishers.oclc.org/en/default.htm

Convergence des formats de lecture - ePUB

• Format ePub - « electronic publication » développé par l‟IDPF - avril 2005

• Open Ebook V2 - format de fichier ebooknon-propriétaire - dérivé d’XML

• composé de plusieurs fichiers (instance, structure, métadonnées…

• largement utilisé par les éditeurs

• facilite la mise en page des livres sur tout appareil de lecture (ordinateur, mobile, smartphone, tablette)

• + les fichiers PDF créés avec des versions récentes du logiciel Adobe Acrobat sont compatibles avec le format ePub.

Archivage pérenne des données

numériques

• modèle OAIS - Open Archival Information

System = Système ouvert d'archivage

d'information

– norme ISO - référence 14721:2003

Modèle OAIS – ex : DIAS (KB - Koninklijke Bibliotheek

Numérisation

du patrimoine

Gallica, côté cour• Océrisation : du mode image au mode texte

– recherche plein texte possible

• Données conformes aux standards du Web

– Brique de Europeana - récupération par OAI PMH

– visibilité sur les moteurs de recherche

• URL pérenne par document numérisé / par page

– Document citable

– Identification univoque

• gestion des métadonnées : données numérisées décrites en XML (Dublin Core / METS)

• services web

– récupération du code pour intégration dans un autre site web

– audio

Question subsidiaire

Et nos catalogues dans tout ça ???

MAUX ...

• « 89 % des étudiants de premier cycle débutent une recherche documentaire en utilisant un moteur de recherche, 2 % seulement passent d’abord par le site portail d’une bibliothèque »

• College Students’ Perceptions of the Libraries and Information Resources : A Report to the OCLC Membership, Dublin (Ohio) : OCLC, 2006

… et remèdes

• “The future will require the kind of catalog that is one link in a chain of services enabling users to find, select, and obtain the information objects they want. One requirement of this future catalog is thus to ingest and disperse data from and to many systems inside and outside the library. It would be helpful to reconsider what needs to be part of catalog data —and where catalog data needs to be present to facilitate the user’s process of discovering, requesting, and getting the information they need.”

• (Calhoun, 2006, conclusion d’un rapport commandé par la Library of Congress ).

Un contexte en ébullition

la suite demain…

D’FRBR en RDA

Part 3 - Renouvellement des modèles

et des règles de catalogage

sommaire

Pavé ISBD – les 8 zones• zone 0 : contenu et type de médiation (indication

générale du type de ressource)

• zone 1 : titre et mention de responsabilité (auteurs, traducteurs)

• zone 2 : édition (1re, 2e, nouvelle édition)

• zone 3 : zone particulière aux cartographies et aux documents électroniques

• zone 4 : adresse bibliographique (lieu d'édition, éditeur, date)

• zone 5 : collation (description physique : pagination, format, illustration)

• zone 6 : collection

• zone 7 : notes (on y mentionne notamment la présence d'une bibliographie si besoin)

• zone 8 : numéro international normalisé (ISBN, ISSN) et éventuellement prix.

Les bibliothèques : digital native

Les années1970 • Formats MARC

• Z39.50 : pionnier des protocolesd'échanges de données

Les années 1980• Catalogues collectifs via Minitel

• OPACs « Online Public Access Catalog » = une des premières réalisations à grande échelle du principe de séparation entre contenu et mise en page

Louise Addis, bibliothécaire du Stanford Linear Accelerator Center (SLAC) première bibliothécaire - webmaster (1990)

Ex : 210 - - $aParis$cPresses universitaires de

France$d1992

Label Directory FT Field FT Field FT ... Field FT RT

En d‟autres termes …

Source : Philippe Le Pape – Journées ABES 2010

Le point sur les modèles - FRBR

• Functional Requirements for Bibliographic

Records

= Spécifications fonctionnelles des notices

bibliographiques

– Approuvé par le Comité permanent de la Section de

catalogage de l‟IFLA en 1997

Entités du groupe 1 : production intellectuelle

et/ou artistique

Entités du groupe 2 : les responsabilités

Entités du groupe 3 : les sujets de l‟oeuvre

Ils travaillent pour nous

• A l‟international :

• Pour le modèle FRAD : IFLA working group on “functional requirements and numbering of authority records” (FRANAR) devenu par la suite « functional requirements for authority data” (FRAD)

• Pour le modèle FRSAD : IFLA working group on “functional requirements for subject authority data” (FRSAD)

• En France :

• BnF - pôle Modélisation fonctionnelle / direction des Services et des réseaux / département Information bibliographique et numérique.) : participation, traduction

Le point sur les modèles - FRAD

• de 1999 à 2009 : groupe de travail FRANAR

• 2009 : Publication de Functional Requirements for Authority Data (FRAD)- A Conceptual Model.

• modèle pour les entités décrites dans les notices d‟autorité = « ensemble d‟informations relatives à une personne, une famille, une collectivité ou à une œuvre dont le nom constitue la base d’un point d’accès contrôlé dans des références ou des notices bibliographiques au sein d’un catalogue de bibliothèque ou d’une base de données bibliographiques » = entités du groupe 2 du modèle FRBR

• En français : http://www.bnf.fr/documents/frad_rapport_final.pdf

Le point sur les modèles - FRSAD

• 2005- : groupe de travail FRSAD

• 2011 : publication de Functional requirements for subject authority data : a conceptual model (Fonctionnalités requises des notices d‟autorité matière)

• modèle pour les entités décrites dans les notices d‟autorité matière

• = Entités du groupe 3 du modèle FRBR = sujets des œuvres : concept, objet, événement et lieu.

• En français : http://www.bnf.fr/documents/frsad_rapport_final.pdf

En savoir plus sur FRBR … FRBR, c‟est quoi déjà ? Philippe Le Pape , « 5 à 7 » (vidéo),

ADBS, 2011

http://www.adbs.fr/rda-le-nouveau-paradigme-du-

catalogage-1-frbr-c-est-quoi-deja--102461.htm

http://www.slideshare.net/ADBS/rda-le-nouveau-paradigme-

du-catalogage-1-frbr-cest-quoi-dj

• Les spécifications (en Français)

• http://www.bnf.fr/fr/professionnels/modelisation_ont

ologies/a.modele_FRBR.html

• http://www.bnf.fr/documents/frbr_rapport_final.pdf

• http://www.bnf.fr/documents/frad_rapport_final.pdf

Ou les implications du modèles FRBR

LES EFFETS FRBR

Des principes de Paris aux PIC

• Principes internationaux de catalogage (PIC)

+ travaux de modélisation FRBR et de FRAD = corpus sur lequel s‟appuient les nouveaux standards de métadonnées bibliographiques et les nouveaux codes de catalogage.

• International cataloguing principles

• Statut : standard international1ère édition : 2009

• Principes internationaux de catalogage ; trad. par Françoise Bourdon, Françoise Leresche, Catherine Marandas... - Version française

Transformation de l’ISBD

• International standard bibliographic descriptions :

Descriptions bibliographiques internationales normalisées

2007 : ISBD consolidé

http://www.bnf.fr/fr/professionnels/anx_norm/a.isbd_2010_enquete.html

Les conditions de la

« Frbrisation » des catalogues

• points cruciaux dans les notices Unimarc :

– Titres

– Codes de langues (101)

– Accès auteurs (7XX)

– Dates

– Édition (205)

– Identifiants normalisés

– Identifiants de notices

Et RDA dans tout ça ?

Ils travaillent pour nous

• JSC = JOINT STEERING COMMITEE FOR DEVELOPMENT OF RDA = Partenaires dans le développement d’une nouvelle norme de catalogage international : Resource Description and Access

• Partenaires : – The American Library Association

– The Australian Committee on Cataloguing

– The British Library

– The Canadian Committee on Cataloguing

– CILIP: Chartered Institute of Library and Information Professionals

– Deutsche Nationalbibliothek

– The Library of Congress

• http://www.rda-jsc.org/

• EURIG = European RDA Interest Group : Initiative des 4 pays "fondateurs" (Allemagne, Espagne, Royaume-Uni, Suède)

• 19 pays représentés

– Membres : agences bibliographiques

– Comité exécutif

• Président : Alan Danskin (BL, membre du JSC)

• Vice-président : Gildas Illien (BnF)

• Secrétaire : Laura Peters (KB, Pays-Bas)

• voir les compte-rendus en ligne

• Travaux internationaux sur RDA : État d’avancement (Réunion du

Groupe technique sur l’adoption de RDA en France, février 2012)

RDA en Europe ? – EURIG

RDA en France ? Groupe stratégique

Groupe technique

Boite à outil RDA• RDA (Ressources : description et accès)

– http://www.rdatoolkit.org/

– http://www.rdatoolkit.org/background

• RDA dans le monde

– http://www.rda-jsc.org/working2.html#chair-10

• RDA en Europe - EURIG

– http://www.slainte.org.uk/eurig/index.htm

• RDA en France

– http://rda-en-france.enssib.fr/

– http://rda.abes.fr

• Plaquette RDA – http://rda-en-france.enssib.fr/sites/rda-en-france.enssib.fr/files/Depliantv1.pdf

• Comprendre : – http://www.adbs.fr/rda-le-nouveau-paradigme-du-catalogage-2-qu-est-ce-que-le-

rda--102462.htm

Veille : http://www.scoop.it/t/frbr-rda-etc

Part 4 –

Focus – l’importance des identifiants

sommaire

IS – etc …

• ISBN

• ISSN

• ISRC

• ISAN

• ISWC

• ISMN

• ISTC

• ISRN

• ISIL

• ISNI

monographies

publications en série

enregistrements sonores et visuels

œuvres audiovisuelles

œuvres musicales

musique imprimée

œuvres textuelles

rapports

bibliothèques

les créateurs

Les précurseurs

• ISBN : International

Standard Book Number

norme ISO 2108Agence internationale

norme ISO 3297Agence internationale

• ISSN : International Standard

Serial Number

Périmètre de l’ISBN

• les monographies

• les publications non périodiques faisant l‟objet du dépôt légal

• les numéros séparés de publications paraissant une fois par an (rapports annuels, annuaires..)

• les publications en plusieurs volumes (un ISBN d‟ensemble + un ISBN par volume)

• les présentations ou reliures différentes d‟un même titre

• les documents cartographiques

• les publications en braille

• les microformes

• les documents multimédia (CD-ROM, DVD, livres-audio, etc.)

• les documents électroniques (y compris en ligne )

• les logiciels

De ISBN-10 à ISBN-13 …

Convertisseur :

• http://www.isbn.org/converterpub.asp

– 2-7654-0912-9 ?

En savoir plus

ISBN-13 : 978-2-84365-104-5

• 978 : code EAN du produit « livre »

• 2 : zone linguistique francophone

• 84365 : éditions de l‟ADBS

• 104 : numéro d‟ordre dans la

production de cet éditeur

• 5 : caractère de contrôle.

Périmètre de l’ISSN

les « ressources continues » =

• les publications en série

– périodiques (journaux, revues, magazines, etc.)

– monographies en série (annuaires, annales, etc.) : un ISSN

pour le titre de la série + un ISBN pour chaque volume

– collections de monographies

• les ressources intégratrices

– sites Web à mises à jour intégrées,

– publications à feuillets mobiles

La loi des séries

• ISSN : International Standard Serial

Number

ISO 3297:2007

Titre clé

• Attribution du titre clé

= titre normalisé

unique attribué à une

publication en série

par le Réseau de

l'ISSN et lié à son

ISSN.

• = nom de la publication +

(éventuellement) un

qualificatif (souvent le lieu

de publication).

• Ex : ISSN - 0999-2138 est

associé au titre-clé «Ouest-

France (Rennes)».

ISSN-L

• Objectif : identifier sans ambiguïté une ressource

donnée indépendamment de son support.

• attribué à la plus ancienne version inscrite dans le

registre de l'ISSN

– Cadre d‟utilisation : l'ISSN-L permet d‟établir un lien entre la

version imprimée d'un quotidien et sa version en ligne /

numérisée

– Accès au registre ISSN : http://portal.issn.org

Focus - ISRC

• International Standard Recording Code

(enregistrements sonores et visuels)

– ISO 3901

• opérateur : International Federation of the

Phonographic Industry (IFPI)

ISRC FR-AB5-07-12345 ?

Focus - ISIL• International Standard Identifier for Libraries and

Related Organisations– ISO 15511 (2003)

• Structure :– en France : FR- N°RCR (12 caractères

alphanumériques)

– Ex :

• Cadre d‟utilisation : localisations, prêt (ILL), campagne de numérisation

• Agence en France : ABES

Focus - ISNI• International Standard Name Identify

(Code international des noms )– ISO 27729:2012

• Opérateur – Agence internationale ISNI (ISNI-IA).

– La BnF et la British Library en sont membres

• Cadre d‟utilisation : identifier au niveau international les identités publiques des personnes ou des collectivités impliquées dans la création, production, gestion et distribution des contenus intellectuels et artistiques ou faisant l‟objet de ces contenus.

ARK

• Archival Resource Key

• Opérateur : California Digital Library

• Voir sur Gallica : http://gallica.bnf.fr/ark:/12148/bpt6k107371t

• Voir sur le catalogue de la BnF :

• http://catalogue.bnf.fr/ark:/12148/cb31009475p

URI

• URI : Unified Resource Identifier

– URC : Uniform Resource Characteristic

– URN : Uniform Resource Name

– URL : Uniform Resource Locator

– PURL : Persistent Uniform Resource Locator

• http://purl.net/

• Open Url : http://nbn-resolving.org/resolve_urn.htm

DOI

• DOI - Digital Object Identifier

– norme : ISO 26324 (1998 )

• Opérateur : DOI Foundation (IDF) : http://www.doi.org

– Crossref dans le domaine de la recherche

– INIST-CNRS en France

• Résolveur : http://dx.doi.org/

Ex : http://dx.doi.org/10.3929/ethz-a-000565688

sommaire

Vers un Web « de données liées»

Comment ? S‟imprégner de la

philosophie du web de

données et de la culture

des standards du Web

Sortir les données de leurs

entrepôts (bases de

données… ) pour les

rendre disponibles sur le

WEB

= conditions pour entrer

dans l‟écosystème du

linked data web

Pourquoi ? valoriser « nos » données

tirer bénéfice des données

créées par les autres

exploiter la richesse des

données (scientifiques,

gouvernementales,

statistiques, encyclopédiques,

d‟autorité, bibliographiques)

Voir vidéo Tim Berners LEE

TED 2009

Des silos de données

Visualisation

Mashup de données

Données de géolocalisation

http://sws.geonames.org/3031189 ????<rdf:RDF><gn:Feature rdf:about="http://sws.geonames.org/3031189/"><rdfs:isDefinedBy>http://sws.geonames.org/3031189/about.rdf</rdfs:isDefinedBy><gn:name>Pointe des Boulassiers</gn:name><gn:featureClass rdf:resource="http://www.geonames.org/ontology#T"/><gn:featureCode rdf:resource="http://www.geonames.org/ontology#T.PT"/><gn:countryCode>FR</gn:countryCode><wgs84_pos:lat>46.01667</wgs84_pos:lat><wgs84_pos:long>-1.33333</wgs84_pos:long><gn:parentFeature rdf:resource="http://sws.geonames.org/2986492/"/><gn:parentCountry rdf:resource="http://sws.geonames.org/3017382/"/><gn:parentADM1 rdf:resource="http://sws.geonames.org/2986492/"/><gn:nearbyFeatures rdf:resource="http://sws.geonames.org/3031189/nearby.rdf"/><gn:locationMap rdf:resource="http://www.geonames.org/3031189/pointe-des-boulassiers.html"/></gn:Feature><foaf:Document rdf:about="http://sws.geonames.org/3031189/about.rdf"><foaf:primaryTopic rdf:resource="http://sws.geonames.org/3031189/"/><cc:license rdf:resource="http://creativecommons.org/licenses/by/3.0/"/><cc:attributionURL rdf:resource="http://sws.geonames.org/3031189/"/><cc:attributionNamerdf:datatype="http://www.w3.org/2001/XMLSchema#string">GeoNames</cc:attributionName><dcterms:created rdf:datatype="http://www.w3.org/2001/XMLSchema#date">2006-01-15</dcterms:created><dcterms:modified rdf:datatype="http://www.w3.org/2001/XMLSchema#date">1994-01-06</dcterms:modified></foaf:Document>

Pointe des

Boulassiers

France » Poitou-

Charentes

point

N 46° 1' 0'' W 1° 20'

En savoir plus sur le web de données

• Tim Berners-Lee : The Next Web of Open, Linked Data (TED 2009)– http://dai.ly/cvIl6P (sous-titré en français)

• Linking OpenData– http://esw.w3.org/SweoIG/TaskForces/CommunityProjects/LinkingOpenData

• LIBRIS : un catalogue dans le linked data– http://dc2008.de/wp-content/uploads/2008/09/malmsten.pdf

• Les catalogues de bibliothèques sur le Web – Emmanuelle Bermès (2009)– http://www.slideshare.net/Figoblog/les-catalogues-sur-le-web

• Le web sémantique : un web de métadonnées – Yann Nicolas– http://www.slideshare.net/yannn/le-web-smantique-un

• Portail de blogs : http://planete.websemantique.org/

Introduction à RDF

● Une nouvelle grammaire (descriptive) pour

tout transformer : /

● triplet RDF = la clé de la métamorphose :

isbd.rdf ; DC.rdf ; Marc.rff ; rda.rdf …

● Pour se comprendre : les ontologies =

schémas relationnels (SKOS ; FOAF)

● Des ressources en commun : VIAF,

Geoname, data.bnf, IdRef …)

RDF – Resource Description Framework

• À la base du Web sémantique : utilisé (notamment) pour décrire les ressources du web et leur métadonnées et permettre leur traitement automatique

• RDF Model Theory

– recommandation W3C du 14 février 2002

– http://www.w3.org/TR/2002/WD-rdf-mt-20020214/V

– voir la recommandation du W3C (en français)

• Un langage de requête spécifique : SPARQL

Protocol and RDF Query Language

– Recommandation W3C du 15 janvier 2008

– http://www.w3.org/TR/rdf-sparql-protocol/

Sujet ( = ce qu‟on décrit )http://www.w3.org/Home/Lassila

Prédicat ( = une Propriété applicable à ce

qu‟on décrit )A pour Créateur

Objet (= une valeur ) "Ora Lassila"

RDF - le principe des triplets

Les données sont décomposées / recomposées en

« triplets RDF »

…. et modélisées en « graphes RDF »

Sujet/prédicat/objet• Quatre-vingt-treize est un

roman de Victor Hugo paru en

1874 et dont le thème est la

révolution française

• Quatre-vingt-treize est un

roman

• Quatre-vingt-treize a pour

auteur Victor Hugo

• Quatre-vingt-treize est paru en

1874

• Quatre-vingt-treize a pour

thème la Révolution française

• (Quatre-vingt-treize, type,

roman)

• (Quatre-vingt-treize, auteur,

Victor Hugo)

• (Quatre-vingt-treize, année

de parution, 1874)

• (Quatre-vingt-treize, thème,

La Révolution Française)

Exemple emprunté à Bernard Vatant –

in Métadonnées, perspectives et Mutations

Séminaire INRIA – 2008)

Sujet / prédicat / objet

Ressource = 1 URI = http://dbpedia.org/resource/Ninety-Three

dbpedia : Ninety-Three rdf:type

yago:Novel106367879

dbpedia : Ninety-Three dcterms : creator dbpedia : Victor Hugo

dbpedia : Ninety-Three dcterms : created « 1874 »

dbpedia : Ninety-Three skos:subject dbpedia : Category :

French revolution

RDF - s’exprimer en URI…

• Principe : chaque ressource (= objet, lieu, livre, auteur …..) est identifiée par une - ou plusieurs -URI

-(= identifiant uniforme de ressource)

– ex : un oiseau = http://stitch.cs.vu.nl/vocabularies/rameau/ark:/12148/cb11932889r

– ex : Les Boulassiers http://sws.geonames.org/3031189/

– ex : Aristote = http://viaf.org/viaf/7524651/#Aristotle

« same as » http://www.idref.fr/026690276/id

RDF - s’exprimer en URI

• Ex : Dublin Core en RDF

http://dublincore.org/2010/10/11/dcelements.rdf#

http://www.dublincore.org/documents/dcmi-terms/#H5

• Ex : ISBD en RDF

ISBD : http://iflastandards.info/ns/isbd/

• OWL -Web Ontology Langage

« super -structure » des ontologies

(= vocabulaires RDF)

–recommandation W3C du 12

novembre 2002

• // METS ?

RDF - Une langue, des ontologies –

OWL

RDF - Une langue, des ontologies –

SKOS

• Simple Knowledge Organisation System

– recommandation W3C du 18 août 2009

– représentation dans un contexte multilingue de tout

vocabulaire contrôlé (thésaurus, classifications,

taxonomies, etc )

Voir :

– http://www.w3.org/TR/skos-reference/#semantic-relations

– http://www.w3.org/2009/08/skos-reference/skos.html

RDF - Une langue, des ontologies –

FOAF

• Friend of a Friend

– recommandation W3C du 9 août 2010

– description des personnes et des relations entre elles

– http://xmlns.com/foaf/spec/20100809.html

• Tutoriel

• tester FOAF

• <rdf:RDF

• xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"

• xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"

• xmlns:foaf="http://xmlns.com/foaf/0.1/"

• xmlns:admin="http://webns.net/mvcb/">

• <foaf:PersonalProfileDocument rdf:about="">

• <foaf:maker rdf:resource="#me"/>

• <foaf:primaryTopic rdf:resource="#me"/>

• <admin:generatorAgent rdf:resource="http://www.ldodds.com/foaf/foaf-a-matic"/>

• <admin:errorReportsTo rdf:resource="mailto:[email protected]"/>

• </foaf:PersonalProfileDocument>

• <foaf:Person rdf:ID="me">

• <foaf:name>Christine Fleury</foaf:name>

• <foaf:title>Mrs</foaf:title>

• <foaf:givenname>Christine</foaf:givenname>

• <foaf:family_name>Fleury</foaf:family_name>

• <foaf:nick>Kris</foaf:nick>

• <foaf:mbox_sha1sum>baf561f4c38d516f9063b787b0536bbf3c19239e</foaf:mbox_sha1sum>

• <foaf:homepage rdf:resource="http://www.netvibes.com/chrisformations#En_savoir_plus..."/>

• <foaf:workplaceHomepage rdf:resource="http://www.abes.fr/"/>

• <foaf:knows>

• <foaf:Person>

• <foaf:name>Yann Nicolas</foaf:name>

• <foaf:mbox_sha1sum>6c0599c42710b2534ba4baddda319f0d3539438b</foaf:mbox_sha1sum>

• <rdfs:seeAlsordf:resource="http://www.idref.fr/071625348"/></foaf:Person></foaf:knows></foaf:Person>

• </rdf:RDF>

FOAF

Whos’ who ?

« Le Bibliothécaire »

Giuseppe Arcimboldo

Avant ….

retour

Vers la convergence des autorités• LCSH -

• http://id.loc.gov/authorities/subjects/sh85024567.rdf

• http://lccn.loc.gov/n98036669

• IdRef – autorités Sudoc

• http://www.idref.fr/autorites/autorites.html

• http://www.idref.fr/027100669

• Data.bnf –

• http://data.bnf.fr/semanticweb

• http://data.bnf.fr/11921997/arthur_rimbaud/#rdt72-11921997

• http://data.bnf.fr/11928016/jules_verne/rdf.xml,

• VIAF

• http://viaf.org/viaf/7396281/

• http://viaf.org/viaf/7396281/rdf.xml

Avant…L'agriculture de la France. Isabelle Albouy-Delponte , Milan, 1997

• Sujets (Rameau/BNF) : Agriculture – France

• Concepts (Thésaurus Motbis) : production agricole / agriculteur exploitant / politique agricole européenne / France

• Classe (Dewey) : 630.944 022= Agronomie, agriculture et techniques connexes

La guillotine carcérale : silence, on meurt. Jacqua L., Paris : Nautilus, 2003

• Sujet (Rameau/BNF) : Prisons -- France -- 1990-.... -- Récits personnels ; Crimes et criminels -- France -- 1990-.... -- Biographies

• Concepts (Thésaurus BDSP) : Prisonnier, Prison, Accès soins, Solitude, Discrimination, Violence, Témoignage, France, Sida

• Concepts (Thésaurus Enap) : Témoignage, Biographies, Détenu, Vie en détention, Condition de détention, Délinquant

• Classe (Dewey) : 365.440 92 = Établissements pénitentiaires et établissements connexes pour les hommes adultes - Étude relative à une personne

source

Après …

Source : Information numériques : définitions et enjeux, Xavier Poupeau - voir

En d’autres termes … avant

Diapo : Emmanuelle BermèsAprès ….

… après

… après

La DEWEY en RDF (OCLC)

VIAF : partage d’autorités

Libris : un catalogue en RDF

+ convergences

• traduction en RDF des normes, formats …

• http://metadataregistry.org/

Boite à Outils RDF

Boite à Outils RDF

• INDICE = pour voir le monde en RDF

– http://inspector.sindice.com/

• Pour voir le monde en URI :

• Les concepts - SKOS -

http://www.w3.org/2004/02/skos/

• Les langues - Lexvo -

http://www.lexvo.org/index.html

• Les lieux – Geonames : http://sws.geonames.org

• les personnes et collectivités : tester FOAF

Boite à outils RDF

• Ontologies et espaces de nom :

– MADS : http://www.loc.gov/mads/rdf/v1#

– OWL : http://www.w3.org/2002/07/owl#

– RDF : http://www.w3.org/1999/02/22-rdf-syntax-ns#

– RDFS : http://www.w3.org/2000/01/rdf-schema#

– SKOS : http://www.w3.org/2004/02/skos/core#

– FOAF : http://xmlns.com/foaf/0.1/

#Bonus - D’ FRBR en RDA –

sur l’air de « en passant par RDF »

• Rendons à César …la palme des meilleures présentations sur ces questions épineuses -

– http://www.abes.fr/Media/Fichiers/Article-WEB/Journees-ABES/2010pps/LePape_FranceRDA02

– http://www.slideshare.net/ADBS/rda-le-nouveau-paradigme-du-catalogage-1-frbr-cest-quoi-dj

la suite ???

c’est maintenant !!!

Conception : Christine FleuryCadre d’intervention : formation proposée par l’ADBS (Domaine / zoom métiers / Bibliothèques )Thème : « Mutation des formats bibliographiques » - 29-30 Mai 2012 Cette présentation est placée sous licence Creative Commons