hub de métadonnées - jabes2014
Post on 22-Nov-2014
631 Views
Preview:
DESCRIPTION
TRANSCRIPT
Hub de métadonnées
Des données librespour des outils vides
#jabes14
hub@abes.fr
Les métadonnées sont déjà là !
• Dixit Maurits :« La grande majorité des éditeurs produisent des métadonnées et livrent ces métadonnées aux bibliothèques.
En conséquence, les systèmes de catalogage partagé s’orientent vers la possibilité de manipulation des flux de métadonnées provenant des éditeurs. »
20/05/2014 à 14h37
• Que faire ? Attendre que tout soit en MARC ?
marc marc marc
rdfABC
XYZ
Métadonnées éditeur natives
MARCde l’éditeur
MARCimporté dans
le Sudoc
MARCenrichi parle réseau
MARCexporté vers
les SIGB locaux
RDF exposé (2011-)
Sudoc
Open data
Open data
Métadonnées éditeur natives
MARCenrichi parle réseau
MARCexporté vers
les SIGB locaux
RDF exposé
Sudoc
KBARTMétadonnées éditeur modélisées en RDF et
enrichies
Métadonnées RDF enrichies par le réseau
et le hub
Hub
Open data
Open data
Open data
Outils / Données / Collaboration
• Le hub est un ensemble de méthodes et d’outils internes pour récupérer et partager des données fiables
• But :– Contribuer à un espace public de métadonnées ouvertes, à
l’échelle du web– Que chacun intègre ces données ouvertes dans ses propres
outils (dont le Sudoc)• Aujourd’hui :– Pas d’outil « hub » proposé à l’extérieur– Esquisse de collaboration avec le réseau Sudoc
Résumé
PÉRIODIQUES
La liste éditeur,à la lumière du registre ISSN
titre année min.
année max.
p-issn e-issn titre année min.
année max
p-issn e-issn ppn
1950-2000 1940-1949 1950-1979
1980-2000
1980-=?
?
Identifiant de notice dans le Sudoc
Initiatives de normalisation qui vont dans le même sens
PIE-J NISO 2013
KBART 2 2014
“will provide much-needed guidance on the presentation of
e-journals to publishers and platform providers as well as to
solve some long-standing concerns of serials librarians.”
❤
Enrichir les listes de périodiquesavec les métadonnées d’articles
titre année min
année max
p-issn e-issn ppn 1er volume
1er numéro
dernier vol.
dernier n°
1 1 77 4
<métadonnées d’articles en XML/>
etInversement
+
Métadonnées de bouquet= fichier KBART
BACON
publication_titl
e
date_first_issue_online
date_last_issue_online
print _identif
ier
online_identifi
er
num_first_vol_o
nline
num_first_issue_online
num_last_vol_online
num_last_issue_online
title_url
Notre tableau sert aussi à signaler dans le Sudoc
ajouter un exemplaire Licence Nationale et modifier la notice biblio du périodique :
207 $a Vol.1, n°1 (1914)-Vol.50, n°4 (1964)
titre année min
année max
p-issn e-issn ppn 1er volume
1er numéro
dernier vol.
dernier n°
URL
1914 1964 1 1 50 4
Zone 100 Zone 207
Les dates d’un e-journal ?
Signaler l’électronique pour gérer le papier
Aide au désherbage
titre année min
année max
p-issn e-issn ppn élec.
ppn papier
1er volume
1er numéro
dernier vol.
dernier n°
URL
1941 1964 1 1 50 4
L’argus des périodiques papier achetés dans ISTEX
PPN 2013* 2014* % désexemplarisé
03930986X 490 431 -12,04081633
039401588 582 540 -7,216494845
038846373 1057 985 -6,811731315
039309878 328 307 -6,402439024
069424985 207 194 -6,280193237
039322688 249 234 -6,024096386
039395596 1208 1136 -5,960264901
040093417 351 331 -5,698005698
036747645 316 300 -5,063291139
013359258 854 811 -5,035128806
038263882 60 57 -5
* en années-périodiques
RSC journals
ISTEX entre
décembre 2013
et mai 2014
Liste de périodiques commerciale
Liste de périodiques
conformes à ISSN
Liste des notices Sudoc : e-journals
Liste des notices Sudoc : revues
imprimées
Métadonnéesdes articles
Métadonnées des fascicules
Négociation
Sudoc PS : circuit denumérotation ISSN
Conservation
Conservation / états de collectionau niveau fascicule ?
Bases deconnaissance
Outils de découverte
Exemplarisationautomatique Sudoc
Passerelles
Web de données
Etablissements
CartoDoc elec. + ERE?
EBOOKS
Métadonnées éditeur natives XML
MARCenrichi parle réseau
MARCexporté vers
les SIGB locaux
RDF exposé
Sudoc
KBARTMétadonnées éditeur modélisées en RDF et
enrichies
Métadonnées RDF enrichies par le réseau
Hub
• Enrichissements– Auteurs IdRef– Indexation matière RAMEAU– Langue des résumés– ISBNs– …
• Première interaction avec le réseau : zone 309 et todo list dynamique
Recueils des coursde l’Académie de La Haye
309 ##$aLE(S) LIEN(S) AUTORITE AUTEUR RESTE(NT) A CREER. SUPPRIMER LA PRESENTE NOTE 309 UNE FOIS LA (LES) CORRECTION(S) EFFECTUEE(S)$bBRILL-RADI-LN$cche ppn 060964588 OU 084013885$d2014-04-09 11:15:01.894
Le hub fait ce qu’il peut puis laisse une todo list au réseau
PPN TEXTE CORPUS COMMANDE DATEIN ETAT.. Nombre de ppn total : 1177 .. .. .. .... Nombre de ppn réalisés : 111 .. .. .. .... Pourcentage de ppn realisés : 0.09 .. .. .. ..
176448683
LE(S) LIEN(S) AUTORITE AUTEUR RESTE(NT) A CREER. A TITRE INDICATIF, LE SYSTEME DE DETECTION AUTOMATIQUE SUGGERE PLUSIEURS PPN A DEPARTAGER. SUPPRIMER LA PRESENTE NOTE 309 UNE FOIS LA (LES) CORRECTION(S) EFFECTUEE(S)
BRILL-RADI-LN
che ppn 060964588 OU 084013885
2014-04-09 12:37:02.980 todo
176448691
LE(S) LIEN(S) AUTORITE AUTEUR RESTE(NT) A CREER. SUPPRIMER LA PRESENTE NOTE 309 UNE FOIS LA (LES) CORRECTION(S) EFFECTUEE(S)
BRILL-RADI-LN null
2014-04-18 09:02:33.475 todo
176448705
LE(S) LIEN(S) VEDETTE MATIERE RESTE(NT) A CREER. SUPPRIMER LA PRESENTE NOTE 309 UNE FOIS LA (LES) CORRECTION(S) EFFECTUEE(S)
BRILL-RADI-LN null
2014-04-18 08:48:18.551 todo
176448837
LE(S) LIEN(S) AUTORITE AUTEUR RESTE(NT) A CREER. A TITRE INDICATIF, LE SYSTEME DE DETECTION AUTOMATIQUE SUGGERE PLUSIEURS PPN A DEPARTAGER. SUPPRIMER LA PRESENTE NOTE 309 UNE FOIS LA (LES) CORRECTION(S) EFFECTUEE(S)
BRILL-RADI-LN che ppn 078858119
2014-04-09 12:37:37.500 todo
http://www.sudoc.fr/services/chantier/BRILL-RADI-LNtodo list
collective
Conclusions (1/2)
• Essayer de tenir ensemble: Automatique | Humain ABES | Réseau Adaptation à des outils précis | ouverture générique
• court terme : listes (KBART, ppn élec, ppn papier), notices• moyen terme : web de données
Différents niveaux de granularité• articles | chapitres | revues | livres
Gestion de la documentation électronique | Rigueur bibliographique
National | International • on travaille pour l’international• et l’international pour nous
Conclusions (2/2)
EnjeuSéparer fonction SGB
et fonction agrégation de métadonnées
Demain, les données seront toutes : • sur le web de données (RDF moyen et fin)
• Agrégation facilitée• Nous devons y contribuer !
• et/ou chez des sociétés spécialisées (data markets)• Ajouter de la valeur et du service au-dessus de données ouvertes
Open data
Pour des
SGB vides !
Questions pour la table ronde ?
• Quelle intensité et quelles formes de collaborations avec le réseau ? Quelles forces en central ? Des rôles différenciés reconnus pour certains établissements ? CollEx ?
• Sur quels corpus se concentrer ?– Archives (ISTEX)/courant– Revues/articles
• Quelles collaborations avec partenaires, fr et au-delà ?
Corpus Analyser l’offre
KBART SUDOC Désherber Modéliser Convertir Enrichir
Brill RADI & New Pauly
Brill revues*
Elsevier
Nature
RSC
OUP
IOP
http://www.licencesnationales.fr/istex-negociations-en-cours/
Etat des traitements en mai 2014
* Numérisation non achevée au moment du signalementSignature Décembre 2013
Signature Avril/Mai 2014
top related