etude sur l'évolution du ccfr dans l'environnement numérique

46
SARL AU CAPITAL DE 100 000 € RCS B 387472160 - APE 7022Z AGRÉMENT FORMATION : 11753245175 5 RUE AMBROISE THOMAS 75009 PARIS www.ourouk.fr TÉL : 01 44 82 09 99 FAX : 01 44 82 72 70 MÉL : [email protected] Etude sur l'évolution du CCFr dans l'environnement numérique Rapport final 28 juin 2013 votre contact : Dominique Cotte [email protected] - 01 44 82 09 99 réf. : Ourouk_CCfr_V1 46 pages

Upload: trinhminh

Post on 05-Jan-2017

221 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Etude sur l'évolution du CCFr dans l'environnement numérique

SARL AU CAPITAL DE 100 000 € RCS B 387472160 - APE 7022Z AGRÉMENT FORMATION : 11753245175

5 RUE AMBROISE THOMAS 75009 PARIS www.ourouk.fr

TÉL : 01 44 82 09 99 FAX : 01 44 82 72 70 MÉL : [email protected]

Etude sur l'évolution du CCFr dans l'environnement numérique

Rapport final 28 juin 2013

votre contact : Dominique Cotte [email protected] - 01 44 82 09 99 réf. : Ourouk_CCfr_V1 46 pages

Page 2: Etude sur l'évolution du CCFr dans l'environnement numérique

2

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

SOMMAIRE

Présentation de ce document 3

Méthodologie et conduite de la première phase de l’étude 4 Les entretiens 4 Les contacts à l’étranger 4 L’enquête technique 4

Le positionnement général du CCFr parmi les autres catalogues collectifs 6

Contexte et orientation générale 6 Typologie des catalogues étudiés 7 Les domaines couverts (périmètre) 9 Les approches techniques 10

La visibilité des catalogues dans le web 13 Recherches par l’identité du catalogue 13 Dissémination du catalogue collectif 14 Visibilité des catalogues collectifs dans Worldcat 14 Accès entre catalogues et rebonds 16

Les projets des catalogues collectifs dans le web de données 18 Un paysage assez inégal 18 Un début de connexions entre référentiels 19 Une stratégie à investir 19

Comparaison des grandes fonctionnalités 21 L’offre 21 La fourniture de données pour les logiciels bibliographiques 22 L’accès aux documents numérisés et numériques 23 Le positionnement du CCFr 24

Recommandations 25 Nature de nos recommandations 25 Les limites du contexte 25 Un croisement entre des enjeux fonctionnels et des périmètres 26 Les quatre grands axes de progrès 28 Les périmètres d’application 31 Calendrier prévisionnel 36 Un accompagnement par le marketing et la communication 36

Conclusion 38 Une vision de moyen terme 38

ANNEXES 39 Réponses reçues au questionnaire 39 Recensement des fonds numérisés par certaines bibliothèques 44

Page 3: Etude sur l'évolution du CCFr dans l'environnement numérique

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

Présentation de ce document Ce document constitue le rapport final de l’étude commanditée par le

service de la Coopération de la BnF (Catalogue Collectif de France) sur « l’évolution du CCFr dans l’environnement numérique ».

Il revient sur le déroulement des deux phases de l’étude et sur la méthodologie. Il présente les résultats du benchmark (phase 1) et nos recommandations pour les évolutions du CCFr (phase 2).

Les documents complémentaires indispensables pour comprendre la totalité du benchmark sont les présentations illustrées des comités de pilotage de fin de phase des 12 avril et 28 juin 2013 et leurs annexes (format powerpoint) ainsi que le fichier Excel du benchmark qui détaille toutes les fonctionnalités et l’offre de service, catalogue par catalogue.

Nous présentons ici une synthèse de l’ensemble de ces éléments.

Page 4: Etude sur l'évolution du CCFr dans l'environnement numérique

4

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

Méthodologie et conduite de la première phase de l’étude

Les entretiens

Au cours de la première phase ont été menés les entretiens suivants :

• Aline Girard

• Gildas Ilien

• Véronique Falconnet et Xavier Borda (deux réunions)

• Nicolas Couvant (deux réunions)

• Franck Bellugeon

• Catherine Dhérent

• Françoise Bourdon

• Catherine Neufond

• Romain Wenz et Agnès Simon

• Jérome Sirdey (entretien téléphonique)

• Florent Palluault (MCC)

• Raymond Bérard (Abes) entretien téléphonique

Les contacts à l’étranger

Il est relativement difficile d’identifier, à partir des seuls sites web, les coordonnées des personnes responsables des catalogues ou de tel ou tel aspect, par exemple technique. En phase 2 nous avons élargi avec des contacts donnés par la BnF.

Nous avons mené des entretiens téléphoniques avec :

Miriam Säftström et Martin Malsten (Bibliothèque royale de Suède – Libris),

Richard Wallis, consultant pour OCLC,

et un échange détaillé de courriels avec Maria-Jesus Lopez et Isabel Garcia Monge, du CCPB.

Un questionnaire en anglais (cf. annexe) a été adressé avec succès à la Bibliothèque nationale d’Australie (Debbie Campbell) et la Bibliothèque nationale de Nouvelle-Zélande (Karen Hannay).

L’enquête technique

La plupart des grands catalogues collectifs communiquent, soit sur leur site, soit lors de colloques ou réunions, soit dans des sites

Page 5: Etude sur l'évolution du CCFr dans l'environnement numérique

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

comme SlideShare, sur leur achitecture technique et fournissent des schémas (NLA, Trove…) ce qui nous a permis d’identifier les grands modèles technologiques utilisés.

Par ailleurs, deux réunions ont été organisées avec Nicolas Couvant pour une présentation détaillée.

Une rencontre a également eu lieu avec le chef de projet de la société Ever pour une information sur les limites techniques de l’outil actuel et les possibilités dans le futur en fonction des évolutions du logiciel.

Enfin nous avons mobilisé notre connaissance de l’état de l’art, notamment en matière de web de données.

Page 6: Etude sur l'évolution du CCFr dans l'environnement numérique

6

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

Le positionnement général du CCFr parmi les autres catalogues collectifs

Contexte et orientation générale

Notre benchmark ne vise pas seulement à comparer point par point les catalogues collectifs – dont nous verrons d’ailleurs ci-dessous qu’ils relèvent de familles différentes et à ce titre ne sont pas toujours strictement comparables -, mais aussi à replacer les configurations générales dans le cadre des évolutions prévisibles de la bibliothéconomie, de la bibliographie et des catalogues collectifs en tenant compte également de l’évolution générale du web et de l’environnement numérique.

En effet, indépendamment des comparaisons de traitement spécifiquement catalographiques, les points d’amélioration qui peuvent être visés par les différentes institutions s’inscrivent tous dans une tendance globale dont les éléments particuliers ont été notamment identifiés par la BnF et l’Abes dans le rapport de novembre 2012 pour le comité stratégique bibliographique1.

Les principaux points concernés par cette évolution sont :

• La possibilité d’accéder au document numérique en ligne, au-delà de la simple description dans les notices catalographiques

• Données bibliographiques fortement liées entre elles mais aussi avec des ressources externes

• La recomposition virtuelle de collections dispersées, l’écran devenant le « lieu » de consultation de pièces physiquement présentes dans des collections ou des établissements différents

• La participation des usagers, professionnels ou grand public, sous la forme d’un relais par les réseaux sociaux ou de tâches collaboratives permettant de vérifier (signalement des erreurs, propositions de corrections) voire enrichir le catalogue

Ces points – non exclusifs – peuvent être considérés comme des facteurs d’amélioration et donc constituer, même à grands traits, une « feuille de route » pour le CCFr, sachant, comme nous le montrerons plus loin, que les catalogues observés sont riches en projets mais que tous ne sont pas forcément beaucoup plus avancés à l’heure actuelle. Au plan institutionnel, les réalisations de data.bnf.fr pour les données, ou de Gallica pour l’accès au document numérique ou numérisé peuvent également être sources d’inspiration, leur proximité ouvrant évidemment des pistes de diversification et de collaboration sérieuses pour le CCFr.

1 http://www.bnf.fr/documents/rapport_csb.pdf

Page 7: Etude sur l'évolution du CCFr dans l'environnement numérique

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

Typologie des catalogues étudiés

Les dix catalogues étudiés ne sont pas tous comparables en termes de périmètre, d’offre de contenus, d’organisation, de technologies, et plus généralement de « philosophie ». Avant donc de rentrer dans le détail des éléments de comparatif, nous présentons ici les différentes « familles » de sites rencontrés.

Cette typologie croise l’offre générale de contenus avec la couverture géographique

Les sites nationaux à couverture

spécialisée

Certains sites peuvent être considérés comme des catalogues collectifs spécialisés, n’ayant pas vocation à interroger, comme le CCFr, à la fois des catalogues généraux (BnF, Sudoc), des catalogues de manuscrits, de bibliothèques municipales, un répertoire…

Seul dans cette catégorie, le CCPB (Catalogo Colectivo del Patrimonio Bibliografico Español) a une vocation purement patrimoniale et est « dédié aux imprimés anciens et matériaux spécifiques antérieurs au dépôt légal de 1958 » (Courriel de M.Jesus Lopez à Dominique Cotte, 25/03/2013)

Les réseaux nationaux

institutionnels

L’Australie, la Nouvelle-Zélande, la Norvège et la Suède pratiquent l’agrégation de catalogues des bibliothèques du pays soit par la saisie décentralisée dans une base commune, soit par le chargement régulier des catalogues des bibliothèques du réseau.

Dans certains cas (Australie, Suède), c’est à partir du site de l’institution mère que se fait directement la consultation du catalogue collectif.

On distinguera ici les réseaux nationaux institutionnels généralistes et ceux spécialisés comme Copac en Grande-Bretagne, réseau de l’enseignement supérieur et de la recherche, ou le Sudoc en France (hors benchmark, mais faisant partie des ressources du CCFr).

Les portails ou catalogues virtuels

(interrogation)

Le CHVK (catalogue suisse) et le GBV (Allemagne) sont essentiellement centrés sur l’interrogation de sources dispersées, avec une vocation « nationale » multilingue à l’échelle de la Suisse pour le CHVK et une vocation « régionale » (dans le contexte de l’organisation administrative allemande, de type fédéral) pour le GBV.

Au-delà de cette localisation, ces catalogues offrent peu de services et pas de contenus autonomes – en ce qui concerne le CHVK.

Le CCFr, Trove (Australie), Libris (Suède) et BiBsysAsk2 (Norvège) constituent également des portails, regroupant, dans le cas du CCFr, des catalogues multiples, représentant différents supports (Manuscrits, Imprimés…)

Les sites internationaux à couverture large

Il s’agit bien sûr ici de Worldcat, le seul de sa catégorie, qui couvre un ensemble de ressources embrassant les imprimés et les supports multimédia pour plus de 10.000 bibliothèques de tous

Page 8: Etude sur l'évolution du CCFr dans l'environnement numérique

8

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

types.

Worldcat n’a pas pour autant vocation à « aspirer » l’ensemble des catalogues nationaux.

La cohérence de l’échelon national

Il existe bien un périmètre national légitime et c’est une des orientations sur laquelle se reconnaissent un certain nombre d’institutions interrogées : il revient aux cultures nationales, via leurs organismes représentatifs, de présenter « leurs » données, aussi bien pour ce qui concerne les œuvres que pour les autorités ; chacun ensuite, dans une optique de linked data, pourra profiter de ces données et y ajouter des éléments complémentaires.

On peut par exemple considérer qu’un écrivain français ayant écrit, vécu ou voyagé en Italie ou en Grande-Bretagne soit légitimement « géré » par la BnF, en tant qu’institution nationale, et accessible via le CCFr, mais que les sites de recherche puissent aller récupérer dans d’autres catalogues ou d’autres applications des données « localisées » concernant tel ou tel épisode de la vie de cet écrivain.

Dans une optique « descendante », c’est également au niveau national que peuvent le mieux se fédérer des ressources locales dont la valeur sera d’autant plus grande qu’il s’agira de ressources uniques, spécifiques à un domaine ou à une région.

Visualisation du positionnement

Le schéma ci-dessous montre le positionnement des différents catalogues collectifs selon leur couverture, à la fois géographique et thématique.

Page 9: Etude sur l'évolution du CCFr dans l'environnement numérique

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

Les domaines couverts (périmètre)

L’analyse des dix catalogues montre un ensemble de domaines couverts (catalogues spécialisés ou institutions) au nombre de 8 :

• Catalogues généraux

o Institution nationale

o Bibliothèques universitaires et recherche

o Bibliothèques municipales

o Bibliothèques de musée

o Archives

o Archives du web

• Catalogues des manuscrits

• Autres ressources (répertoires des fonds et institutions)

Si aucun des catalogues étudiés n’agrège la totalité de ces offres, le schéma récapitulatif ci-dessous montre :

1) La relative dispersion des modèles, au-delà d’un noyau commun qui comprend a minima le catalogue général de l’institution mère et quelques autres bibliothèques

2) La bonne tenue du CCFr qui présente une offre relativement complète

3) La plus grande complétude en matière de catalogue général chez Trove.

Page 10: Etude sur l'évolution du CCFr dans l'environnement numérique

10

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

Les approches techniques

Nous distinguons trois grandes approches techniques, qui recouvrent également la distinction entre catalogues collectifs et catalogues coopératifs.

L’interrogation à distance

LE CHVK, le GBV et la Norvège avec Bibsys se limitent à interroger en direct un certain nombre de bibliothèques adhérentes, par le biais de protocoles comme le Z3950. On note, contrairement à ce qui se passe pour le CCFr, des temps de réponse qui ne pénalisent pas l’utilisateur. L’éditeur/intégrateur Ever Ezida impute ces temps de réponse au processus de dédoublonnage, mais d’autres catalogues collectifs dédoublonnent également les résultats de recherche.

La centralisation des données

Les catalogues comme Trove (100 millions d’enregistrement), Libris (Suède 6,5 millions), Copac, la Bibliothèque nationale de Nouvelle-Zélande et Worldcat centralisent les données sur une base unique, par moissonnage ou par livraison des catalogues. Il en va de même du CCPB (Espagne) qui est un catalogue consolidé par l’apport de nombreuses bibliothèques patrimoniales espagnoles.

Libris, est un catalogue collaboratif, car les bibliothèques suédoises saisissent directement leurs notices dans une interface déportée, à partir du logiciel Voyager.

Les approches mixtes :

Le CCFr est, le seul de sa catégorie, à proposer les trois approches combinée :

Page 11: Etude sur l'évolution du CCFr dans l'environnement numérique

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

centralisation partielle des données et

interrogation à distance

• centralisation pour ce qui est de la base Patrimoine,

• moissonnage pour une partie des données (lorsque les entrepôts existent) rapatriées depuis les bibliothèques participant au réseau,

• interrogation en Z3950 pour les autres sources, y compris les plus proches au plan institutionnel, puisque le catalogue de la BnF est également interrogé via le protocole Z3950.

Schéma récapitulatif.

Les limites techniques du CCFr

Les limites techniques du CCFr sont connues et tiennent pour l’essentiel à la nature de l’application utilisée : le logiciel Flora de la société Ever Ezida qui n’est pas utilisé par le CCFr pour ses fonctions de SIGB.

Les principaux problèmes identifiés sont :

• Les temps de réponse. Malgré des ajouts de capacités mémoires et une augmentation de la puissance des serveurs, il existe toujours des temps de réponse relativement longs,

• La déconnexion. Le temps de latence avant déconnexion va être à nouveau augmenté,

• Le blocage des cadres (frames) pour la version web. L’un

Page 12: Etude sur l'évolution du CCFr dans l'environnement numérique

12

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

des principaux mauvais effets de cette situation est la présentation d’un message de redirection (donc non signifiant) à l’internaute qui cherche le CCFr sur les moteurs de recherche, ainsi que l’impossibilité de présenter l’ensemble du catalogue et ses sous-parties à l’affichage dans les moteurs (cf. notre document d’annexes à la présentation du comité de pilotage du 12 avril 2013).

Des mesures pour contrer ces limitations techniques ont été prises par le service informatique, notamment l’augmentation de la capacité des serveurs, et le développement de sitemaps pour aider au référencement.

Une version de Flora sans frames et permettant l’exploitation des métadonnées sous forme de facettes est annoncée par l’éditeur pour la mi-2014.

On notera cependant que des extractions peuvent être faites dans n’importe quel format balisé : CSV, XML et dès lors on peut considérer que des extractions de la base de données pourraient être offertes dans le web, en dehors du site du CCFr proprement dit et de ses limites techniques dues à Flora.

Page 13: Etude sur l'évolution du CCFr dans l'environnement numérique

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

La visibilité des catalogues dans le web

Recherches par l’identité du catalogue

Autant que les barrières linguistiques (problème des signes diacritiques pour les langues nordiques) et techniques (accès aux versions nationales des moteurs de recherche, en fonction de nos identifications IP) nous le permettaient, nous avons testé la recherche directement sur la « marque » du catalogue collectif.

Le CCFr apparaît en première position dans Google.fr et dans Bing.fr

En revanche, le message offert est nettement moins performant que pour le catalogue allemand par exemple.

A l’inverse, on peut voir ce que donnent les nouveaux formats d’affichage qui intègrent une présentation détaillée du site et une fiche sur l’institution, avec ce résultat pour la Bibliothèque Municipale de Lyon.

Page 14: Etude sur l'évolution du CCFr dans l'environnement numérique

14

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

Dissémination du catalogue collectif

Un certain nombre de catalogues collectifs comme Trove, Copac ou encore Libris2 ont choisi de proposer aux bibliothèques adhérentes un widget qui leur permet de figurer en page d’accueil des sites de bibliothèques.

Ainsi, à côté de la recherche dans leur propre catalogue, ces établissements offrent directement la recherche dans le catalogue collectif.

A noter que dans deux cas au moins : Australie et Suède, l’accès au catalogue collectif est proposé de manière très visible depuis la page d’accueil de l’institution mère (BN).

Visibilité des catalogues collectifs dans Worldcat

Sudoc Les points suivants ont été fournis par les services informatiques de l’Abes, suite à un contact avec Martine Brunet3.

L’Abes ne dispose pas d’indicateurs Xiti qui permettraient de faire le même type de statistique que pour le rapport BnF/Worldcat.

Néanmoins elle sait voir quelles sont les visites qui viennent depuis

2 http://librishelp.libris.kb.se/help/download_eng.jsp?open=download 3 Directrice adjointe de l’Abes.

Page 15: Etude sur l'évolution du CCFr dans l'environnement numérique

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

un numéro Worldcat dit OCN.

On observe une moyenne annuelle d’environ 80.000 visites, pour un total de presque 19 000 000 de visites annuelles, soit une proportion de 0,4%. Par ailleurs, la visibilité des établissements eux-mêmes dans le Sudoc est loin d’être directe4

La séquence d’accès à un ouvrage à partir de Worldcat est la suivante :

- Interrogation dans le catalogue de Worldcat

- Affichage d’une liste de résultats, sans mention d’origine de la notice

- Parallèlement, affichage des bibliothèques où l’ouvrage est localisé

- Si la bibliothèque est adhérente au Sudoc, reroutage dans la page d’affichage du Sudoc (via le numéro de la notice)

- Accès par un lien à la notice dans le catalogue de la bibliothèque concernée

- Eventuellement, recherche par la bibliothèque du nombre de notices chargées dans Worldcat

Ce circuit devrait être allégé par la mise en place (annoncée au 1er semestre 2013 – cf. rapport d’activité 2012 de l’Abes) d’un lien profond (deep link) directement depuis Worldcat vers les systèmes locaux des établissements.

En 2012, 112 établissements sur les 157 adhérant au Sudoc sont dans Worldcat ; une dizaine d’établissements n’ont pas souhaité renouveler en 2012 leur participation.

4 http://documentation.abes.fr/guide/html/manuels/reseaux/worldcat/ch02s03.html

Page 16: Etude sur l'évolution du CCFr dans l'environnement numérique

16

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

BnF D’après les chiffres qui nous ont été communiqués, il y a eu, en 2012, 51.890 visites reroutées depuis Worldcat, sur un total de près de 5.000.000 de visites sur le catalogue (dont 666 000 en tout émanent de rebonds).

Par conséquent, Worldcat fournit :

• 1% du total des visites du catalogue général de la BnF

• 8% des visites à rebonds.

Par ailleurs, le coût de la conversion des notices pour leur exposition dans Worldcat est actuellement (hors valorisation des coûts humains intternes à la BnF) de 38 000 €uros annuels, ce qui donne un coût à la notice exposée de 1,36 €uros.

Accès entre catalogues et rebonds

D’une manière générale, les effets de rebonds entre catalogues collectifs ou des catalogues collectifs vers les institutions déjà très reconnues et très visibles dans le web sont relativement négligeables.

Nous avons déjà vu que Worldcat apportait 1% de ses visiteurs à la BnF, le CCFr lui, apporte 23.000 visites soit moins de 0,5% du total.

Le CCFr apporte 800.000 visites au Sudoc (par accès direct) pour 19.000.000 de visites totales soit environ 4%.

Il est clair que l’apport en notoriété et en facilités (techniques,

Page 17: Etude sur l'évolution du CCFr dans l'environnement numérique

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

méthodologiques…) est nettement plus impactant pour les petites bibliothèques ou les établissements spécialisés que pour les institutions par ailleurs reconnues.

Page 18: Etude sur l'évolution du CCFr dans l'environnement numérique

18

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

Les projets des catalogues collectifs dans le web de données

Un paysage assez inégal

Cinq des dix institutions observées énoncent une stratégie et des projets concernant la réutilisation de leurs données, la publication dans le web des données, une FRBRisation des notices, et de nouveaux services liés.

Il s’agit de Copac, OCLC, Libris (Suède), GVB (Allemagne) et Trove (Australie).

Certains de ces projets en sont encore au stade de l’annonce, de la définition d’une stratégie comme par exemple celui de la Suède.

On trouvera ensuite une gradation des projets, envisagés ci-dessous en correspondance avec les outils du web sémantique mobilisable :

- Projet de publication de listes d’autorité au format Skos pour le GVB

- Projets de publication dans le linked open data pour Copac et Trove

- Voire utilisation de schema.org pour publier les catalogues comme pages web annotées sémantiquement (OCLC).

Page 19: Etude sur l'évolution du CCFr dans l'environnement numérique

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

Un début de connexions entre référentiels

La publication des catalogues comme données ouvertes réutilisables est accompagnée d’investissements visant à connecter les données entre elles au travers de liens d’alignements de leurs identifiants (URI).

Ces travaux de connexion visent tout particulièrement les autorités matières et les autorités auteurs. Concernant les autorités auteurs, les travaux portent principalement à l’alignement des autorités de chacune des bibliothèques avec VIAF (Virtual International Authority File) géré par l’OCLC. Pour les autorités matières les travaux d’alignement portent principalement sur le LCSH (Library of Congress Subject Headings) de la Library of Congrès.

Le schéma ci-dessus illustre les travaux de connexion de données en cours ou prévus

Une stratégie à investir

Il est clair qu’il existe aujourd’hui un consensus autour de trois types de chantiers complémentaires dont l’objectif final est de construire un maillage de catalogues interopérables et ouverts :

• Des chantiers de publication des données des catalogues comme des données ouvertes et réutilisables respectant les standards du web sémantique

• Des chantiers de republication des notices bibliographiques selon un modèle FRBR pour offrir de nouveaux services de recherche et une meilleure valorisation des connaissances

Page 20: Etude sur l'évolution du CCFr dans l'environnement numérique

20

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

décrites dans les notices,

• Des chantiers de connexion des données entre les bibliothèques avec un focus sur l’alignement des autorités matières et personnes

Le CCFr participe de fait à ce mouvement puisque certains contributeurs comme la BnF sont des acteurs de ces projets. Le CCFr pourrait également y participer dans le cadre de son offre de services et d’assistance aux bibliothèques partenaires en proposant une assistance méthodologique, des formations, des retours d’expérience sur ces projets.

Page 21: Etude sur l'évolution du CCFr dans l'environnement numérique

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

Comparaison des grandes fonctionnalités

L’offre

Le standard L’univers des catalogues collectifs est marqué par un standard, celui qu’imposent désormais les outils de découverte, soit :

- une entrée dans le catalogue par une recherche simple, avec auto-complétion, le formulaire de recherche avancée étant positionné comme une seconde proposition de recherche ;

- des facettes de filtrage des résultats avec cette offre constante de discrimination : auteur, types de documents (y compris électroniques), période historique, année de publication, langue, sujet, géographie… ;

- la localisation, la disponibilité (y compris en ligne) des documents et la possibilité de les emprunter ou de les réserver ;

- le téléchargement de notices dans différents formats : fichier XML pour EndNotes, fichier au format BibTexT

- - Exemple des différents formats de publication des données

des notices pour réutilisation (site Copac)

L’ « expérience » proposée est donc inverse à celle de la recherche experte, qui mise sur l’érudition préalable du lecteur et sa maîtrise des outils de recherche. Aussi, l’offre de services de la plupart des catalogues collectifs consiste-t-elle en une « découverte » des résultats grâce aux facettes couplées à la recherche plein texte et à l’autocomplétion. Telle est celle que proposent Bibsys, GBV, Natlib, Libris, Trove et Worldcat – pour nous en tenir à l’échantillon retenu pour le benchmark – et de plus en plus de catalogues, collectifs ou non, d’universités ou de municipalités : RERO (catalogue collectif suisse), Harvard, Tours, Dauphine, Aberdeen, Birmingham… (BU), Rennes, Lyon… (BM), etc.

Les variations Cartouche de recherche simple, facettes de tri des résultats, localisation des documents et outils de gestion de bibliographies

Page 22: Etude sur l'évolution du CCFr dans l'environnement numérique

22

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

forment donc le socle commun des fonctionnalités, socle à partir duquel les catalogues distinguent leur offre en jouant notamment sur les éléments suivants :

- des facettes supplémentaires :

o facettes d’affinement de résultats par collections (NatLib), par bibliothèques (Libris), voire spécifiquement dédiées à la recherche de documents en ligne (Libris)

- des suggestions de recherche en regard de la liste de résultats (Libris, NatLib, Trove, WorldCat)

- l’ergonomie :

o facilité d’identification de l’ouvrage dans une liste de résultats par la présence (majorité des cas) ou non d’une vignette de la couverture de l’ouvrage

o facettes (difficilement) accessibles à partir d’un onglet plutôt qu’en colonne de droite (GBV)

o « date d’édition » sous forme graphique (histogramme) plutôt que de données chiffrées (Bibsys), par décennies (Bibsys, Trove) ou par années

o facilités de navigation dans la notice : segmentation par blocs d’information (auteur, titre, édition, année… / localisation en bibliothèque / taggage,…), blocs dépliants ou non, accessibles sous forme de fenêtre ou pas….

- l’éditorialisation de l’offre :

o images et articles de valorisation de l’offre dès la page d’accueil (Natlib) ou navigation dans le catalogue par rubriques (GBV, NatLib, Trove)

- l’ouverture sur le web :

o par rebond, la requête peut être lancée sur des sources extérieures au catalogue (Libris, Trove)

o la liste de suggestion des résultats propose des articles extérieurs au catalogue : article de wikipedia (Trove)

o feuilletage de l’ouvrage sur Google Preview (GBV, Libris…)

La fourniture de données pour les logiciels bibliographiques

Présenter les références bibliographiques dans des pages HTML ne permet pas une récupération automatisée des notices sélectionnées dans un outil personnel de gestion de références bibliographiques tel que EndNotes ou Zotero. Afin d'offrir aux utilisateurs des services de récupération des notices il convient de les republier selon différents formats. Un service avancé doit permettre de récupérer :

Page 23: Etude sur l'évolution du CCFr dans l'environnement numérique

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

a) la notice visualisée b) un ensemble de notices obtenu comme résultat d'une

recherche c) un ensemble de notices sélectionnées par l'utilisateur au fur

et à mesure de sa recherche et mises dans un "panier"

Dans les trois cas l'utilisateur dispose d'une fonction "récupération des notices" qui lui permet de sélectionner un format de fichier puis de demander la génération de ce fichier. Les formats de récupération mis à disposition pourraient être : - Endnotes - Zotero - Unimarc - RDF/Dublin Core En termes de réalisation technique deux options sont possibles: a) lors de la demande de l'utilisateur une requête est faite sur la base de données sur une ou plusieurs notices, un traitement de conversion des données est réalisé à partir d'une feuille de style XSLT, le fichier résultant est téléchargeable par l'utilisateur. Cette option permet de traiter la récupération de notices individuelles comme du résultat d'une sélection ou du contenu d'un panier. b) lors de la génération de la page HTML, un traitement de génération des différents formats de la notice est réalisé, en se basant sur une feuille de style XSLT. Cette méthode ne répond qu'au cas de récupération d'une notice individuelle, mais il est simple à mettre en place et à insérer dans le traitement de génération des pages HTML.

L’accès aux documents numérisés et numériques

L’accès aux documents numériques (périodiques, ebooks notamment) ou numérisés est une autre constante de l’offre : la plupart des catalogues distinguent soit a priori (recherche avancée) soit a posteriori (facettes) les documents accessibles en ligne.

Si la présence de documents électroniques dépend d’abord et avant tout de l’offre des catalogues inclus dans le catalogue collectif, ce dernier effectue cependant des choix propres, à commencer par celui d’inclure ou non (NatLib) dans sa propre notice le lien vers le document électronique.

Dès lors qu’il est effectué, un autre choix, où Trove s’illustre, consiste à plus ou moins valoriser les documents électroniques. Dans ce domaine, le catalogue collectif australien s’impose en s’efforçant de proposer, quelle que soit la requête, documents ou contenus en ligne (photos, journaux, cartes, sites…) sous forme de vignettes cliquables.

Outre la valorisation ou le signalement, l’autre choix qu’effectue un catalogue collectif consiste à proposer ou non, à défaut de l’accès à la totalité du texte, un lien vers une prévisualisation de l’ouvrage

Page 24: Etude sur l'évolution du CCFr dans l'environnement numérique

24

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

dans Google Preview (GBV, Libris). Mais il peut aussi opter pour la fermeture complète de l’accès aux documents, à l’exemple de Copac qui se contente de signaler les ressources, renvoyant systématiquement l’utilisateur vers un formulaire d’accès dès lors qu’elles sont électroniques. Il semblerait aussi qu’il puisse opter pour le signalement des seules ressources librement accessibles en ligne, à l’exemple de Bibsys qui pour les périodiques électroniques ne recense que ceux auxquels l’utilisateur puisse librement accéder.

Dans la majorité des cas cependant, les catalogues collectifs signalent tous les périodiques électroniques détenus par les catalogues sources et, lorsqu’ils sont sous droit, renvoient l’utilisateur vers le formulaire d’identification de l’éditeur ou du fournisseur, quitte à ce que le catalogue collectif soit lui-même fournisseur (WorldCat).

En ce qui concerne, enfin, le droit d’accès aux documents numérisés, l’étude n’a pu déterminer les raisons commandant à l’interdiction d’accès à des documents anciens et a priori libres de droits (réseau de bibliothèques Copac ou Hathi Trust).

Le positionnement du CCFr

Comparé point par point aux autres catalogues, le CCFr apparaît donc comme particulièrement bien positionné dans les fonctions de recherche avancée, celles qui nécessitent la maîtrise préalable par l’utilisateur des langages documentaires et une connaissance déjà fine de son domaine de recherche.

En revanche, dès lors qu’il s’agit de traiter les résultats de la recherche, son offre est en retrait sensible par rapport à celle de ses pairs étrangers : pas de facettes, un tri par dates ou ordre alphabétique qui n’est pas très performant, et pas de suggestions de recherche. Par le traitement même de ses résultats (qu’il fournit en limitant le nombre de résultats exposés, pour des raisons de performances), le CCFr n’incite pas à la découverte et s’adresse de fait à un public expert. Il est, comme les entretiens ont été plusieurs fois l’occasion de l’affirmer, « le catalogue de la dernière chance ». Non pas celui que le lecteur moyen utilisera en premier ressort, mais le catalogue du chercheur, du libraire spécialisé, du chartiste, du catalogueur ou du professionnel de l’information.

Page 25: Etude sur l'évolution du CCFr dans l'environnement numérique

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

Recommandations

Nature de nos recommandations

Nous prenons soin de présenter nos recommandations comme autant de projets, qui peuvent être menés de manière indépendante et ainsi contribuer à améliorer la place du CCFr dans l’environnement numérique sans attendre ni envisager un hypothétique « Big Bang », mais qui possèdent une grande cohérence entre eux et qui contribuent à une stratégie générale.

Chacun de ces projets contribuera à améliorer la configuration générale et constituera donc un facteur de succès pour les projets suivants. Notre hiérarchisation et gradation des projets à mener tient compte de cet effet d’entraînement et notamment de l’effet de notoriété que peut apporter le premier d’entre eux, afin de changer le regard sur le CCFr.

Il est important de souligner ici que, au-delà de la mise en œuvre fonctionnelle et technique de chacun de ces projets, le département de la Coopération et l’équipe du CCFr devront mettre en œuvre des actions de communication pour valoriser chacune des nouvelles étapes franchies.

Les limites du contexte

Contexte technique Nous avons bien pris en compte, dans la formulation de nos recommandations, les questions de faisabilité, et notamment la contrainte représentée par l’outil informatique et les aspects budgétaires. Compte tenu de l’adaptation très spécifique du logiciel Flora aux besoins du CCFr, l’utilisation de l’outil n’est pas remise en cause. De facto, nous pouvons distinguer entre les besoins de production et les besoins de publication ; les orientations proposées sont toutes réalisables en gardant la solution Flora comme socle pour le traitement et/ou la conservation des données, selon les catalogues considérés.

Contexte juridique La question de l’exposition, par le CCFr, de données qui ne lui appartiendraient pas dans le web a souvent été évoquée au cours des réunions.

Cette contrainte a également été prise en compte dans le classement des projets, puisqu’un des critères de sélection est l’autonomie du CCFr sur les données (cas du RNBFD notamment, à vérifier pour les données qui viennent de l’Abes).

Il importe de mesurer jusqu’où la question de la « propriété » des données peut être opposée par les bibliothèques partenaires à une exposition par le CCFr de son catalogue collectif dans le web de données (source : Lionel Maurel « Calimaq », intervention au GFII du 25 mars 2013).

En théorie, la « donnée brute » n’est pas appropriable, mais il est

Page 26: Etude sur l'évolution du CCFr dans l'environnement numérique

26

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

difficile de caractériser ce qu’est une donnée « brute », c’est-à-dire isolée et en dehors de tout appareillage. C’est pourquoi il existe un « droit des bases de données », opposable, qui applique à cet objet des règles de propriété intellectuelle.

En ce qui concerne les données de l’Etat, la directive 2003/98 du 17/11/2003 autorise la réutilisation des données publiques, y compris à des fins commerciales (mais pouvant donner droit à redevance dans ce cas).

Toutefois, on notera que l’article 11 de la circulaire du 26 mai 2011 appelant à rendre ouvertes les données publiques, prévoit un régime dérogatoire pour les établissements, organismes ou services culturels (de l’Etat) au nom de « l’exception culturelle » française5, et que par ailleurs les collectivités locales ne sont pas soumises à cette directive.

A l’heure actuelle les principaux litiges juridiques relevés concernent surtout la réutilisation à des fins commerciales des archives publiques (par des groupements de généalogistes notamment), mais pas concernant les bibliothèques.

Notre recommandation serait de négocier auprès de chaque établissement adhérent au CCFr la possibilité de réutiliser sous licence ouverte (Cco) les données de leur catalogue.

Dès lors que le CCFr – et au-delà, le département de la coopération de la BnF – jouerait un rôle de conseil et d’accompagnement dans ce monde nouveau, pour des bibliothèques qui y trouveraient une exposition et une visibilité inédites, l’ouverture des données sous l’égide du CCFr pourrait constituer un argument de négociation.

Un croisement entre des enjeux fonctionnels et des périmètres

Au service de l’objectif général qui est de favoriser l’évolution du CCFr dans le contexte de l’environnement numérique, nous dégageons quatre grands axes de progrès, qui s’appliquent eux-mêmes à des périmètres différents au sein de l’ensemble que constitue le CCFr.

Pour une part ces objectifs étaient déjà identifiés comme cible par l’équipe du CCFr et figuraient dans le descriptif de l’étude, pour une autre part, il s’agit d’éléments suggérés par le benchmark, en comparaison de ce que l’on peut voir comme éléments innovants sur certains des catalogues collectifs étudiés.

Délimitation des axes de progrès

Pour délimiter les axes de progrès, nous avons retenu les critères suivants :

• Il s’agit d’axes transverses, qui prennent une importance plus ou moins grande selon les périmètres auxquels nous proposons de les appliquer

• Ils sont compatibles avec le cadre technique en vigueur 5 Il conviendra toutefois de prendre en compte les évolutions en cours, qui ne sont pas entièrement stabilisées au moment de la rédaction de ce rapport, mais qui ont remis en cause cette distinction à partir des discussions de juin 2013 sur l’accord de libre échange UE-Etats-Unis.

Page 27: Etude sur l'évolution du CCFr dans l'environnement numérique

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

• Ce sont des actions dont la médiatisation aidera à renforcer la notoriété du CCFr

• Sur certains périmètres, ils peuvent être mis en place dans des délais courts

Les quatre grandes actions à mener sont :

• Rendre le CCFr plus visible dans le web

• Améliorer le repérage et l’accès aux documents numérisés

• Améliorer l’ergonomie et la navigation dans les pages du CCFr

• Associer le public à l’enrichissement des catalogues

Ces différentes actions prennent une ampleur et un sens différent selon les périmètres auxquels elles s’appliquent, en termes d’intérêt, de faisabilité, et de priorités dans le temps.

Délimitation des périmètres

Pour délimiter les périmètres d’application, nous avons retenu les critères suivants :

• L’information est détenue par le CCFr et sous son autorité (ou celui-ci constitue un unique point d’entrée)

• Elle possède un haut degré de complétude (voire elle est exhaustive)

• La mise en œuvre des axes de progrès est relativement facile

• Les efforts financiers pour les mettre en œuvre sont faibles

• L’exploitation marketing et en termes de communication promettent de forts impacts en termes de notoriété pour le CCFr

Les quatre périmètres retenus sont dans l’ordre :

• Le répertoire national des bibliothèques et des fonds documentaires (RNBFD)

• La base Patrimoine

• Les bases Manuscrits

• L’ensemble Imprimés et multimédia

Sélection des cibles en fonction des

critères

Page 28: Etude sur l'évolution du CCFr dans l'environnement numérique

28

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

Les quatre grands axes de progrès

Nous détaillons ci-dessous les actions pour chacun des axes de progrès identifiés.

1 – Une meilleure visibilité des

ressources du CCFr sur le web

Le CCFr souffre, entre autres, d’une mauvaise visibilité sur le web, comme on a pu le voir dans l’analyse de l’existant.

Cette mauvaise visibilité est en partie due à des obstacles techniques, comme le retard affiché par l’outil Open Flora de la société Ever dans la « webisation » de ses applications et l’usage de la technique des cadres (frames).

Mais elle est aussi imputable au fait que les données soient conservées dans des formats non accessibles aux moteurs de recherche, au sein des bases de données, que celles-ci soient « aux mains » du CCFr ou interrogées en temps réel dans le cadre du catalogue collectif.

Les solutions pour une meilleure visibilité passent donc par une mise à disposition des données dans des formats qui soient exploitables par les moteurs de recherche et qui permettent d’afficher facilement les informations.

Notre recommandation.

• Poursuivre la politique déjà entamée de mise en place de sitemaps pour favoriser le référencement des notices

• De manière variable selon les périmètres (voir ci-dessous) éditer les notices dans des formats favorisant leur référencement par les moteurs et leur exposition dans le web de données en particulier en leur attribuant des URI et en insérant dans la notice des métadonnées aux formats schema.org et OpenGraph (API de Facebook)

• Mettre à disposition, dans le cadre de la consultation des notices, des formats de données réutilisables pour des outils tels que EndNote, Zotero… ou pour une insertion dans un document

• Améliorer la communication du CCFr sur les sites « relais » comme Wikipédia en créant des pages pour chacune des bases et pas seulement pour le CCFr en tant que catalogue collectif

• Améliorer l’éditorialisation de la page d’accueil et des pages de contenu du CCFr pour améliorer le référencement naturel

2 – L’accès aux documents

numérisés et numériques

Comme cela a été souligné dans divers documents et études (Rapport de l’IGB de juillet 20116, CCTP de la présente mission), le public est aujourd’hui en attente d’un accès direct à la ressource et se contente difficilement d’une simple information catalographique et de l’énumération de ressources présentes sous la forme de listes bibliographiques. Il souhaite pouvoir facilement rebondir d’une

6 http://media.enseignementsup-recherche.gouv.fr/file/2011/86/1/Rapport.cat-coll.-V-25-11-2011_200861.pdf

Page 29: Etude sur l'évolution du CCFr dans l'environnement numérique

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

notice vers le document, être informé de l’existence ou non d’un fichier, que celui-ci soit un document numérique natif (livre numérique par exemple) ou numérisé a posteriori (manuscrits, livres, presse…)

La question posée dans le cadre de l’étude est de savoir jusqu’où on peut systématiser l’identification des ressources existantes et ensuite « automatiser » les traitements.

Il n’y a pas de réponse univoque à ces questions, plusieurs stratégies peuvent être menées.

En tout état de cause, les conditions requises pour que l’on puisse apparier des notices et des fonds sont les suivantes :

1. Que l’existence d’un document numérisé ait été signalée dans la zone adéquate (formats MARC) des notices ; ceci peut sembler trivial mais de nombreux projets de numérisation effectués par des bibliothèques appartenant au réseau sont menés comme des opérations ad hoc, sans lien avec le catalogue (cf. annexe)

2. Que les identifiants des documents numérisés présents soient normalisés, ce qui est le cas pour Gallica et pour les manuscrits avec l’identifiant Ark.

Dans tous les autres cas, il n’existe pas de méthode automatique permettant d’identifier s’il existe un document numérisé correspondant à la ressource.

L’expérience menée avec l’IRHT sur la Bibliothèque Virtuelle des Manuscrits Médiévaux (BVMM) montre que des outils peuvent aider à réaliser cet appariement mais qu’un contrôle manuel reste nécessaire pour valider l’alignement des références contenues dans les notices.

Les actions suivantes pourront être envisagées :

- Utilisation des zones de description Unimarc pour signaler la présence d’un document numérisé. Etablir un consensus sur une norme commune sur les champs utilisés et l’identification du document numérisé et son adresse web (ex. ARK)

- Partage d’un outil commun d’assistance au rapprochement en exploitant les enseignements de la méthode mise en place dans le cadre de la base Manuscrits

- Remonter l’affichage de l’information sur les documents numérisés dès la liste résultats dans le CCFr (cf. collage ci-dessous, dans le chapitre consacré à la navigation et à l’ergonomie)

Rôle d’accompagnement du CCFr. Le CCFr, afin de constituer les bases qu’il propose au public, joue un rôle d’accompagnement auprès de ses partenaires :

« Le service du CCFr est à disposition des porteurs de projets pour toutes les étapes décisives des opérations engagées, depuis l’analyse des collections, jusqu’à la mise en ligne des notices dans le CCFr, en passant par la formation ou le conseil ». (Falconnet V.,

Page 30: Etude sur l'évolution du CCFr dans l'environnement numérique

30

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

Sirdey J., Borda X., « Le catalogue collectif de France, pour quoi faire ? » BBf, 2011, n°2)

Ces actions se sont surtout exercées jusqu’à présent par rapport aux opérations de catalogage et de rétroconversion.

Nous proposons que cette expertise soit étendue à un accompagnement méthodologique dans leurs campagnes de numérisation, à l’instar de ce qui est fait pour les opérations de rétroconversion.

Les bibliothèques numériques sixième corpus ? Il existe dans Gallica 150.000 documents numérisés moissonnés à partir d’autres sources et qui ne sont pas catalogués dans le catalogue général de la BnF.

Ce corpus (tout comme d’autres bibliothèques numériques) peut faire l’objet d’un traitement spécifique : moissonnage des ressources et agrégation dans un entrepôt spécifique. De ce fait l’exposition de ces ressources prendrait place aux côtés des blocs existants (Patrimoine, Manuscrits, Imprimés, etc.), la recherche permettant dès lors de faire remonter directement des documents numérisés.

Accès aux documents numériques.

Par ailleurs, Gallica par exemple donne accès à des documents numériques signalés, avec accès sur des sites partenaires comme Numilog. Ce n’est pas de la vocation du CCFr de permettre l’accès aux ouvrages numériques ou aux e-books ; on se contentera donc, dans une optique plutôt patrimoniale, de favoriser l’accès aux documents numérisés.

3 – L’amélioration de l’ergonomie et

de la navigation dans le site du

CCFr

Aujourd’hui, l’arrivée sur la page d’accueil du CCFr ne rend pas particulièrement visible la promesse du site et de ses services, ni la richesse des ressources offertes, à l’inverse de ce que propose, de manière très simple et claire dans la page, par exemple Copac (« Search over 70 UK and Irish academic, national and specialist library catalogues ») ou Trove (« Find and get over 353,346,811 Australian and online resources : books, images, historic newspapers, maps, music, archives and more. »)

Les quelques éléments indiqués ci-après sont des pistes mineures en attendant de pouvoir engager (horizon deuxième semestre 2014) un projet de refonte du site web qui prenne en compte les éléments de la feuille de route d’Ever et anticipe sur les interfaces de recherche et de consultation modernisées souhaitables (par exemple positionnement des informations sur une carte géographique lorsque c’est utile)

- Mieux utiliser les infobulles sur le libellé des bases dans le frame de gauche (à l’heure actuelle elles reprennent simplement le libellé sans autre information)

- Documents numérisés et numériques déjà identifiés dans les catalogues : modifier l’ergonomie pour fluidifier l’accès aux documents numériques, en utilisant par exemple un pictogramme ou mieux une image du document numérisé.

- Indiquer directement au niveau du résultat de recherche que la

Page 31: Etude sur l'évolution du CCFr dans l'environnement numérique

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

ressource numérisée existe (voir le collage ci-dessous).

4 – La participation des publics à

l’enrichissement des catalogues

Le public du CCFr est un public d’experts, ce qui est souvent présenté comme participant du manque de notoriété. A l’inverse cette expertise est une richesse mobilisable, dans certaines conditions.

Dans les expériences étrangères observées lors du benchmark, on distingue notamment Trove qui applique des techniques de « crowdsourcing » notamment pour des corrections d’OCR sur la numérisation des organes de presse.

Dans le cas du CCFr nous n’aurons pas à faire à des opérations de numérisation de masse, mais au contraire, nous préconisons, y compris sur les périmètres importants comme la base Patrimoine ou plus tard, le catalogue Imprimés et multimédia, de distinguer des lots typiques, particuliers, à mettre en valeur dans le web de données. Dès lors, cette mise en visibilité de lots de notices qui ne sont pas toujours parfaites (mais pour des raisons qui peuvent parfaitement s’expliquer publiquement) peut susciter l’intérêt de communautés expertes qui peuvent apporter leurs lumières sur les sujets concernés.

Les points sur lesquels ce public spécialisé pourrait être sollicité sont :

- proposer des corrections sur les notices

- proposer des compléments de notices

- signaler l’existence d’une version numérique du document

(en effet, comme on l’a vu, l’identification de fonds numérisés suppose une approche plutôt manuelle, et l’enrôlement de collaborateurs nombreux peut permettre d’enrichir la connaissance de l’existence de ces fonds ou ressources).

Les périmètres d’application

Les périmètres d’application, qui correspondent à autant de projets, ont été classés par ordre de faisabilité et d’impacts en termes de notoriété, selon les critères déjà présentés ci-dessus.

1 – Le RNBFD Il s’agit de faire du RNBFD une véritable base de connaissances sur les richesses des bibliothèques publiques en France. En faire une vitrine du CCFr, de ses missions, de ses savoir-faire.

Avec ses 5000 notices de bibliothèques, 2000 notices de fonds et 290 fiches complètes, comprenant le descriptif de la bibliothèque et

Page 32: Etude sur l'évolution du CCFr dans l'environnement numérique

32

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

des n fonds qui lui sont attachés, le RNBFD constitue un outil précieux pour exposer et valoriser les ressources des bibliothèques françaises sur l’internet. Il conviendra d’étudier les rapprochements ou recoupements éventuels avec le répertoire plus extensif (17 000 bibliothèques et points lecture) mis à jour par le Ministère de la Culture et de la Communication.

En en faisant une sorte de « sous-site » du site du CCFr, publié dans des formats compatibles avec le référencement dans les moteurs de recherche et l’exposition dans le web de données (nous sommes ici relativement indépendants de la base de production sous FLORA), le CCFr obtiendrait plusieurs effets de notoriété :

• Mettre en avant un répertoire des bibliothèques et des fonds documentaires qui n’a pas d’équivalent en France

• Par ricochet, renvoyer régulièrement de ce site vers le site-père du CCFr et donc créer du trafic

• Montrer la capacité du CCFr à créer des produits en phase avec les technologies actuelles et des savoir-faire en matière de web de données

• Donner une occasion de communiquer, auprès de la communauté professionnelle, mais aussi au-delà (monde de la culture, érudits, lecteurs…)

Les actions à entreprendre sont les suivantes : A – Sur l’application proprement dite :

• En cours : référencement des pages via les sitemaps

• Refonte de l’ergonomie des fiches publiées, recherche à facettes, amélioration de la cartographie

• Enrichir les notices notamment en indiquant l’existence de fonds numérisés

• Attribution à chaque notice d’une URI

• Traduction des notices des fonds en anglais

• Publication d’une page web par notice avec métadonnées selon les modèles schema.org

• Publication de la notice dans des formats réutilisables (EndNote, Zotero…)

• Promotion de la réutilisation des données du répertoire en le publiant dans le site CCFr et dans le portail Etalab dans des formats ouverts (CVS, RDF/XML)

B – En parallèle

• Publication ou enrichissement d’une fiche Wikipédia par bibliothèque et par fonds en français et en anglais. La partie structurée de ces descriptions sera visible dans le web de données via fr.dpbedia.org et devrai donc alimenter le knowledge graph de Google.

A titre d’exemple nous montrons la façon dont le site britannique Copac propose la description des bibliothèques : sélection sur une carte, puis fiche structurée par établissement, avec photos et carte

Page 33: Etude sur l'évolution du CCFr dans l'environnement numérique

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

de géolocalisation.

2 – La base Patrimoine

Constituée sur la base de campagnes systématiques et successives de rétroconversion, la base Patrimoine constitue également un ensemble cohérent et complet (sur les tranches chronologiques 1700-1811, 1811-1914, 1914-1950), mais de

Page 34: Etude sur l'évolution du CCFr dans l'environnement numérique

34

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

qualité inégale compte tenu de la nature des matériaux d’origines intégrés dans l’application (fiches plus ou moins complètes, erreurs survenues lors des opérations de rétroconversion, etc.)

Ceci étant dit, la base Patrimoine est un réservoir potentiel mais le traitement systématique des 4,5 millions de notices n’a pas de sens. Nous estimons simplement, que, après le RNBFD, il s’agit là d’un deuxième corpus dont la mise en visibilité – au moins partielle – dans le web pourrait concourir au renforcement de la présence et de la notoriété du CCFr dans l’environnement numérique.

Cela suppose de pouvoir isoler des sous-ensembles cohérents, pas forcément très volumineux, mais qui font sens (selon des critères géographiques, chronologiques, ou thématiques, ou par auteurs…) afin de fournir des focus qui seront visibles sur le web.

Les effets attendus sont les mêmes que ceux espérés avec la mise en ligne du RNBFD, mais en approchant plus du cœur de données du catalogue puisqu’il s’agit cette fois directement de notices.

Par ailleurs, dès lors que l’on pourra isoler des fonds très spécifiques ou des auteurs très spécialisés, c’est un domaine sur lequel on peut valoriser l’axe de progrès n°4, l’enrichissement des ressources par les experts et le public.

Les actions recommandées sont également du même ordre :

- Refonte de l’ergonomie des fiches publiées, recherche à facettes, cartographie

- Enrichir les notices notamment en indiquant l’existence de ressources numériques

- Attribution à chaque notice d’une URI

- Publication d’une page web par notice avec métadonnées selon le modèle schema.org

- Publication de la notice dans des formats réutilisables (EndNote, Zotero…)

- Un fichier Sitemap a déjà été réalisé pour améliorer le référencement

A titre d’exemple, un lot de documents indexé par « Conflit mondial 1914-1918 » représente 3412 notices ; les notices indexées par « Préhistoire » entre 1750 et 1914 sont au nombre de 309.

On peut imaginer un usage qui serait de fournir des bibliographies géolocalisées, sur des sujets pointus, dans le web de données et qui pourraient être utilisées par des sites ou des organismes spécialisés dans les domaines concernés.

3 – Le catalogue des Manuscrits

Le sous-ensemble des Manuscrits a l’intérêt a) d’être exhaustif concernant l’accès aux ressources patrimoniales françaises dans ce domaine b) de susciter le double intérêt de communautés d’experts très pointus et du grand public (curiosité pour l’histoire, attrait pour les visuels, enluminures, etc. pour ce qui concerne les manuscrits anciens ou médiévaux).

Il s’agit donc d’un périmètre sur lequel on peut faire porter les actions générales répertoriées dans l’axe 1 (au moins pour les

Page 35: Etude sur l'évolution du CCFr dans l'environnement numérique

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

parties possédées en propre par le CFr).

- En cours : référencement des pages via les sitemaps

- A venir : - Développement et promotion d’une méthodologie et d’un outillage d’assistance au rapprochement de notices de catalogues et de fonds de documents numérisés (cf. expérience BVMM)

- Refonte de l’ergonomie des fiches publiées, recherche à facettes, cartographie, signalement des documents numérisés

- Attribution à chaque notice d’une URI

- Publication d’une page web par notice avec métadonnées selon le modèle schema.org

- Publication de la notice dans des formats réutilisables (EndNote, Zotero…)

- Promotion de la réutilisation des données du répertoire en le publiant dans le site CCFr dans des formats ouverts RDF/XML)

4 – Le catalogue Imprimés et Multimédias

Plus encore que le catalogue des Manuscrits, le catalogue Imprimés et Multimédia présente les caractères d’un catalogue collectif, dont les ressources sont indépendantes et localisées dans des applications spécifiques, le volume principal étant représenté par le catalogue général de la BnF (18 millions de notices) et celui du Sudoc, lui-même étant un catalogue général. On a pu voir par ailleurs que les accès au catalogue général de la BnF via le CCFr étaient faibles.

Dans cette configuration fonctionnelle et technique, l’accès se fait en recherche (via le protocole Z3950) et empêche a priori des traitements de mise en valeur sur le web. Il y a alors deux hypothèses.

La première consiste à rester dans le cadre actuel et à ne travailler que sur les axes d’amélioration de l’ergonomie, dans le cadre de la refonte générale du site du CCFr et de l’amélioration de la navigation dans les résultats, ainsi que sur l’axe d’un meilleur accès aux documents numérisés lorsque ceux-ci existent.

La deuxième hypothèse consiste à envisager la centralisation de l’ensemble des données sur une base de production, à l’instar de ce que font certains catalogues étrangers, et de créer une page web par notice pour les trente millions de notices, donnant ainsi une visibilité incontestable à l’ensemble des fonds auxquels le CCFr donne accès. Du simple point de vue des performances d’accès, cette solution permettrait d’améliorer les choses, et les capacités de FLORA à intégrer ce volume de notices ont été confirmées par l’éditeur.

Néanmoins, plusieurs questions se posent dans cette hypothèse :

- Par quel protocole et selon quelle méthode se ferait l’intégration à cette base des différents catalogues et surtout selon quelles procédures se feraient les mises à jour ?

- Quelle forme juridique et selon quel type de licences se ferait l’exposition des données par le CCFr ?

Page 36: Etude sur l'évolution du CCFr dans l'environnement numérique

36

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

C’est pourquoi nous ne poussons pas ce scénario en l’état actuel des choses, mais recommandons de travailler dans un premier temps sur les trois premiers périmètres afin de :

- Améliorer globalement la visibilité du CCFr

- Montrer ses capacités à développer des projets à valeur ajoutée dans le monde du web de données

- Intéresser les bibliothèques partenaires à des projets ou des expériences particulières sur ces sujets et sur la base de ces technologies

- Reprendre l’hypothèse d’une centralisation sur la base de ces acquis

Calendrier prévisionnel

Les propositions avancées en termes de projet ont été organisées par ordre de faisabilité ce qui exprime également un ordre chronologique et de priorité, tenant compte à la fois des logiques de faisabilité technique et de mobilisation des équipes.

Nous présentons ci-dessous une proposition de calendrier prévisionnel, sur un espace de cinq années.

Un accompagnement par le marketing et la communication

Les différentes actions proposées devront faire l’objet d’une communication régulière, aussi bien auprès du réseau des partenaires, de la communauté des bibliothèques au sens large que

Page 37: Etude sur l'évolution du CCFr dans l'environnement numérique

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

du grand public.

Outre l’alerte sur les nouveautés (refonte du RNBFD, amélioration des pages d’accueil du site…), des micro-événements pourront être organisés.

L’objectif est d’instaurer un cercle vertueux qui permettra :

- De faire parler des actions du CCFr

- De montrer qu’elles s’inscrivent dans des courants innovants, liés à la réutilisation et la connexion des données

- D’inspirer la confiance des partenaires sur cette capacité d’accompagnement du CCFr

- De démarcher ces partenaires pour d’autres actions, y compris en en prévoyant les retombées en matière de communication afin de boucler la boucle.

Page 38: Etude sur l'évolution du CCFr dans l'environnement numérique

38

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

Conclusion

Une vision de moyen terme

Les résultats du benchmark montrent que le CCFr n’est pas si mal placé parmi les grands catalogues collectifs, mais qu’il pâtit dans sa partie présentation et ergonomie, de handicaps techniques qui ne peuvent pas être levés immédiatement.

Par ailleurs, les évolutions des grands catalogues sont encore à venir. L’Abes, qui avait un temps envisagé de faire migrer le Sudoc dans le « cloud » a pour l’instant renoncé.

Compte tenu de la spécificité de la solution développée par Ever pour le CCFr les aménagements sont plutôt à apporter à l’offre de produits et services qu’à la restructuration de l’architecture de la solution.

C’est pourquoi, sur une période d’environ cinq années, le CCFr pourra développer, sous forme de pages web affichables dans les formats du web de données, des applications « satellites » susceptibles à la fois de rendre des services à la communauté, de produire des effets de notoriété pour le CCFr, et d’accroître les compétences en interne sur les nouvelles approches et nouveaux formats de publication des données.

Page 39: Etude sur l'évolution du CCFr dans l'environnement numérique

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

ANNEXES

Réponses reçues au questionnaire

1 – Nouvelle-Zélande.

Quelle est la stratégie globale suivie pour l’alimentation du catalogue collectif ? (Agrégation, interrogations simultanées) What is the global strategy for the constitution of the union catalogue ? (aggregation, crossed searching) The union catalogue is an aggregation of metadata from all types of libraries in New Zealand, excluding school libraries. It includes metadata from the National Library of New Zealand, public libraries, tertiary libraries and government libraries. Libraries input data into the union catalogue through a number of interfaces including the Cataloguing Client and WebCat forms.

Quel est le format de description utilisé ? UniMarc ? Xml EAD ? Pour quels types de documents ? Which descriptive format do you use ? uniMarc ? Xml ? Do you use EAD ? For what types of documents ? MARC-21

Quel protocole utilisez-vous pour interroger les catalogues distants : Z3950 ? SRU/SRW ? OAI-PMH ? Avez-vous l’intention de passer à SRU ? Which protocol do you use in order to search in distant catalogues : Z3950 ? SRU/SRW ? OAI-PMH ? Do you intend to adopt SRU/SRW ? Z39.50

Si vous centralisez les catalogues dans une base de données, quel est le logiciel utilisé ? In case of centralisation of data in a single database, which software do you use ? Ex Libris - Voyager

Avez-vous des éléments d’architecture technique à nous fournir (schémas ?) Are there technical elements and explanations which you could provide (schemas… ?)

MARC-21 + Ex Libris – Voyager

Avez-vous des déclinaisons de votre catalogue en application mobile ? Est-ce en projet ? Do you have mobile applications (iphone, ipad…) of your catalogue ? Are there plans for these ?

No

Pouvez-vous nous donner des éléments de volumétrie de vos catalogues, par support : imprimés, manuscrits, audiovisuel, autres ? Could you give us quantitative information on your catalogues : how many books and printed items, manuscripts, audiovisual, others ?

Page 40: Etude sur l'évolution du CCFr dans l'environnement numérique

40

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

There are 6 million books, magazines, CDs, maps, musical scores, websites and other digital material (published and unpublished) described on the NUC, and this number increases daily.

Qui sont vos principaux publics : chercheurs, étudiants, professionnels de la blibiothèque, grand public ? Which is your main users group : researchers, students, librarians, the general public ? Services are offered in two ways. One is through a subscription to Te Puna Services http://natlib.govt.nz/librarians/te-puna which is primarily aimed at librarians, although individual libraries may offer access to Te Puna Services to their own user groups via their website. The other way is through the New Zealand Libraries’ Catalogue http://nzlc.natlib.govt.nz/, a free database available to all including researchers, students and the general public.

Comment se fait l’accès au document numérique ? 1) Documents numérisés 2) Documents numériques natifs. Comment sont gérés les droits sur ces documents ? What kind of access is given to digital documents ? 1) Digitized documents 2) Born digital documents. Which rights policy is adopted ?

Link through to where item is stored, both for digitised and born digital documents. Conform to Copyright Act 1994 http://legislation.govt.nz/act/public/1994/0143/latest/DLM345634.html?src=qs and National Library of New Zealand Act 2003 http://legislation.govt.nz/act/public/2003/0019/latest/DLM191962.html?src=qs

Quelle est l’évolution prévisible du catalogue dans la perspective du « cloud » (= virtualisation des catalogues composant le catalogue collectif) ? How do you anticipate that the catalogue will change if some of its components go virtual (in the cloud) We are looking at a replacement of the Te Puna software and system. We are unable to predict where this will go but anticipate changes in workflow. It may not be hosted in New Zealand.

Quels sont vos projets en matière de publication des contenus des catalogues dans le web de données ? Quelles en sont les contraintes juridiques ? What plans do you have to publish datas from the catalogue in the web of data ? What are the main legal obstacles you find in this kind of project ? We have published a subset of data called Publications New Zealand http://natlib.govt.nz/about-us/open-data/publications-nz-metadata. The issue was that a very small number of records were derived from OCLC’s WorldCat database. We have sought and obtained their permission to include OCLC derived records. Through the relationship with OCLC we contribute all National Union Catalogue bibliographic records and holdings to WorldCat, so they are included in Google. We’re involved in NACO and SACO programmes and contribute New Zealand name authorities into these programmes and this data appears in VIAF.

Envisagez-vous une participation collaborative du public à la mise à jour des informations (commentaires, rating, aide aux corrections…) Are you planning shared input from the public for content updating (commentaries, rating, correction of data…)

No

Page 41: Etude sur l'évolution du CCFr dans l'environnement numérique

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

Y a-t-il un élément particulier qui distinguerait votre catalogue collectif, point fort ? What would be the main strength and distinguishing feature of your union catalogue ? The National Library has a long standing National Union Catalogue which was established as a card catalogue in the 1940’s and moved online in 1982. All universities and 99% of public libraries contribute records and holdings and it has an associated Interlibrary Loan feature.

We would be glad if you could provide any survey, report, public presentation which could help to complete our knowledge of your applications and activities. Customer Satisfaction Survey http://natlib.govt.nz/files/tepuna/te-puna-annual-customer-survey-2012.pdf

2 - Australie. • Quelle est la stratégie globale suivie pour l’alimentation du catalogue collectif ? (Agrégation,

interrogations simultanées) • What is the global strategy for the constitution of the union catalogue ? (aggregation, crossed

searching)

Our National Union catalogue service is part of the Libraries Australia suite: www.nla.gov.au/librariesaustralia/. Since commencement of operation in 1981, the National Union Catalogue has operated on an aggregation model. Records are added to the service both in batch mode (the Record Import Service) and direct via online cataloguing. • Quel est le format de description utilisé ? UniMarc ? Xml EAD ? Pour quels types de documents ? • Which descriptive format do you use ? uniMarc ? Xml ? Do you use EAD ? For what types of

documents ?

The NUC exchanges records in MaRC21, and recently added support for RDA (Resource Description and Access). It exports records in MARCXML. The National Library has created a few finding aids in EAD, but this is not a large quantity. Most Australian libraries use collection level MaRC 21 records plus a separate finding aid (some in EAD) for their archival collections. • Quel protocole utilisez-vous pour interroger les catalogues distants : Z3950 ? SRU/SRW ? OAI-

PMH ? Avez-vous l’intention de passer à SRU ? • Which protocol do you use in order to search in distant catalogues : Z3950 ? SRU/SRW ? OAI-

PMH ? Do you intend to adopt SRU/SRW ?

The NUC has supported the Z39.50 protocol for two decades. The NUC also supports records contributed using OAI-PMH, which are converted to MaRC before being stored in the database. The National Library also operates another service called Trove, http://trove.nla.gov.au, which is also based on an aggregation model. It uses OAI-PMH extensively to support harvesting nationally and internationally. Trove does make some but not all records available using the SRU protocol: www.nla.gov.au/apps/srw/search/peopleaustralia. • Si vous centralisez les catalogues dans une base de données, quel est le logiciel utilisé ? • In case of centralisation of data in a single database, which software do you use ?

Page 42: Etude sur l'évolution du CCFr dans l'environnement numérique

42

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

For the NUC, we use the CBS software provided by OCLC Leiden. A separate search interface runs on top of this, which we are currently replacing with the Solr/Lucene software (see www.nla.gov.au/librariesaustralia/category/search-redevelopment/). Trove already uses Solr/Lucene.

• Avez-vous des éléments d’architecture technique à nous fournir (schémas ?) • Are there technical elements and explanations which you could provide (schemas… ?)

There is a technical architecture at: www.nla.gov.au/librariesaustralia/about/la-architecture-diagram/. Libraries Australia supports MaRC21 and RDA. In addition to these, Trove supports qualified Dublin Core and EAC-CPF (Encoded Archival Context for Corporations, People and Families). • Avez-vous des déclinaisons de votre catalogue en application mobile ? Est-ce en projet ? • Do you have mobile applications (iphone, ipad…) of your catalogue ? Are there plans for these ?

There are plans to produce a version of the Trove interface for mobile devices, including iPads. We are currently redeveloping the interface for digitized newspapers which will work with these devices. We have no plans to produce an app for Libraries Australia or Trove. • Pouvez-vous nous donner des éléments de volumétrie de vos catalogues, par support :

imprimés, manuscrits, audiovisuel, autres ? • Could you give us quantitative information on your catalogues : how many books and printed

items, manuscripts, audiovisual, others ?

Records in Libraries Australia as at 31 December 2012 for: Books - 18,351,453 Printed music – 463,282 Manuscript music – 26, 166 Printed maps – 363510 Manuscript maps – 6,900 Project media – 592,718 Non-musical sound recordings – 264,600 Musical sound recordings – 511,801 2 dimensional images – 526,257 Computer files – 1,071,368 Kits – 26,160 Mixed material – 8,720 3 dimensional artefacts – 9,379 Manuscripts including theses – 119,789 Serials – 2,016,317 The NUC contains 23 million bibliographic records and 50 million holdings in total. That includes 1.3m records in non-Roman script such as Chinese, Cyrillic, Devanagari, Georgian, Greek, Hebrew, Japanese, Korean, Tamil and Thai.

Page 43: Etude sur l'évolution du CCFr dans l'environnement numérique

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

• Qui sont vos principaux publics : chercheurs, étudiants, professionnels de la bibliothèque, grand

public ? • Which is your main users’ group : researchers, students, librarians, the general public ?

The principal users of the National Union Catalogue are libraries, as the service suite is primarily made available to support the workflows of librarians. The principal users of Trove are the general public. • Comment se fait l’accès au document numérique ? 1) Documents numérisés 2) Documents

numériques natifs. Comment sont gérés les droits sur ces documents ? • What kind of access is given to digital documents ? 1) Digitized documents 2) Born digital

documents. Which rights policy is adopted ?

As both Libraries Australia and Trove are aggregations describing documents in collections held elsewhere, they observe the access rights assigned to each item by the host organisation or the owner. We encourage this information to be included in each record. Trove also includes digitized newspapers, with 9 million pages digitised at April 2013. These are only provided up to 1954 because they are considered public domain under Australian copyright provisions. • Quelle est l’évolution prévisible du catalogue dans la perspective du « cloud » (= virtualisation

des catalogues composant le catalogue collectif) ? • How do you anticipate that the catalogue will change if some of its components go virtual (in

the cloud)

The aggregation model behind the NUC is unlikely to change. As other libraries move their catalogues to cloud services, data exchange processes and workflows may change. We anticipate that Australian libraries will prefer to use cloud-based services that host their data in Australia. The staff resource required to support the service would likely change its composition, for example, there may be a greater need for contract negotiation skills. • Quels sont vos projets en matière de publication des contenus des catalogues dans le web de

données ? Quelles en sont les contraintes juridiques ? • What plans do you have to publish datas from the catalogue in the web of data ? What are the

main legal obstacles you find in this kind of project ?

Most of the Libraries Australia data (the NUC) is provided to WorldCat and is syndicated by OCLC to other web services. The NUC records are also copied to Trove, and with other data aggregated by that service, all records are published via the Trove API, at http://trove.nla.gov.au/general/api. • Envisagez-vous une participation collaborative du public à la mise à jour des informations

(commentaires, rating, aide aux corrections…) • Are you planning shared input from the public for content updating (commentaries, rating,

correction of data…)

Yes, in Trove, there is extensive capability for the general public to correct OCRd text, add comments and ratings, merge record displays, and create lists of resources of interest to themselves. We have no plans to add such services to Libraries Australia.

Page 44: Etude sur l'évolution du CCFr dans l'environnement numérique

44

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

• Y a-t-il un élément particulier qui distinguerait votre catalogue collectif, point fort ? • What would be the main strength and distinguishing feature of your union catalogue ?

The NUC is unique because of its longevity – it has been built and maintained by Australian libraries for over 30 years. Its national coverage of holdings from more than 650 libraries from all sectors: national, state/territory (=provinces), public, university, government and other special libraries. Trove was built on the commitment to resource sharing and collaboration from those libraries. The level of the use by the public is extraordinary – it is used by almost 80,000 people every day. We would be glad if you could provide any survey, report, public presentation which could help to complete our knowledge of your applications and activities. There is a large number of reports about Libraries Australia and Trove here: www.nla.gov.au/librariesaustralia/about/advisory-committee/papers-and-previous-meetings/. The project which developed Trove is described here: https://wiki.nla.gov.au/display/LABS/2.+Trove. There are public presentations here: http://trove.nla.gov.au/general/more-about-trove/.

Recensement des fonds numérisés par certaines bibliothèques Nous avons mené par échantillonnage une petite enquête, sans prétention exhaustive, à partir des sites web d’un certain nombre de bibliothèques participant au CCFr. Le critère était d’identifier ce qui apparaît en page d’accueil et concerne l’offre de documents numérisés.

Cette analyse montre plusieurs éléments intéressants :

a) Dans de nombreux cas, les bibliothèques commencent par numériser des éléments remarquables, et visuels (des photographies, des estampes…) puis des manuscrits, parfois des livres anciens, mais très rarement des ouvrages

b) Les fonds numérisés sont en général peu nombreux et concernent la mise en valeur d’objets rares ou insolites (les menus de la bibliothèque de Dijon par exemple)

c) Pour ces raisons, ces fonds sont rarement décrits dans le catalogue et donc tout rattachement au CCFr est impossible

d) On se situe plus dans une approche de type « exposition virtuelle » que de véritable bibliothèque numérique

(Figurent en grisé les types de documents rentrant dans le périmètre du CCFr).

Bibliothèque Titre Nature

LYON

Livres anciens 7347 livres anciens

Affiches 1000 pièces

Marques de provenance des livres anciens

1106 marques

Archives de Pierre Charnier Fonds Fernand Rude

Page 45: Etude sur l'évolution du CCFr dans l'environnement numérique

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

Manuscrits mérovingiens et carolingiens

55 manuscrits

Presse lyonnaise de 1790 à 1944

Plusieurs dizaines de titres de presse numérisés

Enluminures 7926 enluminures

Photographes en Rhône-Alpes 30123 photos publiées

Estampes 6162 estampes

Photographies 225 photographies

GRENOBLE Patrimoine numérisé

Manuscrits de Stendhal

Manuscrits de Stendhal : vie de Henri Brulard

Manuscrits de Stendhal : journaux

Manuscrits médiévaux

CHAMBERY Cartes de Savoie en ligne

Bréviaire de Marie de Savoie

LIMOGES

Bibliothèque numérique Le Graduel de Fontevrault

Portraits limousins Estampes sur des personnages locaux

137 ans de presse limousine 8 titres numérisés de 1810 à 1947

Estampes de Charles Giroux

Les Heures de Peyre de Bonetos

Manuscrit du 15° siècle

Le manuscrit de Limoges Livre d’orgue manuscrit du 18° siècle

BORDEAUX Bibliothèque numérique bordelaise

Histoire de Bordeaux

Œuvres de Montesquieu

Partitions musicales

SAINT-ETIENNE Bibliothèque numérique

Collection Benoit Malon

Manuscrits médiévaux 5 livres d’heures

Arts des mines

Histoires de Saint-Etienne

Textes foréziens célèbres

Revues foréziennes

Jansénisme

BOURG-EN-BRESSE Collections intégrales Fonds Gustave Doré

Fonds Louis Dupasquier

Fonds Roger Vaillant

Fonds Vicaire

RENNES METROPOLE Bibles, livres d’heures, Total de 6900 images

Page 46: Etude sur l'évolution du CCFr dans l'environnement numérique

46

Ourouk – Rapport d’étude CCFr – 28 juin 2013 – V1

ouvrages religieux

Littérature

Recueils encyclopédiques, armoriaux, documents juridiques

Calendriers, autres documents

DIJON Archives et manuscrits

Images dijonnaises

Manuscrits de Cîteaux 80 manuscrits mis en ligne

Images dijonnaises 2877 images

Collections de menus 5000 menus numérisés sur une collection de 9200 menus