cahier des clauses techniques...

24
Marché à procédure adaptée N° 2010-15 CAHIER DES CLAUSES TECHNIQUES PARTICULIERES établi en application de l'article 28 du code des marchés publics Etablissement : Bibliothèque nationale et universitaire de Strasbourg 5 rue du Maréchal Joffre BP 51029 67070 STRASBOURG CEDEX Objet du marché : Bibliothèque numérique : acquisition d'un outil de gestion électronique de document (GED), d'une chaîne de numérisation et de prestations associées L'entreprise soussignée reconnaît avoir pris connaissance des pages du C.C.T.P. numérotées de 1 à 24 (date, cachet, signature) Le présent C.C.T.P. fait référence au cahier des clauses administratives générales applicables aux marchés publics de fournitures courantes et services (C.C.A.G. - F.C.S.) Il comporte 26 feuillets numérotés de 1 à 24

Upload: lamdung

Post on 10-Sep-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

Marché à procédure adaptée

N° 2010-15

CAHIER DES CLAUSES TECHNIQUES PARTICULIERESétabli en application de l'article 28 du code des marchés publics

Etablissement : Bibliothèque nationale et universitaire de Strasbourg

5 rue du Maréchal Joffre

BP 51029

67070 STRASBOURG CEDEX

Objet du marché : Bibliothèque numérique : acquisition d'un outil de gestion électronique de document (GED), d'une chaîne de numérisation et de prestations associées

L'entreprise soussignée reconnaît avoir pris connaissance des pages du C.C.T.P. numérotées de 1 à 24

(date, cachet, signature)

Le présent C.C.T.P. fait référence au cahier des clauses administratives générales

applicables aux marchés publics de fournitures courantes et services (C.C.A.G. - F.C.S.)

Il comporte 26 feuillets numérotés de 1 à 24

BNU Projet Bibliothèque numérique - GED DSI-DCP

Table des matièresArticle 1:OBJET DU MARCHE.................................................................................................4Article 2:DESCRIPTION DU MARCHE...................................................................................4Article 3:CONDITIONS TECHNIQUES PARTICULIERES AU PRESENT MARCHE.......4

3.1.Contexte ..........................................................................................................................4 3.1.1La Bibliothèque nationale et universitaire de Strasbourg.........................................4 3.1.2La numérisation à la BNU .......................................................................................5

3.2.Attendus techniques .......................................................................................................7 3.2.1Les données..............................................................................................................7

Volumétrie et accroissement :.......................................................................................7Typologie des documents originaux :...........................................................................8

3.2.2Typologie des formats informatiques ......................................................................8Critères de choix...........................................................................................................9

3.3. Structure de la base (classification)................................................................................9 3.4.Spécifications techniques : import, traitement et stockage des objets..........................10

3.4.1 Import et formats des fichiers numériques ...........................................................10 3.4.2Contrôle qualité .....................................................................................................10 3.4.3Formats ..................................................................................................................10 3.4.4Nommage des fichiers............................................................................................11

Fonctionnement général :............................................................................................11Reprise de l'existant :..................................................................................................11Modification ultérieure :.............................................................................................11

3.4.5 Archivage...............................................................................................................11 3.5.Métadonnées et identifiants...........................................................................................12

3.5.1Acquisition des métadonnées.................................................................................12 3.5.2Attribution d'identifiants pérennes..........................................................................13 3.5.3Relations métadonnées / documents.......................................................................13 3.5.4Texte intégral..........................................................................................................13 3.5.5 Contrôle qualité.....................................................................................................13

3.6.Moteur de recherche......................................................................................................13 3.6.1Fonctions de recherche...........................................................................................14 3.6.2Présentation des résultats........................................................................................14

Généralités.................................................................................................................14 Affichage abrégé........................................................................................................14 Affichage détaillé.......................................................................................................14 Exploitation des résultats...........................................................................................15Export..........................................................................................................................15 Fonctionnalités avancées...........................................................................................15

3.7.Spécifications techniques : diffusion ............................................................................15Export vers CMS.........................................................................................................16

3.8.Module optionnel pour le PEB dématérialisé ...............................................................16 3.9.Moteur de workflow (automatisation des processus)....................................................16 3.10.Administration de l'outil..............................................................................................17

3.10.1 Utilisateurs ..........................................................................................................17 3.10.2 Statistiques ..........................................................................................................17

Cahier des clauses techniques particulières 2 Marché n° 2010-15

BNU Projet Bibliothèque numérique - GED DSI-DCP

3.10.3 Formation ............................................................................................................18 3.10.4Maintenance .........................................................................................................18

Article 4:ANNEXES ................................................................................................................19 4.1. Liste des programmes de numérisation de la BNU .....................................................19 4.2.Système de nommage des répertoires et fichiers ..........................................................20 4.3. Le standard ARK ........................................................................................................21 4.4.Schéma XML des métadonnées d'archivage PAC/SIP du CINES................................22 4.5. Modèle de fichiers METS............................................................................................22 4.6.Tableau de correspondance de UNIMARC vers Dublin Core .....................................22 4.7.Tableau à remplir par le soumissionnaire......................................................................24

Cahier des clauses techniques particulières 3 Marché n° 2010-15

BNU Projet Bibliothèque numérique - GED DSI-DCP

Article 1: OBJET DU MARCHELe présent marché a pour objet la fourniture d'un logiciel de gestion électronique de documents (GED), de prestations d'installation et de transfert de compétences à la Bibliothèque nationale et universitaire de Strasbourg selon les modalités définies dans le cahier des charges.

Article 2: DESCRIPTION DU MARCHELe présent marché se compose d'un seul lot pour la fourniture du logiciel de GED1 ou DAM2, création d'un workflow de numérisation (automatisation des processus pour la chaîne de numérisation) et la prestation associée.

Article 3: CONDITIONS TECHNIQUES PARTICULIERES AU PRESENT MARCHE

Le présent cahier des clauses techniques particulières (C.C.T.P.) a pour objet l'acquisition par la Bibliothèque nationale et universitaire de Strasbourg (BNU) d'une solution logicielle de bibliothèque numérique, couvrant la gestion des processus de numérisation, le traitement des données numérisées, la gestion du stockage de ces données, leur recherche et leur diffusion.

3.1. Contexte

3.1.1 La Bibliothèque nationale et universitaire de StrasbourgPremière bibliothèque de l'enseignement supérieur français, la Bibliothèque nationale et universitaire de Strasbourg assume plusieurs missions : bibliothèque de recherche en sciences humaines et sociales au service de la communauté universitaire dans un contexte en pleine évolution, elle a aussi une forte vocation régionale et un rôle patrimonial éminent ; elle est en même temps une bibliothèque publique ouverte sur la cité, dont les dimensions européennes et numériques se développent activement.

Parmi ses projets majeurs : une bibliothèque numérique dans le cadre du contrat quadriennal 2009-2012, et un grand projet architectural de modernisation et d'extension (BNU Nouvelle) confié à l'Agence Nicolas Michelin et Associés (Paris). Les collections patrimoniales de la BNU comportent environ 1,1 million d'ouvrages antérieurs à 1920 (dont plus de 220 000 ouvrages antérieurs à 1810 et plus de 2 000 incunables), plus de 5 000 papyrus, 6 700 manuscrits, 39 000 monnaies, 54 000 cartes et 120 000 documents iconographiques. La numérisation du patrimoine dont elle est la gardienne est pour la BNU une activité régulière depuis une quinzaine d'années. Elle entend aujourd'hui développer une politique plus ambitieuse dans ce domaine, à des fins de préservation, de diffusion et d'exploitation scientifique de ses collections, dans un souci de coordination avec les initiatives existant en France comme à l'étranger.

A cet effet, la BNU souhaite se doter en 2010 de divers outils :

• un nouveau site web, fondé sur le CMS Drupal ;

1 Gestion éléctronique de documents2 Digital Asset Management

Cahier des clauses techniques particulières 4 Marché n° 2010-15

BNU Projet Bibliothèque numérique - GED DSI-DCP

• un appareil de numérisation, ou scanner, destiné à la numérisation de ses documents patrimoniaux, particulièrement fragiles ;

• un outil de gestion de workflow de numérisation et de gestion de bibliothèque numérique, qui fait l'objet du présent cahier des charges.

Un nouveau service, le service de la Bibliothèque numérique, sera créé en septembre 2010 pour piloter l'ensemble du processus opérationnel de la numérisation à la BNU. Ce service sera intégré à la Direction de la conservation et du patrimoine.

3.1.2 La numérisation à la BNU

La BNU poursuit une politique de numérisation de ses collections depuis une quinzaine d'années. La première initiative a été dans les années 1990 la réalisation d'un vidéodisque consacré aux images d'Alsace. Les contenus de ce vidéodisque, soit plus de 30 000 images, sont aujourd'hui accessibles en ligne sur la bibliothèque numérique de la BNU.

Outre la numérisation effectuée suite à des demandes de reproduction émises par des lecteurs, plusieurs programmes portant sur la numérisation de corpus spécifiques ont été menés au cours de la décennie 2000-2010 :

• Manuscrits de la Mystique rhénane : 23 manuscrits médiévaux, 2 incunables, soit 9 000 images.

• Monnaies alsaciennes : 5 000 monnaies, soit 10 000 images.

• Cartes alsaciennes : 2 500 cartes

• Ouvrages alsatiques de référence : une centaine de titres des 18e-20e siècles, environ 20 000 pages.

D'autres programmes sont menés en partenariat avec des organismes extérieurs :

• Cartes du Rhin supérieur : dans le cadre du réseau EUCOR

• Enluminures et manuscrits médiévaux : dans le cadre d'un programme mené par l'Institut de Recherche et d'Histoire des Textes (CNRS)

• Journaux de tranchées de la Première Guerre mondiale : dans le cadre d'un partenariat avec la Bibliothèque nationale de France et la Bibliothèque de documentation internationale contemporaine à Paris-Nanterre (2009-2012)

• Presse protestante : dans le cadre du partenariat Pôle Associé de la BnF

• Papyrus : en collaboration avec la Maison interuniversitaire des sciences de l'homme d'Alsace (MISHA).

La BNU entend aujourd'hui développer fortement ce pan de son activité, suivant trois axes principaux :

Cahier des clauses techniques particulières 5 Marché n° 2010-15

BNU Projet Bibliothèque numérique - GED DSI-DCP

• assurer la préservation du patrimoine régional et national, par une reproduction de ses collections sur support numérique ;

• diffuser ses richesses documentaires au plus large public, en visant principalement les publics universitaires et scientifiques, au moment où l'opération BNU Nouvelle imposera la fermeture du bâtiment principal pour plus de trois années ;

• renforcer l'exploitation scientifique de ses collections via des projets communs avec les acteurs scientifiques locaux, régionaux et nationaux. Il est à noter ici qu'une répartition des responsabilités entre la BNU et l'Université de Strasbourg a été déterminée dans le cadre des contrats quadriennaux respectifs des deux établissements : la BNU est positionnée comme chef de file sur la numérisation et le patrimoine.

La logique de numérisation de corpus conduite jusqu'à présent sera complétée par une nouvelle politique de numérisation de masse. Sur ce point précis, la BNU sera attentive à ne pas numériser des documents déjà numérisés par ailleurs, par la BnF, par d'autres bibliothèques alsaciennes, ou par des bibliothèques allemandes.

Pour conduire cette politique, la BNU souhaite se doter d'équipements spécifiques de numérisation, qui viendront en 2010 compléter ceux déjà présents au sein de son atelier photographique. L'acquisition d'une solution logicielle de bibliothèque numérique, objet du présent cahier des charges, permettra de faciliter les opérations de numérisation et de mise en ligne des contenus numérisés.

La politique de la BNU pour 2010 et les années suivantes s'articulera autour de 5 axes stratégiques :

• Reprise de l'existant pour l'intégration dans le progiciel de bibliothèque numérique ;

• Poursuite des programmes existants (journaux de tranchées, alsatiques, iconographie) : numérisation en externe ;

• Lancement d'un programme de numérisation systématique de documents patrimoniaux (manuscrits, incunables, ouvrages du 16e siècle ; ostraca) : numérisation en interne ;

• Numérisation à la demande via le programme européen Ebooks on Demand : numérisation en interne ;

• Articulation avec les programmes locaux, régionaux, nationaux et européens. Cette articulation sera définie en fonction de l'avancement des programmes externes à la BNU.

D'autres axes de travail pourront être étudiés en cours d'année en fonction des besoins et opportunités, notamment :

• Partenariats sur projets de recherche ciblés ;

• Numérisation de masse.

Cahier des clauses techniques particulières 6 Marché n° 2010-15

BNU Projet Bibliothèque numérique - GED DSI-DCP

La BNU est attentive à la bonne visibilité de ses collections numérisées. Ceci vaut pour sa propre bibliothèque numérique, mais aussi à terme pour Gallica, Europeana, ainsi que pour la Bibliothèque scientifique numérique que souhaite développer le Ministère de l'enseignement supérieur et de la recherche.

Elle accorde également une grande importance à la préservation de ses données numérisées, et souhaite inscrire son action dans les politiques locales et nationales de l'archivage à long terme des données numériques.

Les données doivent également pouvoir être intégrées dans le futur portail numérique des savoirs de la Région Alsace.

3.2. Attendus techniques La mise en place de la bibliothèque numérique se fait en même temps que celle d'un nouveau CMS (Drupal). L'outil de bibliothèque numérique repose sur un progiciel de GED ou DAM qui doit :

• être pilotable par un système d'API afin que le CMS puisse accéder à la diffusion des ressources numériques ;

• intégrer un moteur de recherche capable de répondre aux besoins définis dans le présent document ;

• être compatible avec les outils bibliographiques existants (catalogue sur V-SMART), et avec le résolveur de liens OpenURL V-Link de la même société ;

• supporter l'authentification transparente via SSO ;• supporter ldap et active directory ;• proposer des fonctions de modifications d'images : recadrage, tatouage, tatouage

en filigrane (watermarking) (optionnel) ; • respecter le protocole CMIS (Content Management Interoperability Services).

Le progiciel de GED doit pouvoir fonctionner en environnement virtualisé (actuellement la BNU utilise une solution basée sur Linux/Xen).

Concernant le stockage : le progiciel de GED doit pouvoir se connecter à nos baies SAN EMC² fonctionnant avec des partitions en RAID5 et reliées aux serveurs en Fibre Channel.

Les recommandations sur la configuration minimale du serveur de production doivent être précisées.

3.2.1 Les données

Volumétrie et accroissement :Le nombre de pages numérisées par la BNU est aujourd'hui estimé à environ 1 million. L'accroissement prévu est de 200 000 pages par an.

Cahier des clauses techniques particulières 7 Marché n° 2010-15

BNU Projet Bibliothèque numérique - GED DSI-DCP

Typologie des documents originaux :L'activité de numérisation de la BNU peut porter sur tous les types de documents et de supports, quel que soit le contexte du document :

• types de documents :• textes ;

• images fixes (texte numérisé, photo ou image de tous formats : d'une monnaie à une carte format > A3 ou à l'affiche A0) ;

• documents sonores ;• documents vidéo ;

• contextes : • documents isolés (éventuellement appartenance intellectuelle à une

même collection y compris pour des types de documents différents) ;• documents reliés (livres, journaux …) ;• collections ou fonds constitués (fonds d'archives, collections de pièces,

etc. ;• expositions virtuelles mêlant des images, du texte, des vidéos, des

enregistrements sonores...

3.2.2 Typologie des formats informatiques Le progiciel doit permettre de gérer ou de s'interfacer avec les formats suivants (préciser si l'outil ne peut pas gérer un ou des formats mentionnés dans le tableau de réponse) :

• Formats de diffusion :• Affichage web

• Respect des normes W3C• Norme d'accessibilité WCAG 2.0 ; WAI

• Éventuellement publication électronique• E Pub (ebook)

• Formats de métadonnées :• de description

• Dublin Core qualifié ou simple• Unimarc• Optionnel : Marc21, MarcXML• EAD (DTD de description d'archives)• METS• MODS• LOM pour la description des ressources pédagogiques

• d'archivage des documents

• PREMIS (en relation avec le CINES, cf. infra).

De nouveaux formats de métadonnées doivent pouvoir être ajoutés facilement selon les besoins pour respecter l'évolution des standards.

Cahier des clauses techniques particulières 8 Marché n° 2010-15

BNU Projet Bibliothèque numérique - GED DSI-DCP

• Encodage des caractères• Unicode UTF-8• Ansi

• Formats d'échange des données et protocoles d'interopérabilité

• ISO 2709• XML• OAI/PMH• OpenURL

Critères de choixL'outil doit respecter les différents formats demandés. Un soin particulier est apporté aux propositions avec des logiciels libres dont le code source est fourni.Ouverture du logiciel de bibliothèque numérique (interopérabilité, interfaçage, ajout d'extensions).

3.3. Structure de la base (classification)La numérisation à la BNU est organisée autour de programmes. La structure de la base de données qui constitue le cœur du progiciel de bibliothèque numérique de la BNU doit refléter l'organisation en programmes de la politique de numérisation de celle-ci : les corpus de documents numérisés sont organisés en répertoires, à partir d'une racine déclinable en sous-ensembles cohérents. Le nombre maximal de niveaux d'arborescence est fixé à 4. Dans le cas de programmes pluri-annuels, un niveau intermédiaire de répertoires représente les années au cours desquelles ont lieu les opérations de numérisation. Dans le cas de programmes réalisés suivants plusieurs marchés, un niveau intermédiaire de répertoires représente les différents marchés.

Exemples d'arborescence : • Programme 1 (Numérisation à la demande) > Année de numérisation > Unité

bibliographique• Programme 2 (Images d'Alsace) > Année de numérisation > Unité

bibliographique• Programme 7 (Cartes d'Alsace) > Année de numérisation > Unité

bibliographique• Programme 9 (Journaux de tranchées) > Titre 1 > Année > Unité

bibliographique• Programme 12 (Ouvrages alsaciens du 16e siècle) > Marché > Année > Unité

bibliographique • (exemple : Programme 12 > Lot 1 : Interne BNU > 2010 > Livre 1

Programme 12 > Lot 2 : Marché extérieur 1 > 2010 > Livre 1Programme 12 > Lot 3 : Marché extérieur 2 > 2010 > Livre 1

Cahier des clauses techniques particulières 9 Marché n° 2010-15

BNU Projet Bibliothèque numérique - GED DSI-DCP

Le système de nommage des répertoires reflètent les éléments suivants :

• Dans tous les cas : l'identifiant de l'institution ; le numéro du programme ; • Suivant le niveau d'arborescence : la cote du document ; le numéro du document

numérisé dans la chaîne de numérisation.

Un renommage automatique des répertoires et fichiers doit être possible en cas de déplacement de ces répertoires et fichiers au sein de la base de données.

3.4. Spécifications techniques : import, traitement et stockage des objetsLa solution de bibliothèque numérique retenue doit être à même de gérer des données issues d'opérations de numérisation réalisées soit en interne à la BNU soit externalisées.

3.4.1 Import et formats des fichiers numériques Lors de l'import des données il doit être possible :

• de définir des profils d'import/export de documents, avec ou sans leurs métadonnées, ou de métadonnées seules

• d'importer/exporter en masse (par lots)• d'importer/exporter à l'unité• d'importer dynamiquement depuis le robot de numérisation des fichiers et

métadonnées.

Il est nécessaire de pouvoir importer directement dans un répertoire pré-défini dans l'arborescence, notamment à partir du numéro d'opération de numérisation indiqué dans le nommage des fichiers (voir infra).

3.4.2 Contrôle qualité Sont vérifiées à cette étape, de manière la plus automatisée possible :

• la complétude et la cohérence des fichiers versés ; • l'absence de doublons : l'outil doit prévoir un système de repérage des doublons

et de dédoublonnage le cas échéant ; • la lisibilité des fichiers par l'outil ; • la bonne prise en compte dans l'arborescence pré-définie.

3.4.3 Formats De manière générale les formats de fichiers les plus courants sont supportés en entrée, notamment:

• Texte : OpenOffice.org (.sxw, .odt), Word (.doc), Acrobat (.pdf), RTF (.rtf), Excel (.xls), Power Point (.ppt)

• Images fixes : JPEG (.jpg), GIF(.gif), TIFF (.tif), JPEG 2000 (.jp2), bitmap (.bmp), PNG (.png)

• Audio : OggVorbis (.ogg), MPEG-1/2 Audio Layer 3 (.mp3), Real Audio (.ram), WAV (.wav), MIDI (.mid)

• Vidéo : MPEG (.mpg), QuickTime (.mov)., Clip vidéo (.avi), .flv, .swf

Cahier des clauses techniques particulières 10 Marché n° 2010-15

BNU Projet Bibliothèque numérique - GED DSI-DCP

Optionnel : l'outil peut procéder automatiquement à la migration des formats d'entrée vers les formats suivants :

• Texte : .xml ; • Image : .tiff ; png • Audio : .mp3• Vidéo : .mpg

Cette opération est suivie d'un contrôle qualité automatisé, par une lecture aléatoire des fichiers transformés.

3.4.4 Nommage des fichiers

Fonctionnement général :L'outil retenu doit permettre de suivre la correspondance entre le nommage des fichiers, l'identification bibliographique du document numérisé, et le numéro du programme dans le cadre duquel le document a été numérisé.Les principes du système de nommage des fichiers sont exposés en annexe.

Reprise de l'existant :Un système de renommage automatique de lots de fichiers, sur la base d'une programmation manuelle est proposé pour la reprise de l'existant. Les documents numérisés à partir de la programmation 2010 sont créés suivant le système de nommage adéquat.

Modification ultérieure :Il peut arriver qu'un document numérisé dans le cadre d'un programme doive être rattaché à un autre programme pour des raisons de cohérence. C'est notamment le cas de documents numérisés à la demande, qui pourraient être rattachés à un programme thématique.Exemple : un papyrus numérisé à la demande d'un chercheur. Les répertoires et fichiers pourraient être déplacés du répertoire du programme "Numérisation à la demande" vers les répertoires du programme "Papyrus".Un tableau de correspondance doit permettre de suivre ces déplacements au sein de la base. Les répertoires et fichiers déplacés doivent être renommés automatiquement, en fonction de leur nouvel emplacement.

3.4.5 Archivage

L'export des fichiers au format .tiff (ou jpeg2000 ou .png) est envisagé pour l'archivage pérenne (vers des serveurs en interne, vers le CINES, ou vers d'autres prestataires).

Cahier des clauses techniques particulières 11 Marché n° 2010-15

BNU Projet Bibliothèque numérique - GED DSI-DCP

3.5. Métadonnées et identifiants

3.5.1 Acquisition des métadonnéesL'ajout de métadonnées se fait par plusieurs biais :

• Extraction automatique des données techniques lors de l'import de fichiers ou à partir de l'aquisition via la chaîne de numérisation (date de l'opération, type MIME...) ;

• Extraction automatique de métadonnées contenues dans certains fichiers comme les tags IPTC pour les images, ID3 pour le son, les propriétés des fichiers bureautiques ou PDF ;

• Conversion automatique de la notice unimarc issue du SIGB en métadonnées Dublin Core ;

• Possibilité d'import également de fichiers XML ou CSV contenant des métadonnées ;• Possibilité de récupérer des métadonnées de nos partenaires par moissonnage OAI-

PMH de leur base.

Nature des métadonnées

• De contexte : • l'identifiant international de la BNU (identifiant ISIL de la BNU :

FR674821001) doit être une métadonnée systématique dans chacun des fichiers numériques correspondant à une unité bibliographique ;

• la position du document dans l'arborescence doit être traduite dans les métadonnées. Le format EAD peut être employé ;

• l'outil doit permettre de décrire des collections - c'est-à-dire des ensembles de documents - au format EAD. C'est le cas notamment pour les collections de documents iconographiques. L'indexation doit donc être possible à chaque niveau de l'arborescence.

• Descriptives : • Bibliographiques : à partir de l'import des données bibliographiques depuis le

SIGB, transformation au format Dublin Core. (cf. paragraphe 5)• Complémentaires :

• l'outil doit permettre l'ajout manuel de métadonnées descriptives complémentaires, au niveau de chaque document. Le format METS sera utilisé pour les documents de type "livre" ou "journal" ;

• Résumé / description : champ libre alimenté manuellement, pour chaque document / chaque dossier. Doit apparaître dans la notice qui s'affiche dans les résultats de recherche.

• De droit : (afin de limiter l'accès au document) : • Accès libre : permet d'afficher le document en mode normal avec possibilités

de zoom et de téléchargements• Accès restreint : ne permet par défaut d'afficher le document qu'en mode

"vignette" en illustration de sa notice bibliographique. Pas de zoom ni de téléchargement possible. Consultation en mode normal et zoom autorisés uniquement sur les postes situés à l'intérieur des murs de la BNU. La

Cahier des clauses techniques particulières 12 Marché n° 2010-15

BNU Projet Bibliothèque numérique - GED DSI-DCP

métadonnée doit mentionner une date de libération du document, sur le modèle AAAAMMJJ (ex : 2034/01/01), date à laquelle le document devient en accès libre.

• De conservation : les métadonnées de conservation doivent être conformes au schéma OAIS. Le format PREMIS peut être une solution proposée.

3.5.2 Attribution d'identifiants pérennesA chaque unité bibliographique est attribué un numéro identifiant pérenne, sur le standard ARK utilisé par la BNF (cf.annexe 3). L'identifiant ARK traduit l'arborescence de la collection, et sert de localisation de l'unité bibliographique sur Internet. Le système permet l'ajout automatique de cet identifiant ARK dans le champ 846 de la notice bibliographique au format MARC correspondant à l'unité bibliographique numérisée. Le système doit par ailleurs supporter d'autres standard d'identifiants pérennes PURL, DOI, Handle....issus de sources extérieures.

L'ajout de métadonnées doit se faire à chaque niveau de l'arborescence.

3.5.3 Relations métadonnées / documentsChaque enregistrement de métadonnées doit pouvoir être lié à l'objet ou aux objets numériques concernés sur la base d'un ou plusieurs critères d'identification personnalisables et cette liaison est possible tout au long de la vie du document.

3.5.4 Texte intégralCertains documents numérisés au format image peuvent offrir une recherche en texte intégral suite au traitement par un logiciel de reconnaissance optique de caractères. Ce logiciel est indépendant de la solution retenue car il doit notamment être capable de lire l'allemand gothique manuscrit mais les deux doivent s'interfacer. Le fichier océrisé importé doit pouvoir être modifié facilement, sans avoir besoin d'être exporté et réimporté, le système doit donc être capable d'assembler et de dissocier des pages pdf.

3.5.5 Contrôle qualité

Le contrôle qualité s'effectue manuellement ou automatiquement sur les points suivants :

• fonctionnement du lien depuis la notice bibliographique du catalogue (contrôle automatique);

• cohérence de l'identifiant (URL) (contrôle automatique) ;• lisibilité des documents en ligne ;• qualité de son indexation.

3.6. Moteur de rechercheUn moteur de recherche performant doit être intégré à la solution pour, d'une part effectuer des recherches professionnelles et d'autre part, faire l'objet d'une requête via une API par le CMS Drupal et offrir des possibilités de recherche avancées pour les internautes.

Cahier des clauses techniques particulières 13 Marché n° 2010-15

BNU Projet Bibliothèque numérique - GED DSI-DCP

3.6.1 Fonctions de recherche• Une recherche globale simple de type "google" qui porte sur l'ensemble des

métadonnées et sur le texte intégral lorsqu'il est disponible avec pondération des résultats.

• Une recherche avancée avec :• des restrictions personnalisables notamment (chronologique,

géographique, par support, par collection)• l'utilisation d'opérateurs booléens et de proximité• le paramétrage des index sur lesquels s'opère la recherche.

• Une fonction de suggestion et de correction orthographique est appréciée.• Une présentation de type "annuaire" par feuilletage des catégories de la base ou par

navigation dans un index est également proposée.• Le retour à l'écran d'accueil ou à la liste des résultats est disponible à tout moment.

3.6.2 Présentation des résultats

Généralités• Un fil d'Ariane ou un menu avec l'arborescence toujours visible est disponible pour se

repérer à chaque étape de la recherche.• Un rappel des termes de la recherche est apprécié de même que les termes de la

recherche peuvent êtres surlignés dans la description ou dans les extraits du texte intégral.

Affichage abrégé• Un affichage abrégé présente, en premier lieu, les documents avec une vignette et une

description succincte. A ce stade, on doit pouvoir accéder à une prévisualisation rapide du document à l'aide de modules additionnels ou à l'affichage de la description détaillée (ensemble des métadonnées).

• Les résultats peuvent être triés par titre, par date, par collection, par type, par pertinence par liste ou par collections et une restriction peut être relancée à partir de "facettes" proposées automatiquement par le moteur.

Affichage détailléL'affichage détaillé donne accès à l'ensemble des métadonnées du document, aux différents objets et à leurs fonctions associées, notamment :

• pour les documents composés, l'affichage de la table des matières cliquable (monographies, périodiques)

• pour les textes numérisé l'image est affichée par défaut, mais l'utilisateur peut choisir de passer en mode texte ou d'avoir un affichage simultanée des deux

• une visionneuse est intégrée pour les document en mode images avec, applicable par profil de document,

• l'affichage par vignettes (chemin de fer) • l'affichage des pages personnalisé pour les livres (à chevrons, au clic,

éventuellement tourne-page Flash, accès direct à une page spécifiée)

Cahier des clauses techniques particulières 14 Marché n° 2010-15

BNU Projet Bibliothèque numérique - GED DSI-DCP

• un zoom dynamique sur des parties du document avec un rappel toujours présent du document entier

• l'affichage en multi-fenêtrage de plusieurs objets pour comparaisons et éventuellement possibilité de rotation

• pour le son et la vidéo, incrustation d'un lecteur flash (possibilité de lire les documents en streaming).

Exploitation des résultats• historique des recherches• sauvegarde des notices bibliographiques dans un panier• possibilité de générer un flux RSS à partir d'une recherche pré-enregistrée.

Export• impression• envoi par courriel sous forme d'archive zip pour plusieurs items• téléchargement au format allégé (question des droits pour les internautes), Pdf,

image JPG• export des métadonnées sous plusieurs formats possible (RIS, Texte, Html,

MarcXML, DC...).

Fonctionnalités avancées• recommandations de documents similaires fondés sur les métadonnées• possibilité de poster des commentaires et de les afficher ou non pour les

internautes• possibilité d'effectuer des paiements via une interface de paiement sécurisé

souscrite par la BNU• possibilité de construire une Url à l'aide de variables {ID; ISSN; TITLE...] à

partir de métadonnées existantes afin de rebondir vers une autre application (Catalogue, AtoZ, Numes, Calames).

3.7. Spécifications techniques : diffusion

• Génération de flux RSS sur les nouveaux documents ajoutés

• Exposition aux moteurs de recherche :Les documents numérisés doivent pouvoir être indexés par les moteurs de recherche du web : Google, Exalead, Yahoo!, Bing, etc.

• Exposition au moissonnage OAI-PMH :Afin d'alimenter des portails comme Gallica ou Europeana, les métadonnées sont versées dans un entrepôt OAI structuré selon une arborescence personnalisable. Il doit être possible d'autoriser à la moisson tout ou partie des collections, selon un paramétrage manuel.

Cahier des clauses techniques particulières 15 Marché n° 2010-15

BNU Projet Bibliothèque numérique - GED DSI-DCP

• Enrichissement scientifique des données :La BNU entend permettre l'enrichissement scientifique des données numérisées par l'ajout d'un appareil scientifique (de type textes, commentaires, bibliographies) au niveau des unités bibliographiques mais aussi des collections, donc à chaque niveau de l'arborescence des dossiers. Exemple : présentation historique et scientifique d'une collection de manuscrits ; description détaillée d'un document de cette collection en particulier. L'outil retenu doit permettre de gérer le plus facilement possible l'articulation entre les commentaires sur les données numérisées et les données numérisées elles-mêmes.

Export vers CMSLe prestataire doit fournir un jeu d'APIs ou de webservices permettant de requêter et d'afficher les documents et leur description dans le CMS (Drupal) avec les mêmes fonctionnalités que celles proposées en interne dans la partie "Moteur de recherche".

3.8. Module optionnel pour le PEB dématérialisé L'outil peut permettre de gérer le prêt entre bibliothèques dématérialisé par le téléchargement via un portail sécurisé des demandes d'autres bibliothèques.

Fonctions souhaitées :• Authentification sur identification de la bibliothèque demandeuse (inscription

possible en cas de 1ère demande)• Stockage dans un espace destiné à délivrer le document numérisé à la

bibliothèque demandeuse• Possibilité d'interfacer ce module avec des fonctions tel que téléchargement

unique, impression unique.

3.9. Moteur de workflow (automatisation des processus)De manière générale, la supervision de la numérisation (suivi du traitement du document original : organisation de l'envoi à la numérisation en interne ou au prestataire externe ; contrôle du retour en magasin après la numérisation) doit être possible via le moteur de workflow. Un proposition de workflow peut être la suivante :

• Création d'un répertoire par projet identifié ;• Création d'une « fiche » pour chaque objet à numériser, sous son répertoire «

projet » ;• Import des données bibliographiques de chaque objet, par import dans la base

des données bibliographiques de chaque unité bibliographique à numériser ou numérisée, depuis le SIGB V-Smart de la société Infor ;

• Attribution d'un identifiant pérenne à chaque objet ;• Suivi du traitement du document original (organisation de l'envoi à la

numérisation en interne ou au prestataire externe ; contrôle du retour en magasin après la numérisation) ;

• Acquisition : soit automatiquement par interface avec le matériel de numérisation, soit par l'import de fichiers numérisés en externe ;

• Contrôle qualité ;• Océrisation (le cas échéant) ;

Cahier des clauses techniques particulières 16 Marché n° 2010-15

BNU Projet Bibliothèque numérique - GED DSI-DCP

• Ajout des métadonnées : Dublin Core ; METS ; etc.• Ajout du statut du document numérisé : accès libre / accès restreint ;• Contrôle qualité ;• Export de sauvegarde ;• Exposition au moissonnage ; • Export vers CMS pour diffusion

Le workflow doit respecter les contraintes suivantes :

• Traitements automatisés : les différentes conversions de format et les ajouts automatiques de métadonnées doivent être déclenchés par le moteur de worklow.

• Traitements manuels : les professionnels identifiés sont sollicités automatiquement pour vérifier et enrichir les métadonnées présentes, classer les objets dans des collections ou définir les profils d'affichage.

• Le circuit de validation avant la publication en ligne des documents doit être très souple et personnalisable.

3.10. Administration de l'outilUne interface d'administration en ligne est appréciée.

3.10.1 Utilisateurs

L'outil doit offrir la possibilité de s'interfacer à un annuaire Active Directory afin de connecter les groupes et les utilisateurs existants dans l'annuaire de l'établissement.

On dispose d'au moins 4 profils d'utilisation :• les administrateurs (qui paramètrent la base et attribuent les droits, alimentent,

modifient et consultent, etc.) • les gestionnaires (qui alimentent, modifient, suppriment, mettent à jour et

consultent) • les utilisateurs (les agents de la BNU qui consultent uniquement) • les internautes (qui consultent une partie de la base, via le site Internet de la

BNU).

On peut envisager des niveaux de consultation différenciés suivant les profils de chacun, qu’il s’agisse des administrateurs ou des utilisateurs.

3.10.2 Statistiques

L'outil doit permettre aux administrateurs d'effectuer facilement des analyses statistiques sur l'ensemble des données et fonctionnalités.

Cahier des clauses techniques particulières 17 Marché n° 2010-15

BNU Projet Bibliothèque numérique - GED DSI-DCP

3.10.3 Formation

Le prestataire forme les administrateurs à la procédure intégrale de paramétrage de la base et à la gestion des profils. Les gestionnaire sont formés à l’alimentation et la consultation. Des guides d’utilisation (en version papier et électronique) sont fournis, décrivant les fonctionnalités du système en fonction du type de profil. Le système doit proposer une aide générale et une aide contextuelle.

3.10.4 Maintenance

Si le logiciel est payant, la 1ère année doit être gratuite.

Cahier des clauses techniques particulières 18 Marché n° 2010-15

BNU Projet Bibliothèque numérique - GED DSI-DCP

Article 4: ANNEXES

Liste des annexes :

1. Liste des programmes de numérisation de la BNU 2. Système de nommage des fichiers3. Standard ARK 4. Schéma XML des métadonnées d'archivage PAC/SIP du CINES5. Modèle de fichier METS6. Tableau de correspondance de UNIMARC vers Dublin Core

4.1. Liste des programmes de numérisation de la BNU Chaque programme de numérisation de la BNU doit disposer d'un numéro identifiant. Les éventuels différents lots (numérisation en interne, numérisation en externe par le prestataire X, numérisation en externe par le prestataire Y) doivent également être traduits dans l'identifiant. Pour des raisons de règles de nommage, les différents lots sont identifiés par des lettres (a, b, c, d), et non par des chiffres.

Exemple : • 12a : désigne le premier lot passé dans le cadre du programme de numérisation

n°12 (numérisation en interne des ouvrages alsaciens du 16e siècle) • 12b : désigne le deuxième lot passé dans le cadre du programme de numérisation

n°12 (numérisation par le prestataire extérieure X des ouvrages alsaciens du 16e siècle)

La liste fournie ci-dessous l'est à titre indicatif.

N° de projet

Désignation Dates de conduite du projet

1 Numérisation à la demande 1990-

2 Images d'Alsace 1990-

3 Monnaies et médailles alsaciennes 2000-

4 Mystique rhénane 2004

5 Cartes du Rhin supérieur 2007-

Cahier des clauses techniques particulières 19 Marché n° 2010-15

BNU Projet Bibliothèque numérique - GED DSI-DCP

6 Incontournables alsatiques 2008-2009

7 Cartes d'Alsace 2008-2011

8 Presse protestante 2009-2012

9 Journaux de tranchées 2009-2012

10 Placards de la guerre 1914-1918 2010-

11 Affiches alsaciennes 2010-

12 Ouvrages alsaciens du 16e siècle 2010-

12a Numérisation interne BNU 2010-

12b Marché extérieur 1 2010-

13 Fonds Nuremberg 2010-2011

14 Poésie alsacienne 18e-20e siècles 2010-2011

15 Inventaires historiques de la BNU 2010-2012

16 Papyrus 2008-2012

4.2. Système de nommage des répertoires et fichiers

La plus grande attention est portée au système de nommage des fichiers et répertoires dans lesquels sont organisées les données.

Les principes généraux du système de nommage des répertoires et fichiers sont les suivants : • les noms de répertoires et de fichiers (y compris le séparateur et l'extension) sont

limités à 45 caractères (hors indication de format), qui doivent obligatoirement être des lettres capitales, des chiffres ou des tirets bas (_). La virgule « , » n'est autorisée que dans le nommage des répertoires, uniquement dans la mention de la cote du document numérisé. Les points « . » figurant dans les cotes sont en revanche à enlever ;

Cahier des clauses techniques particulières 20 Marché n° 2010-15

BNU Projet Bibliothèque numérique - GED DSI-DCP

• l'identifiant de la BNU doit être présent systématiquement, à la fois pour les fichiers et les répertoires. L'identifiant international de la BNU est le numéro ISIL : « FR674821001 »http://www.bs.dk/isil/ .

• les éléments significatifs sont séparés par des tirets bas (underscore : "_") ;• le nommage des répertoires est constitué des éléments suivants :

◦ dans tous les cas : l'identifiant de l'institution ; le numéro du programme ; ◦ suivant le niveau d'arborescence : l'année de la numérisation ; la cote du

document ; le numéro du document numérisé dans la chaîne de numérisation ;

◦ certains cas particuliers (périodiques, lots de documents non individualisés dans le catalogue) font l'objet d'une solution spécifique ;

• le nommage des fichiers doit être signifiant et traduire à la fois l'identité de l'unité bibliographique numérisée et son emplacement dans les programmes de numérisation de la BNU.

Un document détaillé des spécifications retenues par la BNU est fourni aux candidats sur demande.

4.3. Le standard ARK Le standard ARK est une URL créée pour permettre un accès constant et à long terme aux informations d'un objet. ARK peut identifier les objets de tout type: documents numériques, bases de données, images, logiciels, et les sites web, ainsi que les objets physiques (livres, statues, images etc. ) et même objets intangibles (produits chimiques, maladies ...).

ARK est représenté par une séquence de caractères qui contient l'étiquette, "ark:", éventuellement précédée par le nom du protocole ("http://") et de l'hôte par lequel commence chaque URL.

http://example.org/ark:/13030/654xz321/s3/f8.05v.tiff

\________________/ \__/ \___/ \______/ \____________/

(modifiable) | | | Identifiant

Label ARK | | (NMA-supported)

| | |

Name Mapping Authority | Name (NAA-assigned)

(NMA) |

Name Assigning Authority

Number (NAAN)

Cahier des clauses techniques particulières 21 Marché n° 2010-15

BNU Projet Bibliothèque numérique - GED DSI-DCP

4.4. Schéma XML des métadonnées d'archivage PAC/SIP du CINES

La structure de référence pour les enveloppes descriptives des documents à verser (SIP) est téléchargeable :

le fichier de description du document transféré sip.xsd le fichier des notifications avis.xsd le fichier de description du document archivé aip.xsd

4.5. Modèle de fichiers METS

METS (Metadata Encoding & Transmission Standard) maintenu par la Library of Congress, permet de créer des objets numériques complexes, très structurés et dynamiques, «rassemblant» des objets numériques plus simples, quelconques et éventuellement dispersés.

Constitué de sept sections (carte de structure, section des métadonnées descriptives, administratives, section des fichiers, de leurs comportements ...) liées entre elles et au travers de leurs éléments-fils, il permet de gérer et diffuser la collection de multiples façons.

Pour décrire les objets de base, METS intègre des éléments de tous les jeux de métadonnées XML ou pointe sur des descriptions existantes ; il comprend un seul ensemble sémantique spécifique portant sur les droits d’usage. METS permet enfin de créer des packages conformes au modèle OAIS. Ce format efficace mais assez complexe est de plus en plus utilisé. METS website

4.6. Tableau de correspondance de UNIMARC vers Dublin Core

Title

200 a c d e h i r

500 a h i k l m n q r s u w (titre uniforme)

530 a b (titre clé)

51X 520 54X a e h i t( tous titres ajouté)

503 a b d e f h i j k l m n (titre de forme)

327 a

Creator

700 a b c d f

701 ab c d f

710 a b c d e f g h

711 a b c d e f g h

720 a f

721 a f

Cahier des clauses techniques particulières 22 Marché n° 2010-15

BNU Projet Bibliothèque numérique - GED DSI-DCP

Subject

600 a b f x

606 a

610 a

Description

300 a

330 a

Publisher

210 a c

702 si $4160, 610, 650 : a b c d f

712 si $4160 610, 650: a b c d e f g h

620 d

Contributors

200 f g

702 a b c d f Sauf si $4610, $4650 ou $4160

712 a b c d e f g h Sauf si $4610, $4650 ou $4160

722 a f Sauf si $4610, $4650 ou $4160

722 a f Sauf si $4610, $4650 ou $4160

Date

210 d

100 ( position 9 à 16 )

Type

label (position 7)

200 b

Format 215 a c d

Format Format de fichier (type MIME)

Identifier url pérenne du document

Source

Bibliothèque nationale et universitaire de Strasbourg

930 a cote

Language 101 a (code alphabétique sur 3 caractères)

Relation Lien vers le Webopac sur le no de notice

Coverage 607 a x y z

Rights à préciser

Cahier des clauses techniques particulières 23 Marché n° 2010-15

BNU Projet Bibliothèque numérique - GED DSI-DCP

4.7. Tableau à remplir par le soumissionnaireTableau à remplir par le soumissionnaire et à retourner sous forme papier accompagnée du fichier sur CD-Rom avec la proposition d'offre de service. Les réponses données auront valeur contractuelle.

Cahier des clauses techniques particulières 24 Marché n° 2010-15