le projet eudml - the european digital mathematics librarybouche/slides/eudml_fredoc.pdf ·...

29
Le projet EuDML The European Digital Mathematics Library Thierry Bouche Cellule MathDoc & institut Fourier, Université de Grenoble L’IST au prisme de l’Europe Journées FréDoc 2011 Bordeaux 11 octobre 2011

Upload: others

Post on 19-Oct-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

Le projet EuDMLThe European Digital Mathematics Library

Thierry BoucheCellule MathDoc amp institut FourierUniversiteacute de Grenoble

LrsquoIST au prisme de lrsquoEuropeJourneacutees FreacuteDoc 2011Bordeaux11 octobre 2011

Plan

1 La documentation matheacutematique

2 EuDML Objectifs

3 Les contenus

4 Meacutetadonneacutees

5 Reacutesultats

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesEnjeux speacutecifiques

La documentation matheacutematique valideacutee ne se peacuterime pas (Euler 1999)

Les reacutesulats anciens ne sont pas remplaceacutes par les nouveaux ils sont leur fondation (Richelot 2004)

Elle est valide comme un tout qui forme un vaste reacuteseau (Corona bug)

Elle est utile pour drsquoautres sciences de faccedilon asynchrone (Weber crypto)

=rArr Elle doit donc ecirctre soigneusement valideacutee rangeacutee indexeacutee et conserveacutee (GDZ SprZbl MR)

=rArr Elle doit rester accessible sur le tregraves long terme (Galois 1828)

FreacuteDoc Brodeaux 11102011 1 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesEnjeux speacutecifiques

La documentation matheacutematique valideacutee ne se peacuterime pas (Euler 1999)

Les reacutesulats anciens ne sont pas remplaceacutes par les nouveaux ils sont leur fondation (Richelot 2004)

Elle est valide comme un tout qui forme un vaste reacuteseau (Corona bug)

Elle est utile pour drsquoautres sciences de faccedilon asynchrone (Weber crypto)

=rArr Elle doit donc ecirctre soigneusement valideacutee rangeacutee indexeacutee et conserveacutee (GDZ SprZbl MR)

=rArr Elle doit rester accessible sur le tregraves long terme (Galois 1828)

FreacuteDoc Brodeaux 11102011 1 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesLa bibliothegraveque de reacutefeacuterence

Nous avons donc besoin drsquoune bibliothegravequeexhaustiveagrave jourbien rangeacuteegrande ouvertefacile drsquoaccegraves pour les non-matheacutematiciens

Papier OK (bibliothegraveques precirct inter fourniture de documentscatalogues fusionneacutes bases de donneacutees MRZM )

Eacutelectronique Un recircve (WDML NSF IMU EMS Moore EMANI )=rArr De nombreux projets de numeacuterisation depuis lrsquoan 2000

Quelques projets drsquoacquisition native(ELibM ERAM NUMDAM DML locales etc)

=rArr EuDML premier projet (pilote) drsquointeacutegration international

FreacuteDoc Brodeaux 11102011 2 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesLa bibliothegraveque de reacutefeacuterence

Nous avons donc besoin drsquoune bibliothegravequeexhaustiveagrave jourbien rangeacuteegrande ouvertefacile drsquoaccegraves pour les non-matheacutematiciens

Papier OK (bibliothegraveques precirct inter fourniture de documentscatalogues fusionneacutes bases de donneacutees MRZM )

Eacutelectronique Un recircve (WDML NSF IMU EMS Moore EMANI )=rArr De nombreux projets de numeacuterisation depuis lrsquoan 2000

Quelques projets drsquoacquisition native(ELibM ERAM NUMDAM DML locales etc)

=rArr EuDML premier projet (pilote) drsquointeacutegration international

FreacuteDoc Brodeaux 11102011 2 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesLa bibliothegraveque de reacutefeacuterence

Nous avons donc besoin drsquoune bibliothegravequeexhaustiveagrave jourbien rangeacuteegrande ouvertefacile drsquoaccegraves pour les non-matheacutematiciens

Papier OK (bibliothegraveques precirct inter fourniture de documentscatalogues fusionneacutes bases de donneacutees MRZM )

Eacutelectronique Un recircve (WDML NSF IMU EMS Moore EMANI )=rArr De nombreux projets de numeacuterisation depuis lrsquoan 2000

Quelques projets drsquoacquisition native(ELibM ERAM NUMDAM DML locales etc)

=rArr EuDML premier projet (pilote) drsquointeacutegration international

FreacuteDoc Brodeaux 11102011 2 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesEacutechelle de temps

Preacutepublications instantaneacutees (labos arXivHAL courriel pages perso)

Deacutelais de publication assez longs 1-2 ans

Publication agrave fins de prestige carriegravere et drsquoattributionFournit une version de reacutefeacuterence pour les travaux agrave venir

Seulement 50 des articles citeacutes aujourdrsquohuisont parus il y a moins de 10 ans

Environ 25 des articles citeacutes aujourdrsquohuisont parus il y a plus de 20 ans

FreacuteDoc Brodeaux 11102011 3 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesDimension modeste forte croissance

Une estimation de la taille du corpus matheacutematique publieacute dans la traditionoccidentale depuis Euclide

3 millions de textes couvrant lt 100 millions de pages

100 000 nouveaux textes paraissent chaque anneacutee

80 articles de revues 10 chapitres dans des ouvrages collectifs10 livres

lt 10 parus avant 1900

gt 80 parus apregraves 1950

FreacuteDoc Brodeaux 11102011 4 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesUne grande varieacuteteacute drsquoacteurs

Grande diversiteacute eacuteditoriale pas de modegravele eacuteconomique dominant

Environ 600 revues vivantes deacutedieacutees agrave la recherche matheacutematique(dont une vingtaine en France)

2000 peacuteriodiques comportant des articles de maths

Importance des livres

De nombreux eacutediteurs de taille modeste font un travail scientifiquede premier plan (laboratoires socieacuteteacutes savantes PME )

Les publications de laboratoires sont souvent en accegraves libre

Les structures priveacutees preacutefegraverent souvent assurer la peacuterenniteacute de leursservices en limitant le libre accegraves (embargo partiel ou total)

FreacuteDoc Brodeaux 11102011 5 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryCIP-ICT-PSP200924 Open access to scientific information

FreacuteDoc Brodeaux 11102011 6 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryVision EuDML (2008)

La bibliothegraveque numeacuterique de matheacutematiques devrait srsquoefforcer de reacuteunirun corpus matheacutematique aussi vaste que possible pour

le preacuteserver agrave tregraves long terme

le rendre disponible en ligne

en accegraves libre agrave terme

sous la forme drsquoun collection de reacutefeacuterence

alimenteacutee en continu par les nouveauteacutes des eacutediteurs

valoriseacutee par des outils de recherche et drsquointeropeacuterabiliteacute sophistiqueacutes

deacuteveloppeacutee et entretenue par un reacuteseau drsquoinstitutions

=rArr EuDML projet pilote CIP 2010-2013

FreacuteDoc Brodeaux 11102011 7 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryVision EuDML (2008)

La bibliothegraveque numeacuterique de matheacutematiques devrait srsquoefforcer de reacuteunirun corpus matheacutematique aussi vaste que possible pour

le preacuteserver agrave tregraves long terme

le rendre disponible en ligne

en accegraves libre agrave terme

sous la forme drsquoun collection de reacutefeacuterence

alimenteacutee en continu par les nouveauteacutes des eacutediteurs

valoriseacutee par des outils de recherche et drsquointeropeacuterabiliteacute sophistiqueacutes

deacuteveloppeacutee et entretenue par un reacuteseau drsquoinstitutions

=rArr EuDML projet pilote CIP 2010-2013

FreacuteDoc Brodeaux 11102011 7 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Le projet EuDMLFiche drsquoidentiteacute

EuDML Impleacutementation pilote (orienteacutee utilisateur final) drsquoun guichetdrsquoaccegraves unique au contenu matheacutematique fourni par11 institutionsavec des fonctions innovantes de recherche accessibiliteacutemultilinguisme navigation et interactiviteacute

Consortium 12 + 12 participants europeacuteens 1 + 12 partenaires associeacutesPortugal (1) Royaume-Uni (2) Espagne (2) France (3)Allemagne (2) Pologne (1) Reacutepublique Tchegraveque (2) Gregravece (1)Bulgarie (1)

Profil 3 anneacutees (01022010-31012013) 487 PMFinancement max CE 16 Meuro

Contenu 250 revues 235 000 textes 2 600 000 pages

FreacuteDoc Brodeaux 11102011 8 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSynthegravese

Collections 225 peacuteriodiques et seacuteries 235 000 textes 2 600 000 pagesAllemagne ERAMJFM GDZ ELibM (85 000 textes)

France Gallica-Math NUMDAM CEDRAM EDPS TEL (50 000 textes)Reacutep Tchegraveque DML-CZ (27 000 textes)

Russie RusDML (17 000 textes)Pologne DML-PL (14 000 textes)

Gregravece HDML (2 400 textes)Espagne DML-E (6 400 textes)Portugal SPMBNP (2 000 textes)Bulgarie BulDML (450 textes)

Reacutetro BNPSPMIST DML-CZ DML-E DML-PL Gallica GDZHDML NUMDAM RusDML

Natif BulDML CEDRAM DML-CZ DML-E DML-PL EDPSELibM NUMDAM

FreacuteDoc Brodeaux 11102011 13 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSeacutelection

Processus En cascade Projet rarr institution rarr collections

Critegraveres Textes matheacutematiques publieacutes et valideacutes scientifiquementdestineacutes agrave servir de reacutefeacuterence

bull Pour ecirctre eacuteligible il faut une paire(texte inteacutegral [PDF] meacutetadonneacutees [XML])archiveacutee par lrsquoune des institutions partenaires

Items Un item EuDML est lrsquouniteacute logique pertinente pour lrsquoutilisateurUne monographie un volume une œuvre en plusieurs tomes unarticle de revue une contribution dans un livre collectif unecommunication publieacutee dans des actes

bull Agrave ce jour 235 000 items dans 12 collections(185 000 articles 45 000 chapitres et contributions 2 500 livres300 œuvres en plusieurs tomes)

FreacuteDoc Brodeaux 11102011 14 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLDeacutetenteurs du copyrightDomaine public Quelques revues la plupart des livres

Public 50 universiteacutes acadeacutemies instituts laboratoires

Fondations Compositio Mathematica quelques ASBL

Socieacuteteacutes 20 socieacuteteacutes savantes

Eacutediteurs 45 revuesBirkhaumluser 5 revues (GDZ)

EDPS 7 revues (5 agrave jour dans NUMDAM)Elsevier 5 revues 1 agrave jour (NUMDAM)

de Gruyter 2 revues (GDZ)Heldermann 6 revues (5 agrave jour dans ELibM)

Hindawi 12 revues (agrave jour dans ELibM)Noordhoff 1 revue (NUMDAM)AK Peters 1 revue (ELibM)

Springer 2 peacuteriodiques (NUMDAM 1 revue agrave jour rarr 2007)9 revues (GDZ)

FreacuteDoc Brodeaux 11102011 15 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLLe babel des formats

Les meacutetadonneacutees ont des structures et des niveaux de deacutetail tregraves variablesSQL Base de donneacutees maison DML-E

DTD maison MathDoc FIZ IST HDML

DTD standard DC Dspace minidml METS NLM

Nous avons baseacute le format EuDML v 10 surNLM Journal Archiving and Interchange Tag Suitepour le stockage et lrsquoeacutechange des meacutetadonneacutees

FreacuteDoc Brodeaux 11102011 16 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLScheacutema EuDMLNLM Journal Archiving and Interchange Tag Suite

PourLargement testeacute et exploiteacute (EDPS PubMed Central JSTOR )Standard NISOPreacutecis et flexible (donneacutees structureacutees et plates)Support MathML et alternativesDescription du contenu de peacuteriodiques livres collectionsPermet de stocker lrsquoinformation de tous les partenaires et extensible

ContreNeacutecessite un ldquoapplication profilerdquoConccedilu pour les textes inteacutegrauxPas tous les types de documents preacutevus (chapitre dans un livre eacutediteacute )

=rArr EuDML schema v 10Trois types de documents comme conteneurs article book mbookDeacuteviation minimale par rapport aux DTD NLM standardldquoBest practices recommendationrdquo

FreacuteDoc Brodeaux 11102011 17 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Reacutesultats

Reacutesultats de la premiegravere peacuteriodeAnalyse des contenus deacutefinition drsquoun format drsquoeacutechangeConfeacuterence agrave Prague en octobre 2010 pour discuter avec des partenairespotentiels (Springer LMS ) sur la base

Libre accegraves agrave terme (creacuteneau mobile)Nouveauteacutes fournies par les eacutediteurs et indexeacutees rapidementArchivage partageacute dans un reacuteseau de bibliothegraveques numeacuteriques de reacutefeacuterence

Constition drsquoune base de donneacutees avec 235 000 reacutefeacuterencesenviron 15 du contenu numeacuterique existant (13 de lrsquoexistant laquo DML raquo)

Une seacuterie drsquooutils destineacutes agrave ameacuteliorer lrsquoindexation lrsquoaccegraveset la visibiliteacute de ce corpus speacutecifiquement matheacutematique

Premiegravere deacutemo publique drsquoun prototype agrave demi fonctionnel

FreacuteDoc Brodeaux 11102011 18 19

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe
Page 2: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

Plan

1 La documentation matheacutematique

2 EuDML Objectifs

3 Les contenus

4 Meacutetadonneacutees

5 Reacutesultats

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesEnjeux speacutecifiques

La documentation matheacutematique valideacutee ne se peacuterime pas (Euler 1999)

Les reacutesulats anciens ne sont pas remplaceacutes par les nouveaux ils sont leur fondation (Richelot 2004)

Elle est valide comme un tout qui forme un vaste reacuteseau (Corona bug)

Elle est utile pour drsquoautres sciences de faccedilon asynchrone (Weber crypto)

=rArr Elle doit donc ecirctre soigneusement valideacutee rangeacutee indexeacutee et conserveacutee (GDZ SprZbl MR)

=rArr Elle doit rester accessible sur le tregraves long terme (Galois 1828)

FreacuteDoc Brodeaux 11102011 1 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesEnjeux speacutecifiques

La documentation matheacutematique valideacutee ne se peacuterime pas (Euler 1999)

Les reacutesulats anciens ne sont pas remplaceacutes par les nouveaux ils sont leur fondation (Richelot 2004)

Elle est valide comme un tout qui forme un vaste reacuteseau (Corona bug)

Elle est utile pour drsquoautres sciences de faccedilon asynchrone (Weber crypto)

=rArr Elle doit donc ecirctre soigneusement valideacutee rangeacutee indexeacutee et conserveacutee (GDZ SprZbl MR)

=rArr Elle doit rester accessible sur le tregraves long terme (Galois 1828)

FreacuteDoc Brodeaux 11102011 1 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesLa bibliothegraveque de reacutefeacuterence

Nous avons donc besoin drsquoune bibliothegravequeexhaustiveagrave jourbien rangeacuteegrande ouvertefacile drsquoaccegraves pour les non-matheacutematiciens

Papier OK (bibliothegraveques precirct inter fourniture de documentscatalogues fusionneacutes bases de donneacutees MRZM )

Eacutelectronique Un recircve (WDML NSF IMU EMS Moore EMANI )=rArr De nombreux projets de numeacuterisation depuis lrsquoan 2000

Quelques projets drsquoacquisition native(ELibM ERAM NUMDAM DML locales etc)

=rArr EuDML premier projet (pilote) drsquointeacutegration international

FreacuteDoc Brodeaux 11102011 2 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesLa bibliothegraveque de reacutefeacuterence

Nous avons donc besoin drsquoune bibliothegravequeexhaustiveagrave jourbien rangeacuteegrande ouvertefacile drsquoaccegraves pour les non-matheacutematiciens

Papier OK (bibliothegraveques precirct inter fourniture de documentscatalogues fusionneacutes bases de donneacutees MRZM )

Eacutelectronique Un recircve (WDML NSF IMU EMS Moore EMANI )=rArr De nombreux projets de numeacuterisation depuis lrsquoan 2000

Quelques projets drsquoacquisition native(ELibM ERAM NUMDAM DML locales etc)

=rArr EuDML premier projet (pilote) drsquointeacutegration international

FreacuteDoc Brodeaux 11102011 2 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesLa bibliothegraveque de reacutefeacuterence

Nous avons donc besoin drsquoune bibliothegravequeexhaustiveagrave jourbien rangeacuteegrande ouvertefacile drsquoaccegraves pour les non-matheacutematiciens

Papier OK (bibliothegraveques precirct inter fourniture de documentscatalogues fusionneacutes bases de donneacutees MRZM )

Eacutelectronique Un recircve (WDML NSF IMU EMS Moore EMANI )=rArr De nombreux projets de numeacuterisation depuis lrsquoan 2000

Quelques projets drsquoacquisition native(ELibM ERAM NUMDAM DML locales etc)

=rArr EuDML premier projet (pilote) drsquointeacutegration international

FreacuteDoc Brodeaux 11102011 2 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesEacutechelle de temps

Preacutepublications instantaneacutees (labos arXivHAL courriel pages perso)

Deacutelais de publication assez longs 1-2 ans

Publication agrave fins de prestige carriegravere et drsquoattributionFournit une version de reacutefeacuterence pour les travaux agrave venir

Seulement 50 des articles citeacutes aujourdrsquohuisont parus il y a moins de 10 ans

Environ 25 des articles citeacutes aujourdrsquohuisont parus il y a plus de 20 ans

FreacuteDoc Brodeaux 11102011 3 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesDimension modeste forte croissance

Une estimation de la taille du corpus matheacutematique publieacute dans la traditionoccidentale depuis Euclide

3 millions de textes couvrant lt 100 millions de pages

100 000 nouveaux textes paraissent chaque anneacutee

80 articles de revues 10 chapitres dans des ouvrages collectifs10 livres

lt 10 parus avant 1900

gt 80 parus apregraves 1950

FreacuteDoc Brodeaux 11102011 4 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesUne grande varieacuteteacute drsquoacteurs

Grande diversiteacute eacuteditoriale pas de modegravele eacuteconomique dominant

Environ 600 revues vivantes deacutedieacutees agrave la recherche matheacutematique(dont une vingtaine en France)

2000 peacuteriodiques comportant des articles de maths

Importance des livres

De nombreux eacutediteurs de taille modeste font un travail scientifiquede premier plan (laboratoires socieacuteteacutes savantes PME )

Les publications de laboratoires sont souvent en accegraves libre

Les structures priveacutees preacutefegraverent souvent assurer la peacuterenniteacute de leursservices en limitant le libre accegraves (embargo partiel ou total)

FreacuteDoc Brodeaux 11102011 5 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryCIP-ICT-PSP200924 Open access to scientific information

FreacuteDoc Brodeaux 11102011 6 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryVision EuDML (2008)

La bibliothegraveque numeacuterique de matheacutematiques devrait srsquoefforcer de reacuteunirun corpus matheacutematique aussi vaste que possible pour

le preacuteserver agrave tregraves long terme

le rendre disponible en ligne

en accegraves libre agrave terme

sous la forme drsquoun collection de reacutefeacuterence

alimenteacutee en continu par les nouveauteacutes des eacutediteurs

valoriseacutee par des outils de recherche et drsquointeropeacuterabiliteacute sophistiqueacutes

deacuteveloppeacutee et entretenue par un reacuteseau drsquoinstitutions

=rArr EuDML projet pilote CIP 2010-2013

FreacuteDoc Brodeaux 11102011 7 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryVision EuDML (2008)

La bibliothegraveque numeacuterique de matheacutematiques devrait srsquoefforcer de reacuteunirun corpus matheacutematique aussi vaste que possible pour

le preacuteserver agrave tregraves long terme

le rendre disponible en ligne

en accegraves libre agrave terme

sous la forme drsquoun collection de reacutefeacuterence

alimenteacutee en continu par les nouveauteacutes des eacutediteurs

valoriseacutee par des outils de recherche et drsquointeropeacuterabiliteacute sophistiqueacutes

deacuteveloppeacutee et entretenue par un reacuteseau drsquoinstitutions

=rArr EuDML projet pilote CIP 2010-2013

FreacuteDoc Brodeaux 11102011 7 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Le projet EuDMLFiche drsquoidentiteacute

EuDML Impleacutementation pilote (orienteacutee utilisateur final) drsquoun guichetdrsquoaccegraves unique au contenu matheacutematique fourni par11 institutionsavec des fonctions innovantes de recherche accessibiliteacutemultilinguisme navigation et interactiviteacute

Consortium 12 + 12 participants europeacuteens 1 + 12 partenaires associeacutesPortugal (1) Royaume-Uni (2) Espagne (2) France (3)Allemagne (2) Pologne (1) Reacutepublique Tchegraveque (2) Gregravece (1)Bulgarie (1)

Profil 3 anneacutees (01022010-31012013) 487 PMFinancement max CE 16 Meuro

Contenu 250 revues 235 000 textes 2 600 000 pages

FreacuteDoc Brodeaux 11102011 8 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSynthegravese

Collections 225 peacuteriodiques et seacuteries 235 000 textes 2 600 000 pagesAllemagne ERAMJFM GDZ ELibM (85 000 textes)

France Gallica-Math NUMDAM CEDRAM EDPS TEL (50 000 textes)Reacutep Tchegraveque DML-CZ (27 000 textes)

Russie RusDML (17 000 textes)Pologne DML-PL (14 000 textes)

Gregravece HDML (2 400 textes)Espagne DML-E (6 400 textes)Portugal SPMBNP (2 000 textes)Bulgarie BulDML (450 textes)

Reacutetro BNPSPMIST DML-CZ DML-E DML-PL Gallica GDZHDML NUMDAM RusDML

Natif BulDML CEDRAM DML-CZ DML-E DML-PL EDPSELibM NUMDAM

FreacuteDoc Brodeaux 11102011 13 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSeacutelection

Processus En cascade Projet rarr institution rarr collections

Critegraveres Textes matheacutematiques publieacutes et valideacutes scientifiquementdestineacutes agrave servir de reacutefeacuterence

bull Pour ecirctre eacuteligible il faut une paire(texte inteacutegral [PDF] meacutetadonneacutees [XML])archiveacutee par lrsquoune des institutions partenaires

Items Un item EuDML est lrsquouniteacute logique pertinente pour lrsquoutilisateurUne monographie un volume une œuvre en plusieurs tomes unarticle de revue une contribution dans un livre collectif unecommunication publieacutee dans des actes

bull Agrave ce jour 235 000 items dans 12 collections(185 000 articles 45 000 chapitres et contributions 2 500 livres300 œuvres en plusieurs tomes)

FreacuteDoc Brodeaux 11102011 14 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLDeacutetenteurs du copyrightDomaine public Quelques revues la plupart des livres

Public 50 universiteacutes acadeacutemies instituts laboratoires

Fondations Compositio Mathematica quelques ASBL

Socieacuteteacutes 20 socieacuteteacutes savantes

Eacutediteurs 45 revuesBirkhaumluser 5 revues (GDZ)

EDPS 7 revues (5 agrave jour dans NUMDAM)Elsevier 5 revues 1 agrave jour (NUMDAM)

de Gruyter 2 revues (GDZ)Heldermann 6 revues (5 agrave jour dans ELibM)

Hindawi 12 revues (agrave jour dans ELibM)Noordhoff 1 revue (NUMDAM)AK Peters 1 revue (ELibM)

Springer 2 peacuteriodiques (NUMDAM 1 revue agrave jour rarr 2007)9 revues (GDZ)

FreacuteDoc Brodeaux 11102011 15 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLLe babel des formats

Les meacutetadonneacutees ont des structures et des niveaux de deacutetail tregraves variablesSQL Base de donneacutees maison DML-E

DTD maison MathDoc FIZ IST HDML

DTD standard DC Dspace minidml METS NLM

Nous avons baseacute le format EuDML v 10 surNLM Journal Archiving and Interchange Tag Suitepour le stockage et lrsquoeacutechange des meacutetadonneacutees

FreacuteDoc Brodeaux 11102011 16 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLScheacutema EuDMLNLM Journal Archiving and Interchange Tag Suite

PourLargement testeacute et exploiteacute (EDPS PubMed Central JSTOR )Standard NISOPreacutecis et flexible (donneacutees structureacutees et plates)Support MathML et alternativesDescription du contenu de peacuteriodiques livres collectionsPermet de stocker lrsquoinformation de tous les partenaires et extensible

ContreNeacutecessite un ldquoapplication profilerdquoConccedilu pour les textes inteacutegrauxPas tous les types de documents preacutevus (chapitre dans un livre eacutediteacute )

=rArr EuDML schema v 10Trois types de documents comme conteneurs article book mbookDeacuteviation minimale par rapport aux DTD NLM standardldquoBest practices recommendationrdquo

FreacuteDoc Brodeaux 11102011 17 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Reacutesultats

Reacutesultats de la premiegravere peacuteriodeAnalyse des contenus deacutefinition drsquoun format drsquoeacutechangeConfeacuterence agrave Prague en octobre 2010 pour discuter avec des partenairespotentiels (Springer LMS ) sur la base

Libre accegraves agrave terme (creacuteneau mobile)Nouveauteacutes fournies par les eacutediteurs et indexeacutees rapidementArchivage partageacute dans un reacuteseau de bibliothegraveques numeacuteriques de reacutefeacuterence

Constition drsquoune base de donneacutees avec 235 000 reacutefeacuterencesenviron 15 du contenu numeacuterique existant (13 de lrsquoexistant laquo DML raquo)

Une seacuterie drsquooutils destineacutes agrave ameacuteliorer lrsquoindexation lrsquoaccegraveset la visibiliteacute de ce corpus speacutecifiquement matheacutematique

Premiegravere deacutemo publique drsquoun prototype agrave demi fonctionnel

FreacuteDoc Brodeaux 11102011 18 19

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe
Page 3: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesEnjeux speacutecifiques

La documentation matheacutematique valideacutee ne se peacuterime pas (Euler 1999)

Les reacutesulats anciens ne sont pas remplaceacutes par les nouveaux ils sont leur fondation (Richelot 2004)

Elle est valide comme un tout qui forme un vaste reacuteseau (Corona bug)

Elle est utile pour drsquoautres sciences de faccedilon asynchrone (Weber crypto)

=rArr Elle doit donc ecirctre soigneusement valideacutee rangeacutee indexeacutee et conserveacutee (GDZ SprZbl MR)

=rArr Elle doit rester accessible sur le tregraves long terme (Galois 1828)

FreacuteDoc Brodeaux 11102011 1 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesEnjeux speacutecifiques

La documentation matheacutematique valideacutee ne se peacuterime pas (Euler 1999)

Les reacutesulats anciens ne sont pas remplaceacutes par les nouveaux ils sont leur fondation (Richelot 2004)

Elle est valide comme un tout qui forme un vaste reacuteseau (Corona bug)

Elle est utile pour drsquoautres sciences de faccedilon asynchrone (Weber crypto)

=rArr Elle doit donc ecirctre soigneusement valideacutee rangeacutee indexeacutee et conserveacutee (GDZ SprZbl MR)

=rArr Elle doit rester accessible sur le tregraves long terme (Galois 1828)

FreacuteDoc Brodeaux 11102011 1 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesLa bibliothegraveque de reacutefeacuterence

Nous avons donc besoin drsquoune bibliothegravequeexhaustiveagrave jourbien rangeacuteegrande ouvertefacile drsquoaccegraves pour les non-matheacutematiciens

Papier OK (bibliothegraveques precirct inter fourniture de documentscatalogues fusionneacutes bases de donneacutees MRZM )

Eacutelectronique Un recircve (WDML NSF IMU EMS Moore EMANI )=rArr De nombreux projets de numeacuterisation depuis lrsquoan 2000

Quelques projets drsquoacquisition native(ELibM ERAM NUMDAM DML locales etc)

=rArr EuDML premier projet (pilote) drsquointeacutegration international

FreacuteDoc Brodeaux 11102011 2 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesLa bibliothegraveque de reacutefeacuterence

Nous avons donc besoin drsquoune bibliothegravequeexhaustiveagrave jourbien rangeacuteegrande ouvertefacile drsquoaccegraves pour les non-matheacutematiciens

Papier OK (bibliothegraveques precirct inter fourniture de documentscatalogues fusionneacutes bases de donneacutees MRZM )

Eacutelectronique Un recircve (WDML NSF IMU EMS Moore EMANI )=rArr De nombreux projets de numeacuterisation depuis lrsquoan 2000

Quelques projets drsquoacquisition native(ELibM ERAM NUMDAM DML locales etc)

=rArr EuDML premier projet (pilote) drsquointeacutegration international

FreacuteDoc Brodeaux 11102011 2 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesLa bibliothegraveque de reacutefeacuterence

Nous avons donc besoin drsquoune bibliothegravequeexhaustiveagrave jourbien rangeacuteegrande ouvertefacile drsquoaccegraves pour les non-matheacutematiciens

Papier OK (bibliothegraveques precirct inter fourniture de documentscatalogues fusionneacutes bases de donneacutees MRZM )

Eacutelectronique Un recircve (WDML NSF IMU EMS Moore EMANI )=rArr De nombreux projets de numeacuterisation depuis lrsquoan 2000

Quelques projets drsquoacquisition native(ELibM ERAM NUMDAM DML locales etc)

=rArr EuDML premier projet (pilote) drsquointeacutegration international

FreacuteDoc Brodeaux 11102011 2 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesEacutechelle de temps

Preacutepublications instantaneacutees (labos arXivHAL courriel pages perso)

Deacutelais de publication assez longs 1-2 ans

Publication agrave fins de prestige carriegravere et drsquoattributionFournit une version de reacutefeacuterence pour les travaux agrave venir

Seulement 50 des articles citeacutes aujourdrsquohuisont parus il y a moins de 10 ans

Environ 25 des articles citeacutes aujourdrsquohuisont parus il y a plus de 20 ans

FreacuteDoc Brodeaux 11102011 3 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesDimension modeste forte croissance

Une estimation de la taille du corpus matheacutematique publieacute dans la traditionoccidentale depuis Euclide

3 millions de textes couvrant lt 100 millions de pages

100 000 nouveaux textes paraissent chaque anneacutee

80 articles de revues 10 chapitres dans des ouvrages collectifs10 livres

lt 10 parus avant 1900

gt 80 parus apregraves 1950

FreacuteDoc Brodeaux 11102011 4 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesUne grande varieacuteteacute drsquoacteurs

Grande diversiteacute eacuteditoriale pas de modegravele eacuteconomique dominant

Environ 600 revues vivantes deacutedieacutees agrave la recherche matheacutematique(dont une vingtaine en France)

2000 peacuteriodiques comportant des articles de maths

Importance des livres

De nombreux eacutediteurs de taille modeste font un travail scientifiquede premier plan (laboratoires socieacuteteacutes savantes PME )

Les publications de laboratoires sont souvent en accegraves libre

Les structures priveacutees preacutefegraverent souvent assurer la peacuterenniteacute de leursservices en limitant le libre accegraves (embargo partiel ou total)

FreacuteDoc Brodeaux 11102011 5 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryCIP-ICT-PSP200924 Open access to scientific information

FreacuteDoc Brodeaux 11102011 6 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryVision EuDML (2008)

La bibliothegraveque numeacuterique de matheacutematiques devrait srsquoefforcer de reacuteunirun corpus matheacutematique aussi vaste que possible pour

le preacuteserver agrave tregraves long terme

le rendre disponible en ligne

en accegraves libre agrave terme

sous la forme drsquoun collection de reacutefeacuterence

alimenteacutee en continu par les nouveauteacutes des eacutediteurs

valoriseacutee par des outils de recherche et drsquointeropeacuterabiliteacute sophistiqueacutes

deacuteveloppeacutee et entretenue par un reacuteseau drsquoinstitutions

=rArr EuDML projet pilote CIP 2010-2013

FreacuteDoc Brodeaux 11102011 7 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryVision EuDML (2008)

La bibliothegraveque numeacuterique de matheacutematiques devrait srsquoefforcer de reacuteunirun corpus matheacutematique aussi vaste que possible pour

le preacuteserver agrave tregraves long terme

le rendre disponible en ligne

en accegraves libre agrave terme

sous la forme drsquoun collection de reacutefeacuterence

alimenteacutee en continu par les nouveauteacutes des eacutediteurs

valoriseacutee par des outils de recherche et drsquointeropeacuterabiliteacute sophistiqueacutes

deacuteveloppeacutee et entretenue par un reacuteseau drsquoinstitutions

=rArr EuDML projet pilote CIP 2010-2013

FreacuteDoc Brodeaux 11102011 7 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Le projet EuDMLFiche drsquoidentiteacute

EuDML Impleacutementation pilote (orienteacutee utilisateur final) drsquoun guichetdrsquoaccegraves unique au contenu matheacutematique fourni par11 institutionsavec des fonctions innovantes de recherche accessibiliteacutemultilinguisme navigation et interactiviteacute

Consortium 12 + 12 participants europeacuteens 1 + 12 partenaires associeacutesPortugal (1) Royaume-Uni (2) Espagne (2) France (3)Allemagne (2) Pologne (1) Reacutepublique Tchegraveque (2) Gregravece (1)Bulgarie (1)

Profil 3 anneacutees (01022010-31012013) 487 PMFinancement max CE 16 Meuro

Contenu 250 revues 235 000 textes 2 600 000 pages

FreacuteDoc Brodeaux 11102011 8 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSynthegravese

Collections 225 peacuteriodiques et seacuteries 235 000 textes 2 600 000 pagesAllemagne ERAMJFM GDZ ELibM (85 000 textes)

France Gallica-Math NUMDAM CEDRAM EDPS TEL (50 000 textes)Reacutep Tchegraveque DML-CZ (27 000 textes)

Russie RusDML (17 000 textes)Pologne DML-PL (14 000 textes)

Gregravece HDML (2 400 textes)Espagne DML-E (6 400 textes)Portugal SPMBNP (2 000 textes)Bulgarie BulDML (450 textes)

Reacutetro BNPSPMIST DML-CZ DML-E DML-PL Gallica GDZHDML NUMDAM RusDML

Natif BulDML CEDRAM DML-CZ DML-E DML-PL EDPSELibM NUMDAM

FreacuteDoc Brodeaux 11102011 13 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSeacutelection

Processus En cascade Projet rarr institution rarr collections

Critegraveres Textes matheacutematiques publieacutes et valideacutes scientifiquementdestineacutes agrave servir de reacutefeacuterence

bull Pour ecirctre eacuteligible il faut une paire(texte inteacutegral [PDF] meacutetadonneacutees [XML])archiveacutee par lrsquoune des institutions partenaires

Items Un item EuDML est lrsquouniteacute logique pertinente pour lrsquoutilisateurUne monographie un volume une œuvre en plusieurs tomes unarticle de revue une contribution dans un livre collectif unecommunication publieacutee dans des actes

bull Agrave ce jour 235 000 items dans 12 collections(185 000 articles 45 000 chapitres et contributions 2 500 livres300 œuvres en plusieurs tomes)

FreacuteDoc Brodeaux 11102011 14 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLDeacutetenteurs du copyrightDomaine public Quelques revues la plupart des livres

Public 50 universiteacutes acadeacutemies instituts laboratoires

Fondations Compositio Mathematica quelques ASBL

Socieacuteteacutes 20 socieacuteteacutes savantes

Eacutediteurs 45 revuesBirkhaumluser 5 revues (GDZ)

EDPS 7 revues (5 agrave jour dans NUMDAM)Elsevier 5 revues 1 agrave jour (NUMDAM)

de Gruyter 2 revues (GDZ)Heldermann 6 revues (5 agrave jour dans ELibM)

Hindawi 12 revues (agrave jour dans ELibM)Noordhoff 1 revue (NUMDAM)AK Peters 1 revue (ELibM)

Springer 2 peacuteriodiques (NUMDAM 1 revue agrave jour rarr 2007)9 revues (GDZ)

FreacuteDoc Brodeaux 11102011 15 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLLe babel des formats

Les meacutetadonneacutees ont des structures et des niveaux de deacutetail tregraves variablesSQL Base de donneacutees maison DML-E

DTD maison MathDoc FIZ IST HDML

DTD standard DC Dspace minidml METS NLM

Nous avons baseacute le format EuDML v 10 surNLM Journal Archiving and Interchange Tag Suitepour le stockage et lrsquoeacutechange des meacutetadonneacutees

FreacuteDoc Brodeaux 11102011 16 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLScheacutema EuDMLNLM Journal Archiving and Interchange Tag Suite

PourLargement testeacute et exploiteacute (EDPS PubMed Central JSTOR )Standard NISOPreacutecis et flexible (donneacutees structureacutees et plates)Support MathML et alternativesDescription du contenu de peacuteriodiques livres collectionsPermet de stocker lrsquoinformation de tous les partenaires et extensible

ContreNeacutecessite un ldquoapplication profilerdquoConccedilu pour les textes inteacutegrauxPas tous les types de documents preacutevus (chapitre dans un livre eacutediteacute )

=rArr EuDML schema v 10Trois types de documents comme conteneurs article book mbookDeacuteviation minimale par rapport aux DTD NLM standardldquoBest practices recommendationrdquo

FreacuteDoc Brodeaux 11102011 17 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Reacutesultats

Reacutesultats de la premiegravere peacuteriodeAnalyse des contenus deacutefinition drsquoun format drsquoeacutechangeConfeacuterence agrave Prague en octobre 2010 pour discuter avec des partenairespotentiels (Springer LMS ) sur la base

Libre accegraves agrave terme (creacuteneau mobile)Nouveauteacutes fournies par les eacutediteurs et indexeacutees rapidementArchivage partageacute dans un reacuteseau de bibliothegraveques numeacuteriques de reacutefeacuterence

Constition drsquoune base de donneacutees avec 235 000 reacutefeacuterencesenviron 15 du contenu numeacuterique existant (13 de lrsquoexistant laquo DML raquo)

Une seacuterie drsquooutils destineacutes agrave ameacuteliorer lrsquoindexation lrsquoaccegraveset la visibiliteacute de ce corpus speacutecifiquement matheacutematique

Premiegravere deacutemo publique drsquoun prototype agrave demi fonctionnel

FreacuteDoc Brodeaux 11102011 18 19

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe
Page 4: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesEnjeux speacutecifiques

La documentation matheacutematique valideacutee ne se peacuterime pas (Euler 1999)

Les reacutesulats anciens ne sont pas remplaceacutes par les nouveaux ils sont leur fondation (Richelot 2004)

Elle est valide comme un tout qui forme un vaste reacuteseau (Corona bug)

Elle est utile pour drsquoautres sciences de faccedilon asynchrone (Weber crypto)

=rArr Elle doit donc ecirctre soigneusement valideacutee rangeacutee indexeacutee et conserveacutee (GDZ SprZbl MR)

=rArr Elle doit rester accessible sur le tregraves long terme (Galois 1828)

FreacuteDoc Brodeaux 11102011 1 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesLa bibliothegraveque de reacutefeacuterence

Nous avons donc besoin drsquoune bibliothegravequeexhaustiveagrave jourbien rangeacuteegrande ouvertefacile drsquoaccegraves pour les non-matheacutematiciens

Papier OK (bibliothegraveques precirct inter fourniture de documentscatalogues fusionneacutes bases de donneacutees MRZM )

Eacutelectronique Un recircve (WDML NSF IMU EMS Moore EMANI )=rArr De nombreux projets de numeacuterisation depuis lrsquoan 2000

Quelques projets drsquoacquisition native(ELibM ERAM NUMDAM DML locales etc)

=rArr EuDML premier projet (pilote) drsquointeacutegration international

FreacuteDoc Brodeaux 11102011 2 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesLa bibliothegraveque de reacutefeacuterence

Nous avons donc besoin drsquoune bibliothegravequeexhaustiveagrave jourbien rangeacuteegrande ouvertefacile drsquoaccegraves pour les non-matheacutematiciens

Papier OK (bibliothegraveques precirct inter fourniture de documentscatalogues fusionneacutes bases de donneacutees MRZM )

Eacutelectronique Un recircve (WDML NSF IMU EMS Moore EMANI )=rArr De nombreux projets de numeacuterisation depuis lrsquoan 2000

Quelques projets drsquoacquisition native(ELibM ERAM NUMDAM DML locales etc)

=rArr EuDML premier projet (pilote) drsquointeacutegration international

FreacuteDoc Brodeaux 11102011 2 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesLa bibliothegraveque de reacutefeacuterence

Nous avons donc besoin drsquoune bibliothegravequeexhaustiveagrave jourbien rangeacuteegrande ouvertefacile drsquoaccegraves pour les non-matheacutematiciens

Papier OK (bibliothegraveques precirct inter fourniture de documentscatalogues fusionneacutes bases de donneacutees MRZM )

Eacutelectronique Un recircve (WDML NSF IMU EMS Moore EMANI )=rArr De nombreux projets de numeacuterisation depuis lrsquoan 2000

Quelques projets drsquoacquisition native(ELibM ERAM NUMDAM DML locales etc)

=rArr EuDML premier projet (pilote) drsquointeacutegration international

FreacuteDoc Brodeaux 11102011 2 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesEacutechelle de temps

Preacutepublications instantaneacutees (labos arXivHAL courriel pages perso)

Deacutelais de publication assez longs 1-2 ans

Publication agrave fins de prestige carriegravere et drsquoattributionFournit une version de reacutefeacuterence pour les travaux agrave venir

Seulement 50 des articles citeacutes aujourdrsquohuisont parus il y a moins de 10 ans

Environ 25 des articles citeacutes aujourdrsquohuisont parus il y a plus de 20 ans

FreacuteDoc Brodeaux 11102011 3 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesDimension modeste forte croissance

Une estimation de la taille du corpus matheacutematique publieacute dans la traditionoccidentale depuis Euclide

3 millions de textes couvrant lt 100 millions de pages

100 000 nouveaux textes paraissent chaque anneacutee

80 articles de revues 10 chapitres dans des ouvrages collectifs10 livres

lt 10 parus avant 1900

gt 80 parus apregraves 1950

FreacuteDoc Brodeaux 11102011 4 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesUne grande varieacuteteacute drsquoacteurs

Grande diversiteacute eacuteditoriale pas de modegravele eacuteconomique dominant

Environ 600 revues vivantes deacutedieacutees agrave la recherche matheacutematique(dont une vingtaine en France)

2000 peacuteriodiques comportant des articles de maths

Importance des livres

De nombreux eacutediteurs de taille modeste font un travail scientifiquede premier plan (laboratoires socieacuteteacutes savantes PME )

Les publications de laboratoires sont souvent en accegraves libre

Les structures priveacutees preacutefegraverent souvent assurer la peacuterenniteacute de leursservices en limitant le libre accegraves (embargo partiel ou total)

FreacuteDoc Brodeaux 11102011 5 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryCIP-ICT-PSP200924 Open access to scientific information

FreacuteDoc Brodeaux 11102011 6 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryVision EuDML (2008)

La bibliothegraveque numeacuterique de matheacutematiques devrait srsquoefforcer de reacuteunirun corpus matheacutematique aussi vaste que possible pour

le preacuteserver agrave tregraves long terme

le rendre disponible en ligne

en accegraves libre agrave terme

sous la forme drsquoun collection de reacutefeacuterence

alimenteacutee en continu par les nouveauteacutes des eacutediteurs

valoriseacutee par des outils de recherche et drsquointeropeacuterabiliteacute sophistiqueacutes

deacuteveloppeacutee et entretenue par un reacuteseau drsquoinstitutions

=rArr EuDML projet pilote CIP 2010-2013

FreacuteDoc Brodeaux 11102011 7 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryVision EuDML (2008)

La bibliothegraveque numeacuterique de matheacutematiques devrait srsquoefforcer de reacuteunirun corpus matheacutematique aussi vaste que possible pour

le preacuteserver agrave tregraves long terme

le rendre disponible en ligne

en accegraves libre agrave terme

sous la forme drsquoun collection de reacutefeacuterence

alimenteacutee en continu par les nouveauteacutes des eacutediteurs

valoriseacutee par des outils de recherche et drsquointeropeacuterabiliteacute sophistiqueacutes

deacuteveloppeacutee et entretenue par un reacuteseau drsquoinstitutions

=rArr EuDML projet pilote CIP 2010-2013

FreacuteDoc Brodeaux 11102011 7 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Le projet EuDMLFiche drsquoidentiteacute

EuDML Impleacutementation pilote (orienteacutee utilisateur final) drsquoun guichetdrsquoaccegraves unique au contenu matheacutematique fourni par11 institutionsavec des fonctions innovantes de recherche accessibiliteacutemultilinguisme navigation et interactiviteacute

Consortium 12 + 12 participants europeacuteens 1 + 12 partenaires associeacutesPortugal (1) Royaume-Uni (2) Espagne (2) France (3)Allemagne (2) Pologne (1) Reacutepublique Tchegraveque (2) Gregravece (1)Bulgarie (1)

Profil 3 anneacutees (01022010-31012013) 487 PMFinancement max CE 16 Meuro

Contenu 250 revues 235 000 textes 2 600 000 pages

FreacuteDoc Brodeaux 11102011 8 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSynthegravese

Collections 225 peacuteriodiques et seacuteries 235 000 textes 2 600 000 pagesAllemagne ERAMJFM GDZ ELibM (85 000 textes)

France Gallica-Math NUMDAM CEDRAM EDPS TEL (50 000 textes)Reacutep Tchegraveque DML-CZ (27 000 textes)

Russie RusDML (17 000 textes)Pologne DML-PL (14 000 textes)

Gregravece HDML (2 400 textes)Espagne DML-E (6 400 textes)Portugal SPMBNP (2 000 textes)Bulgarie BulDML (450 textes)

Reacutetro BNPSPMIST DML-CZ DML-E DML-PL Gallica GDZHDML NUMDAM RusDML

Natif BulDML CEDRAM DML-CZ DML-E DML-PL EDPSELibM NUMDAM

FreacuteDoc Brodeaux 11102011 13 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSeacutelection

Processus En cascade Projet rarr institution rarr collections

Critegraveres Textes matheacutematiques publieacutes et valideacutes scientifiquementdestineacutes agrave servir de reacutefeacuterence

bull Pour ecirctre eacuteligible il faut une paire(texte inteacutegral [PDF] meacutetadonneacutees [XML])archiveacutee par lrsquoune des institutions partenaires

Items Un item EuDML est lrsquouniteacute logique pertinente pour lrsquoutilisateurUne monographie un volume une œuvre en plusieurs tomes unarticle de revue une contribution dans un livre collectif unecommunication publieacutee dans des actes

bull Agrave ce jour 235 000 items dans 12 collections(185 000 articles 45 000 chapitres et contributions 2 500 livres300 œuvres en plusieurs tomes)

FreacuteDoc Brodeaux 11102011 14 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLDeacutetenteurs du copyrightDomaine public Quelques revues la plupart des livres

Public 50 universiteacutes acadeacutemies instituts laboratoires

Fondations Compositio Mathematica quelques ASBL

Socieacuteteacutes 20 socieacuteteacutes savantes

Eacutediteurs 45 revuesBirkhaumluser 5 revues (GDZ)

EDPS 7 revues (5 agrave jour dans NUMDAM)Elsevier 5 revues 1 agrave jour (NUMDAM)

de Gruyter 2 revues (GDZ)Heldermann 6 revues (5 agrave jour dans ELibM)

Hindawi 12 revues (agrave jour dans ELibM)Noordhoff 1 revue (NUMDAM)AK Peters 1 revue (ELibM)

Springer 2 peacuteriodiques (NUMDAM 1 revue agrave jour rarr 2007)9 revues (GDZ)

FreacuteDoc Brodeaux 11102011 15 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLLe babel des formats

Les meacutetadonneacutees ont des structures et des niveaux de deacutetail tregraves variablesSQL Base de donneacutees maison DML-E

DTD maison MathDoc FIZ IST HDML

DTD standard DC Dspace minidml METS NLM

Nous avons baseacute le format EuDML v 10 surNLM Journal Archiving and Interchange Tag Suitepour le stockage et lrsquoeacutechange des meacutetadonneacutees

FreacuteDoc Brodeaux 11102011 16 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLScheacutema EuDMLNLM Journal Archiving and Interchange Tag Suite

PourLargement testeacute et exploiteacute (EDPS PubMed Central JSTOR )Standard NISOPreacutecis et flexible (donneacutees structureacutees et plates)Support MathML et alternativesDescription du contenu de peacuteriodiques livres collectionsPermet de stocker lrsquoinformation de tous les partenaires et extensible

ContreNeacutecessite un ldquoapplication profilerdquoConccedilu pour les textes inteacutegrauxPas tous les types de documents preacutevus (chapitre dans un livre eacutediteacute )

=rArr EuDML schema v 10Trois types de documents comme conteneurs article book mbookDeacuteviation minimale par rapport aux DTD NLM standardldquoBest practices recommendationrdquo

FreacuteDoc Brodeaux 11102011 17 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Reacutesultats

Reacutesultats de la premiegravere peacuteriodeAnalyse des contenus deacutefinition drsquoun format drsquoeacutechangeConfeacuterence agrave Prague en octobre 2010 pour discuter avec des partenairespotentiels (Springer LMS ) sur la base

Libre accegraves agrave terme (creacuteneau mobile)Nouveauteacutes fournies par les eacutediteurs et indexeacutees rapidementArchivage partageacute dans un reacuteseau de bibliothegraveques numeacuteriques de reacutefeacuterence

Constition drsquoune base de donneacutees avec 235 000 reacutefeacuterencesenviron 15 du contenu numeacuterique existant (13 de lrsquoexistant laquo DML raquo)

Une seacuterie drsquooutils destineacutes agrave ameacuteliorer lrsquoindexation lrsquoaccegraveset la visibiliteacute de ce corpus speacutecifiquement matheacutematique

Premiegravere deacutemo publique drsquoun prototype agrave demi fonctionnel

FreacuteDoc Brodeaux 11102011 18 19

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe
Page 5: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesLa bibliothegraveque de reacutefeacuterence

Nous avons donc besoin drsquoune bibliothegravequeexhaustiveagrave jourbien rangeacuteegrande ouvertefacile drsquoaccegraves pour les non-matheacutematiciens

Papier OK (bibliothegraveques precirct inter fourniture de documentscatalogues fusionneacutes bases de donneacutees MRZM )

Eacutelectronique Un recircve (WDML NSF IMU EMS Moore EMANI )=rArr De nombreux projets de numeacuterisation depuis lrsquoan 2000

Quelques projets drsquoacquisition native(ELibM ERAM NUMDAM DML locales etc)

=rArr EuDML premier projet (pilote) drsquointeacutegration international

FreacuteDoc Brodeaux 11102011 2 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesLa bibliothegraveque de reacutefeacuterence

Nous avons donc besoin drsquoune bibliothegravequeexhaustiveagrave jourbien rangeacuteegrande ouvertefacile drsquoaccegraves pour les non-matheacutematiciens

Papier OK (bibliothegraveques precirct inter fourniture de documentscatalogues fusionneacutes bases de donneacutees MRZM )

Eacutelectronique Un recircve (WDML NSF IMU EMS Moore EMANI )=rArr De nombreux projets de numeacuterisation depuis lrsquoan 2000

Quelques projets drsquoacquisition native(ELibM ERAM NUMDAM DML locales etc)

=rArr EuDML premier projet (pilote) drsquointeacutegration international

FreacuteDoc Brodeaux 11102011 2 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesLa bibliothegraveque de reacutefeacuterence

Nous avons donc besoin drsquoune bibliothegravequeexhaustiveagrave jourbien rangeacuteegrande ouvertefacile drsquoaccegraves pour les non-matheacutematiciens

Papier OK (bibliothegraveques precirct inter fourniture de documentscatalogues fusionneacutes bases de donneacutees MRZM )

Eacutelectronique Un recircve (WDML NSF IMU EMS Moore EMANI )=rArr De nombreux projets de numeacuterisation depuis lrsquoan 2000

Quelques projets drsquoacquisition native(ELibM ERAM NUMDAM DML locales etc)

=rArr EuDML premier projet (pilote) drsquointeacutegration international

FreacuteDoc Brodeaux 11102011 2 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesEacutechelle de temps

Preacutepublications instantaneacutees (labos arXivHAL courriel pages perso)

Deacutelais de publication assez longs 1-2 ans

Publication agrave fins de prestige carriegravere et drsquoattributionFournit une version de reacutefeacuterence pour les travaux agrave venir

Seulement 50 des articles citeacutes aujourdrsquohuisont parus il y a moins de 10 ans

Environ 25 des articles citeacutes aujourdrsquohuisont parus il y a plus de 20 ans

FreacuteDoc Brodeaux 11102011 3 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesDimension modeste forte croissance

Une estimation de la taille du corpus matheacutematique publieacute dans la traditionoccidentale depuis Euclide

3 millions de textes couvrant lt 100 millions de pages

100 000 nouveaux textes paraissent chaque anneacutee

80 articles de revues 10 chapitres dans des ouvrages collectifs10 livres

lt 10 parus avant 1900

gt 80 parus apregraves 1950

FreacuteDoc Brodeaux 11102011 4 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesUne grande varieacuteteacute drsquoacteurs

Grande diversiteacute eacuteditoriale pas de modegravele eacuteconomique dominant

Environ 600 revues vivantes deacutedieacutees agrave la recherche matheacutematique(dont une vingtaine en France)

2000 peacuteriodiques comportant des articles de maths

Importance des livres

De nombreux eacutediteurs de taille modeste font un travail scientifiquede premier plan (laboratoires socieacuteteacutes savantes PME )

Les publications de laboratoires sont souvent en accegraves libre

Les structures priveacutees preacutefegraverent souvent assurer la peacuterenniteacute de leursservices en limitant le libre accegraves (embargo partiel ou total)

FreacuteDoc Brodeaux 11102011 5 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryCIP-ICT-PSP200924 Open access to scientific information

FreacuteDoc Brodeaux 11102011 6 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryVision EuDML (2008)

La bibliothegraveque numeacuterique de matheacutematiques devrait srsquoefforcer de reacuteunirun corpus matheacutematique aussi vaste que possible pour

le preacuteserver agrave tregraves long terme

le rendre disponible en ligne

en accegraves libre agrave terme

sous la forme drsquoun collection de reacutefeacuterence

alimenteacutee en continu par les nouveauteacutes des eacutediteurs

valoriseacutee par des outils de recherche et drsquointeropeacuterabiliteacute sophistiqueacutes

deacuteveloppeacutee et entretenue par un reacuteseau drsquoinstitutions

=rArr EuDML projet pilote CIP 2010-2013

FreacuteDoc Brodeaux 11102011 7 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryVision EuDML (2008)

La bibliothegraveque numeacuterique de matheacutematiques devrait srsquoefforcer de reacuteunirun corpus matheacutematique aussi vaste que possible pour

le preacuteserver agrave tregraves long terme

le rendre disponible en ligne

en accegraves libre agrave terme

sous la forme drsquoun collection de reacutefeacuterence

alimenteacutee en continu par les nouveauteacutes des eacutediteurs

valoriseacutee par des outils de recherche et drsquointeropeacuterabiliteacute sophistiqueacutes

deacuteveloppeacutee et entretenue par un reacuteseau drsquoinstitutions

=rArr EuDML projet pilote CIP 2010-2013

FreacuteDoc Brodeaux 11102011 7 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Le projet EuDMLFiche drsquoidentiteacute

EuDML Impleacutementation pilote (orienteacutee utilisateur final) drsquoun guichetdrsquoaccegraves unique au contenu matheacutematique fourni par11 institutionsavec des fonctions innovantes de recherche accessibiliteacutemultilinguisme navigation et interactiviteacute

Consortium 12 + 12 participants europeacuteens 1 + 12 partenaires associeacutesPortugal (1) Royaume-Uni (2) Espagne (2) France (3)Allemagne (2) Pologne (1) Reacutepublique Tchegraveque (2) Gregravece (1)Bulgarie (1)

Profil 3 anneacutees (01022010-31012013) 487 PMFinancement max CE 16 Meuro

Contenu 250 revues 235 000 textes 2 600 000 pages

FreacuteDoc Brodeaux 11102011 8 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSynthegravese

Collections 225 peacuteriodiques et seacuteries 235 000 textes 2 600 000 pagesAllemagne ERAMJFM GDZ ELibM (85 000 textes)

France Gallica-Math NUMDAM CEDRAM EDPS TEL (50 000 textes)Reacutep Tchegraveque DML-CZ (27 000 textes)

Russie RusDML (17 000 textes)Pologne DML-PL (14 000 textes)

Gregravece HDML (2 400 textes)Espagne DML-E (6 400 textes)Portugal SPMBNP (2 000 textes)Bulgarie BulDML (450 textes)

Reacutetro BNPSPMIST DML-CZ DML-E DML-PL Gallica GDZHDML NUMDAM RusDML

Natif BulDML CEDRAM DML-CZ DML-E DML-PL EDPSELibM NUMDAM

FreacuteDoc Brodeaux 11102011 13 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSeacutelection

Processus En cascade Projet rarr institution rarr collections

Critegraveres Textes matheacutematiques publieacutes et valideacutes scientifiquementdestineacutes agrave servir de reacutefeacuterence

bull Pour ecirctre eacuteligible il faut une paire(texte inteacutegral [PDF] meacutetadonneacutees [XML])archiveacutee par lrsquoune des institutions partenaires

Items Un item EuDML est lrsquouniteacute logique pertinente pour lrsquoutilisateurUne monographie un volume une œuvre en plusieurs tomes unarticle de revue une contribution dans un livre collectif unecommunication publieacutee dans des actes

bull Agrave ce jour 235 000 items dans 12 collections(185 000 articles 45 000 chapitres et contributions 2 500 livres300 œuvres en plusieurs tomes)

FreacuteDoc Brodeaux 11102011 14 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLDeacutetenteurs du copyrightDomaine public Quelques revues la plupart des livres

Public 50 universiteacutes acadeacutemies instituts laboratoires

Fondations Compositio Mathematica quelques ASBL

Socieacuteteacutes 20 socieacuteteacutes savantes

Eacutediteurs 45 revuesBirkhaumluser 5 revues (GDZ)

EDPS 7 revues (5 agrave jour dans NUMDAM)Elsevier 5 revues 1 agrave jour (NUMDAM)

de Gruyter 2 revues (GDZ)Heldermann 6 revues (5 agrave jour dans ELibM)

Hindawi 12 revues (agrave jour dans ELibM)Noordhoff 1 revue (NUMDAM)AK Peters 1 revue (ELibM)

Springer 2 peacuteriodiques (NUMDAM 1 revue agrave jour rarr 2007)9 revues (GDZ)

FreacuteDoc Brodeaux 11102011 15 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLLe babel des formats

Les meacutetadonneacutees ont des structures et des niveaux de deacutetail tregraves variablesSQL Base de donneacutees maison DML-E

DTD maison MathDoc FIZ IST HDML

DTD standard DC Dspace minidml METS NLM

Nous avons baseacute le format EuDML v 10 surNLM Journal Archiving and Interchange Tag Suitepour le stockage et lrsquoeacutechange des meacutetadonneacutees

FreacuteDoc Brodeaux 11102011 16 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLScheacutema EuDMLNLM Journal Archiving and Interchange Tag Suite

PourLargement testeacute et exploiteacute (EDPS PubMed Central JSTOR )Standard NISOPreacutecis et flexible (donneacutees structureacutees et plates)Support MathML et alternativesDescription du contenu de peacuteriodiques livres collectionsPermet de stocker lrsquoinformation de tous les partenaires et extensible

ContreNeacutecessite un ldquoapplication profilerdquoConccedilu pour les textes inteacutegrauxPas tous les types de documents preacutevus (chapitre dans un livre eacutediteacute )

=rArr EuDML schema v 10Trois types de documents comme conteneurs article book mbookDeacuteviation minimale par rapport aux DTD NLM standardldquoBest practices recommendationrdquo

FreacuteDoc Brodeaux 11102011 17 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Reacutesultats

Reacutesultats de la premiegravere peacuteriodeAnalyse des contenus deacutefinition drsquoun format drsquoeacutechangeConfeacuterence agrave Prague en octobre 2010 pour discuter avec des partenairespotentiels (Springer LMS ) sur la base

Libre accegraves agrave terme (creacuteneau mobile)Nouveauteacutes fournies par les eacutediteurs et indexeacutees rapidementArchivage partageacute dans un reacuteseau de bibliothegraveques numeacuteriques de reacutefeacuterence

Constition drsquoune base de donneacutees avec 235 000 reacutefeacuterencesenviron 15 du contenu numeacuterique existant (13 de lrsquoexistant laquo DML raquo)

Une seacuterie drsquooutils destineacutes agrave ameacuteliorer lrsquoindexation lrsquoaccegraveset la visibiliteacute de ce corpus speacutecifiquement matheacutematique

Premiegravere deacutemo publique drsquoun prototype agrave demi fonctionnel

FreacuteDoc Brodeaux 11102011 18 19

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe
Page 6: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesLa bibliothegraveque de reacutefeacuterence

Nous avons donc besoin drsquoune bibliothegravequeexhaustiveagrave jourbien rangeacuteegrande ouvertefacile drsquoaccegraves pour les non-matheacutematiciens

Papier OK (bibliothegraveques precirct inter fourniture de documentscatalogues fusionneacutes bases de donneacutees MRZM )

Eacutelectronique Un recircve (WDML NSF IMU EMS Moore EMANI )=rArr De nombreux projets de numeacuterisation depuis lrsquoan 2000

Quelques projets drsquoacquisition native(ELibM ERAM NUMDAM DML locales etc)

=rArr EuDML premier projet (pilote) drsquointeacutegration international

FreacuteDoc Brodeaux 11102011 2 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesLa bibliothegraveque de reacutefeacuterence

Nous avons donc besoin drsquoune bibliothegravequeexhaustiveagrave jourbien rangeacuteegrande ouvertefacile drsquoaccegraves pour les non-matheacutematiciens

Papier OK (bibliothegraveques precirct inter fourniture de documentscatalogues fusionneacutes bases de donneacutees MRZM )

Eacutelectronique Un recircve (WDML NSF IMU EMS Moore EMANI )=rArr De nombreux projets de numeacuterisation depuis lrsquoan 2000

Quelques projets drsquoacquisition native(ELibM ERAM NUMDAM DML locales etc)

=rArr EuDML premier projet (pilote) drsquointeacutegration international

FreacuteDoc Brodeaux 11102011 2 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesEacutechelle de temps

Preacutepublications instantaneacutees (labos arXivHAL courriel pages perso)

Deacutelais de publication assez longs 1-2 ans

Publication agrave fins de prestige carriegravere et drsquoattributionFournit une version de reacutefeacuterence pour les travaux agrave venir

Seulement 50 des articles citeacutes aujourdrsquohuisont parus il y a moins de 10 ans

Environ 25 des articles citeacutes aujourdrsquohuisont parus il y a plus de 20 ans

FreacuteDoc Brodeaux 11102011 3 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesDimension modeste forte croissance

Une estimation de la taille du corpus matheacutematique publieacute dans la traditionoccidentale depuis Euclide

3 millions de textes couvrant lt 100 millions de pages

100 000 nouveaux textes paraissent chaque anneacutee

80 articles de revues 10 chapitres dans des ouvrages collectifs10 livres

lt 10 parus avant 1900

gt 80 parus apregraves 1950

FreacuteDoc Brodeaux 11102011 4 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesUne grande varieacuteteacute drsquoacteurs

Grande diversiteacute eacuteditoriale pas de modegravele eacuteconomique dominant

Environ 600 revues vivantes deacutedieacutees agrave la recherche matheacutematique(dont une vingtaine en France)

2000 peacuteriodiques comportant des articles de maths

Importance des livres

De nombreux eacutediteurs de taille modeste font un travail scientifiquede premier plan (laboratoires socieacuteteacutes savantes PME )

Les publications de laboratoires sont souvent en accegraves libre

Les structures priveacutees preacutefegraverent souvent assurer la peacuterenniteacute de leursservices en limitant le libre accegraves (embargo partiel ou total)

FreacuteDoc Brodeaux 11102011 5 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryCIP-ICT-PSP200924 Open access to scientific information

FreacuteDoc Brodeaux 11102011 6 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryVision EuDML (2008)

La bibliothegraveque numeacuterique de matheacutematiques devrait srsquoefforcer de reacuteunirun corpus matheacutematique aussi vaste que possible pour

le preacuteserver agrave tregraves long terme

le rendre disponible en ligne

en accegraves libre agrave terme

sous la forme drsquoun collection de reacutefeacuterence

alimenteacutee en continu par les nouveauteacutes des eacutediteurs

valoriseacutee par des outils de recherche et drsquointeropeacuterabiliteacute sophistiqueacutes

deacuteveloppeacutee et entretenue par un reacuteseau drsquoinstitutions

=rArr EuDML projet pilote CIP 2010-2013

FreacuteDoc Brodeaux 11102011 7 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryVision EuDML (2008)

La bibliothegraveque numeacuterique de matheacutematiques devrait srsquoefforcer de reacuteunirun corpus matheacutematique aussi vaste que possible pour

le preacuteserver agrave tregraves long terme

le rendre disponible en ligne

en accegraves libre agrave terme

sous la forme drsquoun collection de reacutefeacuterence

alimenteacutee en continu par les nouveauteacutes des eacutediteurs

valoriseacutee par des outils de recherche et drsquointeropeacuterabiliteacute sophistiqueacutes

deacuteveloppeacutee et entretenue par un reacuteseau drsquoinstitutions

=rArr EuDML projet pilote CIP 2010-2013

FreacuteDoc Brodeaux 11102011 7 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Le projet EuDMLFiche drsquoidentiteacute

EuDML Impleacutementation pilote (orienteacutee utilisateur final) drsquoun guichetdrsquoaccegraves unique au contenu matheacutematique fourni par11 institutionsavec des fonctions innovantes de recherche accessibiliteacutemultilinguisme navigation et interactiviteacute

Consortium 12 + 12 participants europeacuteens 1 + 12 partenaires associeacutesPortugal (1) Royaume-Uni (2) Espagne (2) France (3)Allemagne (2) Pologne (1) Reacutepublique Tchegraveque (2) Gregravece (1)Bulgarie (1)

Profil 3 anneacutees (01022010-31012013) 487 PMFinancement max CE 16 Meuro

Contenu 250 revues 235 000 textes 2 600 000 pages

FreacuteDoc Brodeaux 11102011 8 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSynthegravese

Collections 225 peacuteriodiques et seacuteries 235 000 textes 2 600 000 pagesAllemagne ERAMJFM GDZ ELibM (85 000 textes)

France Gallica-Math NUMDAM CEDRAM EDPS TEL (50 000 textes)Reacutep Tchegraveque DML-CZ (27 000 textes)

Russie RusDML (17 000 textes)Pologne DML-PL (14 000 textes)

Gregravece HDML (2 400 textes)Espagne DML-E (6 400 textes)Portugal SPMBNP (2 000 textes)Bulgarie BulDML (450 textes)

Reacutetro BNPSPMIST DML-CZ DML-E DML-PL Gallica GDZHDML NUMDAM RusDML

Natif BulDML CEDRAM DML-CZ DML-E DML-PL EDPSELibM NUMDAM

FreacuteDoc Brodeaux 11102011 13 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSeacutelection

Processus En cascade Projet rarr institution rarr collections

Critegraveres Textes matheacutematiques publieacutes et valideacutes scientifiquementdestineacutes agrave servir de reacutefeacuterence

bull Pour ecirctre eacuteligible il faut une paire(texte inteacutegral [PDF] meacutetadonneacutees [XML])archiveacutee par lrsquoune des institutions partenaires

Items Un item EuDML est lrsquouniteacute logique pertinente pour lrsquoutilisateurUne monographie un volume une œuvre en plusieurs tomes unarticle de revue une contribution dans un livre collectif unecommunication publieacutee dans des actes

bull Agrave ce jour 235 000 items dans 12 collections(185 000 articles 45 000 chapitres et contributions 2 500 livres300 œuvres en plusieurs tomes)

FreacuteDoc Brodeaux 11102011 14 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLDeacutetenteurs du copyrightDomaine public Quelques revues la plupart des livres

Public 50 universiteacutes acadeacutemies instituts laboratoires

Fondations Compositio Mathematica quelques ASBL

Socieacuteteacutes 20 socieacuteteacutes savantes

Eacutediteurs 45 revuesBirkhaumluser 5 revues (GDZ)

EDPS 7 revues (5 agrave jour dans NUMDAM)Elsevier 5 revues 1 agrave jour (NUMDAM)

de Gruyter 2 revues (GDZ)Heldermann 6 revues (5 agrave jour dans ELibM)

Hindawi 12 revues (agrave jour dans ELibM)Noordhoff 1 revue (NUMDAM)AK Peters 1 revue (ELibM)

Springer 2 peacuteriodiques (NUMDAM 1 revue agrave jour rarr 2007)9 revues (GDZ)

FreacuteDoc Brodeaux 11102011 15 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLLe babel des formats

Les meacutetadonneacutees ont des structures et des niveaux de deacutetail tregraves variablesSQL Base de donneacutees maison DML-E

DTD maison MathDoc FIZ IST HDML

DTD standard DC Dspace minidml METS NLM

Nous avons baseacute le format EuDML v 10 surNLM Journal Archiving and Interchange Tag Suitepour le stockage et lrsquoeacutechange des meacutetadonneacutees

FreacuteDoc Brodeaux 11102011 16 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLScheacutema EuDMLNLM Journal Archiving and Interchange Tag Suite

PourLargement testeacute et exploiteacute (EDPS PubMed Central JSTOR )Standard NISOPreacutecis et flexible (donneacutees structureacutees et plates)Support MathML et alternativesDescription du contenu de peacuteriodiques livres collectionsPermet de stocker lrsquoinformation de tous les partenaires et extensible

ContreNeacutecessite un ldquoapplication profilerdquoConccedilu pour les textes inteacutegrauxPas tous les types de documents preacutevus (chapitre dans un livre eacutediteacute )

=rArr EuDML schema v 10Trois types de documents comme conteneurs article book mbookDeacuteviation minimale par rapport aux DTD NLM standardldquoBest practices recommendationrdquo

FreacuteDoc Brodeaux 11102011 17 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Reacutesultats

Reacutesultats de la premiegravere peacuteriodeAnalyse des contenus deacutefinition drsquoun format drsquoeacutechangeConfeacuterence agrave Prague en octobre 2010 pour discuter avec des partenairespotentiels (Springer LMS ) sur la base

Libre accegraves agrave terme (creacuteneau mobile)Nouveauteacutes fournies par les eacutediteurs et indexeacutees rapidementArchivage partageacute dans un reacuteseau de bibliothegraveques numeacuteriques de reacutefeacuterence

Constition drsquoune base de donneacutees avec 235 000 reacutefeacuterencesenviron 15 du contenu numeacuterique existant (13 de lrsquoexistant laquo DML raquo)

Une seacuterie drsquooutils destineacutes agrave ameacuteliorer lrsquoindexation lrsquoaccegraveset la visibiliteacute de ce corpus speacutecifiquement matheacutematique

Premiegravere deacutemo publique drsquoun prototype agrave demi fonctionnel

FreacuteDoc Brodeaux 11102011 18 19

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe
Page 7: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesLa bibliothegraveque de reacutefeacuterence

Nous avons donc besoin drsquoune bibliothegravequeexhaustiveagrave jourbien rangeacuteegrande ouvertefacile drsquoaccegraves pour les non-matheacutematiciens

Papier OK (bibliothegraveques precirct inter fourniture de documentscatalogues fusionneacutes bases de donneacutees MRZM )

Eacutelectronique Un recircve (WDML NSF IMU EMS Moore EMANI )=rArr De nombreux projets de numeacuterisation depuis lrsquoan 2000

Quelques projets drsquoacquisition native(ELibM ERAM NUMDAM DML locales etc)

=rArr EuDML premier projet (pilote) drsquointeacutegration international

FreacuteDoc Brodeaux 11102011 2 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesEacutechelle de temps

Preacutepublications instantaneacutees (labos arXivHAL courriel pages perso)

Deacutelais de publication assez longs 1-2 ans

Publication agrave fins de prestige carriegravere et drsquoattributionFournit une version de reacutefeacuterence pour les travaux agrave venir

Seulement 50 des articles citeacutes aujourdrsquohuisont parus il y a moins de 10 ans

Environ 25 des articles citeacutes aujourdrsquohuisont parus il y a plus de 20 ans

FreacuteDoc Brodeaux 11102011 3 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesDimension modeste forte croissance

Une estimation de la taille du corpus matheacutematique publieacute dans la traditionoccidentale depuis Euclide

3 millions de textes couvrant lt 100 millions de pages

100 000 nouveaux textes paraissent chaque anneacutee

80 articles de revues 10 chapitres dans des ouvrages collectifs10 livres

lt 10 parus avant 1900

gt 80 parus apregraves 1950

FreacuteDoc Brodeaux 11102011 4 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesUne grande varieacuteteacute drsquoacteurs

Grande diversiteacute eacuteditoriale pas de modegravele eacuteconomique dominant

Environ 600 revues vivantes deacutedieacutees agrave la recherche matheacutematique(dont une vingtaine en France)

2000 peacuteriodiques comportant des articles de maths

Importance des livres

De nombreux eacutediteurs de taille modeste font un travail scientifiquede premier plan (laboratoires socieacuteteacutes savantes PME )

Les publications de laboratoires sont souvent en accegraves libre

Les structures priveacutees preacutefegraverent souvent assurer la peacuterenniteacute de leursservices en limitant le libre accegraves (embargo partiel ou total)

FreacuteDoc Brodeaux 11102011 5 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryCIP-ICT-PSP200924 Open access to scientific information

FreacuteDoc Brodeaux 11102011 6 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryVision EuDML (2008)

La bibliothegraveque numeacuterique de matheacutematiques devrait srsquoefforcer de reacuteunirun corpus matheacutematique aussi vaste que possible pour

le preacuteserver agrave tregraves long terme

le rendre disponible en ligne

en accegraves libre agrave terme

sous la forme drsquoun collection de reacutefeacuterence

alimenteacutee en continu par les nouveauteacutes des eacutediteurs

valoriseacutee par des outils de recherche et drsquointeropeacuterabiliteacute sophistiqueacutes

deacuteveloppeacutee et entretenue par un reacuteseau drsquoinstitutions

=rArr EuDML projet pilote CIP 2010-2013

FreacuteDoc Brodeaux 11102011 7 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryVision EuDML (2008)

La bibliothegraveque numeacuterique de matheacutematiques devrait srsquoefforcer de reacuteunirun corpus matheacutematique aussi vaste que possible pour

le preacuteserver agrave tregraves long terme

le rendre disponible en ligne

en accegraves libre agrave terme

sous la forme drsquoun collection de reacutefeacuterence

alimenteacutee en continu par les nouveauteacutes des eacutediteurs

valoriseacutee par des outils de recherche et drsquointeropeacuterabiliteacute sophistiqueacutes

deacuteveloppeacutee et entretenue par un reacuteseau drsquoinstitutions

=rArr EuDML projet pilote CIP 2010-2013

FreacuteDoc Brodeaux 11102011 7 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Le projet EuDMLFiche drsquoidentiteacute

EuDML Impleacutementation pilote (orienteacutee utilisateur final) drsquoun guichetdrsquoaccegraves unique au contenu matheacutematique fourni par11 institutionsavec des fonctions innovantes de recherche accessibiliteacutemultilinguisme navigation et interactiviteacute

Consortium 12 + 12 participants europeacuteens 1 + 12 partenaires associeacutesPortugal (1) Royaume-Uni (2) Espagne (2) France (3)Allemagne (2) Pologne (1) Reacutepublique Tchegraveque (2) Gregravece (1)Bulgarie (1)

Profil 3 anneacutees (01022010-31012013) 487 PMFinancement max CE 16 Meuro

Contenu 250 revues 235 000 textes 2 600 000 pages

FreacuteDoc Brodeaux 11102011 8 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSynthegravese

Collections 225 peacuteriodiques et seacuteries 235 000 textes 2 600 000 pagesAllemagne ERAMJFM GDZ ELibM (85 000 textes)

France Gallica-Math NUMDAM CEDRAM EDPS TEL (50 000 textes)Reacutep Tchegraveque DML-CZ (27 000 textes)

Russie RusDML (17 000 textes)Pologne DML-PL (14 000 textes)

Gregravece HDML (2 400 textes)Espagne DML-E (6 400 textes)Portugal SPMBNP (2 000 textes)Bulgarie BulDML (450 textes)

Reacutetro BNPSPMIST DML-CZ DML-E DML-PL Gallica GDZHDML NUMDAM RusDML

Natif BulDML CEDRAM DML-CZ DML-E DML-PL EDPSELibM NUMDAM

FreacuteDoc Brodeaux 11102011 13 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSeacutelection

Processus En cascade Projet rarr institution rarr collections

Critegraveres Textes matheacutematiques publieacutes et valideacutes scientifiquementdestineacutes agrave servir de reacutefeacuterence

bull Pour ecirctre eacuteligible il faut une paire(texte inteacutegral [PDF] meacutetadonneacutees [XML])archiveacutee par lrsquoune des institutions partenaires

Items Un item EuDML est lrsquouniteacute logique pertinente pour lrsquoutilisateurUne monographie un volume une œuvre en plusieurs tomes unarticle de revue une contribution dans un livre collectif unecommunication publieacutee dans des actes

bull Agrave ce jour 235 000 items dans 12 collections(185 000 articles 45 000 chapitres et contributions 2 500 livres300 œuvres en plusieurs tomes)

FreacuteDoc Brodeaux 11102011 14 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLDeacutetenteurs du copyrightDomaine public Quelques revues la plupart des livres

Public 50 universiteacutes acadeacutemies instituts laboratoires

Fondations Compositio Mathematica quelques ASBL

Socieacuteteacutes 20 socieacuteteacutes savantes

Eacutediteurs 45 revuesBirkhaumluser 5 revues (GDZ)

EDPS 7 revues (5 agrave jour dans NUMDAM)Elsevier 5 revues 1 agrave jour (NUMDAM)

de Gruyter 2 revues (GDZ)Heldermann 6 revues (5 agrave jour dans ELibM)

Hindawi 12 revues (agrave jour dans ELibM)Noordhoff 1 revue (NUMDAM)AK Peters 1 revue (ELibM)

Springer 2 peacuteriodiques (NUMDAM 1 revue agrave jour rarr 2007)9 revues (GDZ)

FreacuteDoc Brodeaux 11102011 15 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLLe babel des formats

Les meacutetadonneacutees ont des structures et des niveaux de deacutetail tregraves variablesSQL Base de donneacutees maison DML-E

DTD maison MathDoc FIZ IST HDML

DTD standard DC Dspace minidml METS NLM

Nous avons baseacute le format EuDML v 10 surNLM Journal Archiving and Interchange Tag Suitepour le stockage et lrsquoeacutechange des meacutetadonneacutees

FreacuteDoc Brodeaux 11102011 16 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLScheacutema EuDMLNLM Journal Archiving and Interchange Tag Suite

PourLargement testeacute et exploiteacute (EDPS PubMed Central JSTOR )Standard NISOPreacutecis et flexible (donneacutees structureacutees et plates)Support MathML et alternativesDescription du contenu de peacuteriodiques livres collectionsPermet de stocker lrsquoinformation de tous les partenaires et extensible

ContreNeacutecessite un ldquoapplication profilerdquoConccedilu pour les textes inteacutegrauxPas tous les types de documents preacutevus (chapitre dans un livre eacutediteacute )

=rArr EuDML schema v 10Trois types de documents comme conteneurs article book mbookDeacuteviation minimale par rapport aux DTD NLM standardldquoBest practices recommendationrdquo

FreacuteDoc Brodeaux 11102011 17 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Reacutesultats

Reacutesultats de la premiegravere peacuteriodeAnalyse des contenus deacutefinition drsquoun format drsquoeacutechangeConfeacuterence agrave Prague en octobre 2010 pour discuter avec des partenairespotentiels (Springer LMS ) sur la base

Libre accegraves agrave terme (creacuteneau mobile)Nouveauteacutes fournies par les eacutediteurs et indexeacutees rapidementArchivage partageacute dans un reacuteseau de bibliothegraveques numeacuteriques de reacutefeacuterence

Constition drsquoune base de donneacutees avec 235 000 reacutefeacuterencesenviron 15 du contenu numeacuterique existant (13 de lrsquoexistant laquo DML raquo)

Une seacuterie drsquooutils destineacutes agrave ameacuteliorer lrsquoindexation lrsquoaccegraveset la visibiliteacute de ce corpus speacutecifiquement matheacutematique

Premiegravere deacutemo publique drsquoun prototype agrave demi fonctionnel

FreacuteDoc Brodeaux 11102011 18 19

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe
Page 8: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesEacutechelle de temps

Preacutepublications instantaneacutees (labos arXivHAL courriel pages perso)

Deacutelais de publication assez longs 1-2 ans

Publication agrave fins de prestige carriegravere et drsquoattributionFournit une version de reacutefeacuterence pour les travaux agrave venir

Seulement 50 des articles citeacutes aujourdrsquohuisont parus il y a moins de 10 ans

Environ 25 des articles citeacutes aujourdrsquohuisont parus il y a plus de 20 ans

FreacuteDoc Brodeaux 11102011 3 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesDimension modeste forte croissance

Une estimation de la taille du corpus matheacutematique publieacute dans la traditionoccidentale depuis Euclide

3 millions de textes couvrant lt 100 millions de pages

100 000 nouveaux textes paraissent chaque anneacutee

80 articles de revues 10 chapitres dans des ouvrages collectifs10 livres

lt 10 parus avant 1900

gt 80 parus apregraves 1950

FreacuteDoc Brodeaux 11102011 4 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesUne grande varieacuteteacute drsquoacteurs

Grande diversiteacute eacuteditoriale pas de modegravele eacuteconomique dominant

Environ 600 revues vivantes deacutedieacutees agrave la recherche matheacutematique(dont une vingtaine en France)

2000 peacuteriodiques comportant des articles de maths

Importance des livres

De nombreux eacutediteurs de taille modeste font un travail scientifiquede premier plan (laboratoires socieacuteteacutes savantes PME )

Les publications de laboratoires sont souvent en accegraves libre

Les structures priveacutees preacutefegraverent souvent assurer la peacuterenniteacute de leursservices en limitant le libre accegraves (embargo partiel ou total)

FreacuteDoc Brodeaux 11102011 5 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryCIP-ICT-PSP200924 Open access to scientific information

FreacuteDoc Brodeaux 11102011 6 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryVision EuDML (2008)

La bibliothegraveque numeacuterique de matheacutematiques devrait srsquoefforcer de reacuteunirun corpus matheacutematique aussi vaste que possible pour

le preacuteserver agrave tregraves long terme

le rendre disponible en ligne

en accegraves libre agrave terme

sous la forme drsquoun collection de reacutefeacuterence

alimenteacutee en continu par les nouveauteacutes des eacutediteurs

valoriseacutee par des outils de recherche et drsquointeropeacuterabiliteacute sophistiqueacutes

deacuteveloppeacutee et entretenue par un reacuteseau drsquoinstitutions

=rArr EuDML projet pilote CIP 2010-2013

FreacuteDoc Brodeaux 11102011 7 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryVision EuDML (2008)

La bibliothegraveque numeacuterique de matheacutematiques devrait srsquoefforcer de reacuteunirun corpus matheacutematique aussi vaste que possible pour

le preacuteserver agrave tregraves long terme

le rendre disponible en ligne

en accegraves libre agrave terme

sous la forme drsquoun collection de reacutefeacuterence

alimenteacutee en continu par les nouveauteacutes des eacutediteurs

valoriseacutee par des outils de recherche et drsquointeropeacuterabiliteacute sophistiqueacutes

deacuteveloppeacutee et entretenue par un reacuteseau drsquoinstitutions

=rArr EuDML projet pilote CIP 2010-2013

FreacuteDoc Brodeaux 11102011 7 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Le projet EuDMLFiche drsquoidentiteacute

EuDML Impleacutementation pilote (orienteacutee utilisateur final) drsquoun guichetdrsquoaccegraves unique au contenu matheacutematique fourni par11 institutionsavec des fonctions innovantes de recherche accessibiliteacutemultilinguisme navigation et interactiviteacute

Consortium 12 + 12 participants europeacuteens 1 + 12 partenaires associeacutesPortugal (1) Royaume-Uni (2) Espagne (2) France (3)Allemagne (2) Pologne (1) Reacutepublique Tchegraveque (2) Gregravece (1)Bulgarie (1)

Profil 3 anneacutees (01022010-31012013) 487 PMFinancement max CE 16 Meuro

Contenu 250 revues 235 000 textes 2 600 000 pages

FreacuteDoc Brodeaux 11102011 8 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSynthegravese

Collections 225 peacuteriodiques et seacuteries 235 000 textes 2 600 000 pagesAllemagne ERAMJFM GDZ ELibM (85 000 textes)

France Gallica-Math NUMDAM CEDRAM EDPS TEL (50 000 textes)Reacutep Tchegraveque DML-CZ (27 000 textes)

Russie RusDML (17 000 textes)Pologne DML-PL (14 000 textes)

Gregravece HDML (2 400 textes)Espagne DML-E (6 400 textes)Portugal SPMBNP (2 000 textes)Bulgarie BulDML (450 textes)

Reacutetro BNPSPMIST DML-CZ DML-E DML-PL Gallica GDZHDML NUMDAM RusDML

Natif BulDML CEDRAM DML-CZ DML-E DML-PL EDPSELibM NUMDAM

FreacuteDoc Brodeaux 11102011 13 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSeacutelection

Processus En cascade Projet rarr institution rarr collections

Critegraveres Textes matheacutematiques publieacutes et valideacutes scientifiquementdestineacutes agrave servir de reacutefeacuterence

bull Pour ecirctre eacuteligible il faut une paire(texte inteacutegral [PDF] meacutetadonneacutees [XML])archiveacutee par lrsquoune des institutions partenaires

Items Un item EuDML est lrsquouniteacute logique pertinente pour lrsquoutilisateurUne monographie un volume une œuvre en plusieurs tomes unarticle de revue une contribution dans un livre collectif unecommunication publieacutee dans des actes

bull Agrave ce jour 235 000 items dans 12 collections(185 000 articles 45 000 chapitres et contributions 2 500 livres300 œuvres en plusieurs tomes)

FreacuteDoc Brodeaux 11102011 14 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLDeacutetenteurs du copyrightDomaine public Quelques revues la plupart des livres

Public 50 universiteacutes acadeacutemies instituts laboratoires

Fondations Compositio Mathematica quelques ASBL

Socieacuteteacutes 20 socieacuteteacutes savantes

Eacutediteurs 45 revuesBirkhaumluser 5 revues (GDZ)

EDPS 7 revues (5 agrave jour dans NUMDAM)Elsevier 5 revues 1 agrave jour (NUMDAM)

de Gruyter 2 revues (GDZ)Heldermann 6 revues (5 agrave jour dans ELibM)

Hindawi 12 revues (agrave jour dans ELibM)Noordhoff 1 revue (NUMDAM)AK Peters 1 revue (ELibM)

Springer 2 peacuteriodiques (NUMDAM 1 revue agrave jour rarr 2007)9 revues (GDZ)

FreacuteDoc Brodeaux 11102011 15 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLLe babel des formats

Les meacutetadonneacutees ont des structures et des niveaux de deacutetail tregraves variablesSQL Base de donneacutees maison DML-E

DTD maison MathDoc FIZ IST HDML

DTD standard DC Dspace minidml METS NLM

Nous avons baseacute le format EuDML v 10 surNLM Journal Archiving and Interchange Tag Suitepour le stockage et lrsquoeacutechange des meacutetadonneacutees

FreacuteDoc Brodeaux 11102011 16 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLScheacutema EuDMLNLM Journal Archiving and Interchange Tag Suite

PourLargement testeacute et exploiteacute (EDPS PubMed Central JSTOR )Standard NISOPreacutecis et flexible (donneacutees structureacutees et plates)Support MathML et alternativesDescription du contenu de peacuteriodiques livres collectionsPermet de stocker lrsquoinformation de tous les partenaires et extensible

ContreNeacutecessite un ldquoapplication profilerdquoConccedilu pour les textes inteacutegrauxPas tous les types de documents preacutevus (chapitre dans un livre eacutediteacute )

=rArr EuDML schema v 10Trois types de documents comme conteneurs article book mbookDeacuteviation minimale par rapport aux DTD NLM standardldquoBest practices recommendationrdquo

FreacuteDoc Brodeaux 11102011 17 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Reacutesultats

Reacutesultats de la premiegravere peacuteriodeAnalyse des contenus deacutefinition drsquoun format drsquoeacutechangeConfeacuterence agrave Prague en octobre 2010 pour discuter avec des partenairespotentiels (Springer LMS ) sur la base

Libre accegraves agrave terme (creacuteneau mobile)Nouveauteacutes fournies par les eacutediteurs et indexeacutees rapidementArchivage partageacute dans un reacuteseau de bibliothegraveques numeacuteriques de reacutefeacuterence

Constition drsquoune base de donneacutees avec 235 000 reacutefeacuterencesenviron 15 du contenu numeacuterique existant (13 de lrsquoexistant laquo DML raquo)

Une seacuterie drsquooutils destineacutes agrave ameacuteliorer lrsquoindexation lrsquoaccegraveset la visibiliteacute de ce corpus speacutecifiquement matheacutematique

Premiegravere deacutemo publique drsquoun prototype agrave demi fonctionnel

FreacuteDoc Brodeaux 11102011 18 19

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe
Page 9: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesDimension modeste forte croissance

Une estimation de la taille du corpus matheacutematique publieacute dans la traditionoccidentale depuis Euclide

3 millions de textes couvrant lt 100 millions de pages

100 000 nouveaux textes paraissent chaque anneacutee

80 articles de revues 10 chapitres dans des ouvrages collectifs10 livres

lt 10 parus avant 1900

gt 80 parus apregraves 1950

FreacuteDoc Brodeaux 11102011 4 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesUne grande varieacuteteacute drsquoacteurs

Grande diversiteacute eacuteditoriale pas de modegravele eacuteconomique dominant

Environ 600 revues vivantes deacutedieacutees agrave la recherche matheacutematique(dont une vingtaine en France)

2000 peacuteriodiques comportant des articles de maths

Importance des livres

De nombreux eacutediteurs de taille modeste font un travail scientifiquede premier plan (laboratoires socieacuteteacutes savantes PME )

Les publications de laboratoires sont souvent en accegraves libre

Les structures priveacutees preacutefegraverent souvent assurer la peacuterenniteacute de leursservices en limitant le libre accegraves (embargo partiel ou total)

FreacuteDoc Brodeaux 11102011 5 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryCIP-ICT-PSP200924 Open access to scientific information

FreacuteDoc Brodeaux 11102011 6 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryVision EuDML (2008)

La bibliothegraveque numeacuterique de matheacutematiques devrait srsquoefforcer de reacuteunirun corpus matheacutematique aussi vaste que possible pour

le preacuteserver agrave tregraves long terme

le rendre disponible en ligne

en accegraves libre agrave terme

sous la forme drsquoun collection de reacutefeacuterence

alimenteacutee en continu par les nouveauteacutes des eacutediteurs

valoriseacutee par des outils de recherche et drsquointeropeacuterabiliteacute sophistiqueacutes

deacuteveloppeacutee et entretenue par un reacuteseau drsquoinstitutions

=rArr EuDML projet pilote CIP 2010-2013

FreacuteDoc Brodeaux 11102011 7 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryVision EuDML (2008)

La bibliothegraveque numeacuterique de matheacutematiques devrait srsquoefforcer de reacuteunirun corpus matheacutematique aussi vaste que possible pour

le preacuteserver agrave tregraves long terme

le rendre disponible en ligne

en accegraves libre agrave terme

sous la forme drsquoun collection de reacutefeacuterence

alimenteacutee en continu par les nouveauteacutes des eacutediteurs

valoriseacutee par des outils de recherche et drsquointeropeacuterabiliteacute sophistiqueacutes

deacuteveloppeacutee et entretenue par un reacuteseau drsquoinstitutions

=rArr EuDML projet pilote CIP 2010-2013

FreacuteDoc Brodeaux 11102011 7 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Le projet EuDMLFiche drsquoidentiteacute

EuDML Impleacutementation pilote (orienteacutee utilisateur final) drsquoun guichetdrsquoaccegraves unique au contenu matheacutematique fourni par11 institutionsavec des fonctions innovantes de recherche accessibiliteacutemultilinguisme navigation et interactiviteacute

Consortium 12 + 12 participants europeacuteens 1 + 12 partenaires associeacutesPortugal (1) Royaume-Uni (2) Espagne (2) France (3)Allemagne (2) Pologne (1) Reacutepublique Tchegraveque (2) Gregravece (1)Bulgarie (1)

Profil 3 anneacutees (01022010-31012013) 487 PMFinancement max CE 16 Meuro

Contenu 250 revues 235 000 textes 2 600 000 pages

FreacuteDoc Brodeaux 11102011 8 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSynthegravese

Collections 225 peacuteriodiques et seacuteries 235 000 textes 2 600 000 pagesAllemagne ERAMJFM GDZ ELibM (85 000 textes)

France Gallica-Math NUMDAM CEDRAM EDPS TEL (50 000 textes)Reacutep Tchegraveque DML-CZ (27 000 textes)

Russie RusDML (17 000 textes)Pologne DML-PL (14 000 textes)

Gregravece HDML (2 400 textes)Espagne DML-E (6 400 textes)Portugal SPMBNP (2 000 textes)Bulgarie BulDML (450 textes)

Reacutetro BNPSPMIST DML-CZ DML-E DML-PL Gallica GDZHDML NUMDAM RusDML

Natif BulDML CEDRAM DML-CZ DML-E DML-PL EDPSELibM NUMDAM

FreacuteDoc Brodeaux 11102011 13 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSeacutelection

Processus En cascade Projet rarr institution rarr collections

Critegraveres Textes matheacutematiques publieacutes et valideacutes scientifiquementdestineacutes agrave servir de reacutefeacuterence

bull Pour ecirctre eacuteligible il faut une paire(texte inteacutegral [PDF] meacutetadonneacutees [XML])archiveacutee par lrsquoune des institutions partenaires

Items Un item EuDML est lrsquouniteacute logique pertinente pour lrsquoutilisateurUne monographie un volume une œuvre en plusieurs tomes unarticle de revue une contribution dans un livre collectif unecommunication publieacutee dans des actes

bull Agrave ce jour 235 000 items dans 12 collections(185 000 articles 45 000 chapitres et contributions 2 500 livres300 œuvres en plusieurs tomes)

FreacuteDoc Brodeaux 11102011 14 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLDeacutetenteurs du copyrightDomaine public Quelques revues la plupart des livres

Public 50 universiteacutes acadeacutemies instituts laboratoires

Fondations Compositio Mathematica quelques ASBL

Socieacuteteacutes 20 socieacuteteacutes savantes

Eacutediteurs 45 revuesBirkhaumluser 5 revues (GDZ)

EDPS 7 revues (5 agrave jour dans NUMDAM)Elsevier 5 revues 1 agrave jour (NUMDAM)

de Gruyter 2 revues (GDZ)Heldermann 6 revues (5 agrave jour dans ELibM)

Hindawi 12 revues (agrave jour dans ELibM)Noordhoff 1 revue (NUMDAM)AK Peters 1 revue (ELibM)

Springer 2 peacuteriodiques (NUMDAM 1 revue agrave jour rarr 2007)9 revues (GDZ)

FreacuteDoc Brodeaux 11102011 15 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLLe babel des formats

Les meacutetadonneacutees ont des structures et des niveaux de deacutetail tregraves variablesSQL Base de donneacutees maison DML-E

DTD maison MathDoc FIZ IST HDML

DTD standard DC Dspace minidml METS NLM

Nous avons baseacute le format EuDML v 10 surNLM Journal Archiving and Interchange Tag Suitepour le stockage et lrsquoeacutechange des meacutetadonneacutees

FreacuteDoc Brodeaux 11102011 16 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLScheacutema EuDMLNLM Journal Archiving and Interchange Tag Suite

PourLargement testeacute et exploiteacute (EDPS PubMed Central JSTOR )Standard NISOPreacutecis et flexible (donneacutees structureacutees et plates)Support MathML et alternativesDescription du contenu de peacuteriodiques livres collectionsPermet de stocker lrsquoinformation de tous les partenaires et extensible

ContreNeacutecessite un ldquoapplication profilerdquoConccedilu pour les textes inteacutegrauxPas tous les types de documents preacutevus (chapitre dans un livre eacutediteacute )

=rArr EuDML schema v 10Trois types de documents comme conteneurs article book mbookDeacuteviation minimale par rapport aux DTD NLM standardldquoBest practices recommendationrdquo

FreacuteDoc Brodeaux 11102011 17 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Reacutesultats

Reacutesultats de la premiegravere peacuteriodeAnalyse des contenus deacutefinition drsquoun format drsquoeacutechangeConfeacuterence agrave Prague en octobre 2010 pour discuter avec des partenairespotentiels (Springer LMS ) sur la base

Libre accegraves agrave terme (creacuteneau mobile)Nouveauteacutes fournies par les eacutediteurs et indexeacutees rapidementArchivage partageacute dans un reacuteseau de bibliothegraveques numeacuteriques de reacutefeacuterence

Constition drsquoune base de donneacutees avec 235 000 reacutefeacuterencesenviron 15 du contenu numeacuterique existant (13 de lrsquoexistant laquo DML raquo)

Une seacuterie drsquooutils destineacutes agrave ameacuteliorer lrsquoindexation lrsquoaccegraveset la visibiliteacute de ce corpus speacutecifiquement matheacutematique

Premiegravere deacutemo publique drsquoun prototype agrave demi fonctionnel

FreacuteDoc Brodeaux 11102011 18 19

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe
Page 10: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

La documentation en matheacutematiquesUne grande varieacuteteacute drsquoacteurs

Grande diversiteacute eacuteditoriale pas de modegravele eacuteconomique dominant

Environ 600 revues vivantes deacutedieacutees agrave la recherche matheacutematique(dont une vingtaine en France)

2000 peacuteriodiques comportant des articles de maths

Importance des livres

De nombreux eacutediteurs de taille modeste font un travail scientifiquede premier plan (laboratoires socieacuteteacutes savantes PME )

Les publications de laboratoires sont souvent en accegraves libre

Les structures priveacutees preacutefegraverent souvent assurer la peacuterenniteacute de leursservices en limitant le libre accegraves (embargo partiel ou total)

FreacuteDoc Brodeaux 11102011 5 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryCIP-ICT-PSP200924 Open access to scientific information

FreacuteDoc Brodeaux 11102011 6 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryVision EuDML (2008)

La bibliothegraveque numeacuterique de matheacutematiques devrait srsquoefforcer de reacuteunirun corpus matheacutematique aussi vaste que possible pour

le preacuteserver agrave tregraves long terme

le rendre disponible en ligne

en accegraves libre agrave terme

sous la forme drsquoun collection de reacutefeacuterence

alimenteacutee en continu par les nouveauteacutes des eacutediteurs

valoriseacutee par des outils de recherche et drsquointeropeacuterabiliteacute sophistiqueacutes

deacuteveloppeacutee et entretenue par un reacuteseau drsquoinstitutions

=rArr EuDML projet pilote CIP 2010-2013

FreacuteDoc Brodeaux 11102011 7 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryVision EuDML (2008)

La bibliothegraveque numeacuterique de matheacutematiques devrait srsquoefforcer de reacuteunirun corpus matheacutematique aussi vaste que possible pour

le preacuteserver agrave tregraves long terme

le rendre disponible en ligne

en accegraves libre agrave terme

sous la forme drsquoun collection de reacutefeacuterence

alimenteacutee en continu par les nouveauteacutes des eacutediteurs

valoriseacutee par des outils de recherche et drsquointeropeacuterabiliteacute sophistiqueacutes

deacuteveloppeacutee et entretenue par un reacuteseau drsquoinstitutions

=rArr EuDML projet pilote CIP 2010-2013

FreacuteDoc Brodeaux 11102011 7 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Le projet EuDMLFiche drsquoidentiteacute

EuDML Impleacutementation pilote (orienteacutee utilisateur final) drsquoun guichetdrsquoaccegraves unique au contenu matheacutematique fourni par11 institutionsavec des fonctions innovantes de recherche accessibiliteacutemultilinguisme navigation et interactiviteacute

Consortium 12 + 12 participants europeacuteens 1 + 12 partenaires associeacutesPortugal (1) Royaume-Uni (2) Espagne (2) France (3)Allemagne (2) Pologne (1) Reacutepublique Tchegraveque (2) Gregravece (1)Bulgarie (1)

Profil 3 anneacutees (01022010-31012013) 487 PMFinancement max CE 16 Meuro

Contenu 250 revues 235 000 textes 2 600 000 pages

FreacuteDoc Brodeaux 11102011 8 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSynthegravese

Collections 225 peacuteriodiques et seacuteries 235 000 textes 2 600 000 pagesAllemagne ERAMJFM GDZ ELibM (85 000 textes)

France Gallica-Math NUMDAM CEDRAM EDPS TEL (50 000 textes)Reacutep Tchegraveque DML-CZ (27 000 textes)

Russie RusDML (17 000 textes)Pologne DML-PL (14 000 textes)

Gregravece HDML (2 400 textes)Espagne DML-E (6 400 textes)Portugal SPMBNP (2 000 textes)Bulgarie BulDML (450 textes)

Reacutetro BNPSPMIST DML-CZ DML-E DML-PL Gallica GDZHDML NUMDAM RusDML

Natif BulDML CEDRAM DML-CZ DML-E DML-PL EDPSELibM NUMDAM

FreacuteDoc Brodeaux 11102011 13 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSeacutelection

Processus En cascade Projet rarr institution rarr collections

Critegraveres Textes matheacutematiques publieacutes et valideacutes scientifiquementdestineacutes agrave servir de reacutefeacuterence

bull Pour ecirctre eacuteligible il faut une paire(texte inteacutegral [PDF] meacutetadonneacutees [XML])archiveacutee par lrsquoune des institutions partenaires

Items Un item EuDML est lrsquouniteacute logique pertinente pour lrsquoutilisateurUne monographie un volume une œuvre en plusieurs tomes unarticle de revue une contribution dans un livre collectif unecommunication publieacutee dans des actes

bull Agrave ce jour 235 000 items dans 12 collections(185 000 articles 45 000 chapitres et contributions 2 500 livres300 œuvres en plusieurs tomes)

FreacuteDoc Brodeaux 11102011 14 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLDeacutetenteurs du copyrightDomaine public Quelques revues la plupart des livres

Public 50 universiteacutes acadeacutemies instituts laboratoires

Fondations Compositio Mathematica quelques ASBL

Socieacuteteacutes 20 socieacuteteacutes savantes

Eacutediteurs 45 revuesBirkhaumluser 5 revues (GDZ)

EDPS 7 revues (5 agrave jour dans NUMDAM)Elsevier 5 revues 1 agrave jour (NUMDAM)

de Gruyter 2 revues (GDZ)Heldermann 6 revues (5 agrave jour dans ELibM)

Hindawi 12 revues (agrave jour dans ELibM)Noordhoff 1 revue (NUMDAM)AK Peters 1 revue (ELibM)

Springer 2 peacuteriodiques (NUMDAM 1 revue agrave jour rarr 2007)9 revues (GDZ)

FreacuteDoc Brodeaux 11102011 15 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLLe babel des formats

Les meacutetadonneacutees ont des structures et des niveaux de deacutetail tregraves variablesSQL Base de donneacutees maison DML-E

DTD maison MathDoc FIZ IST HDML

DTD standard DC Dspace minidml METS NLM

Nous avons baseacute le format EuDML v 10 surNLM Journal Archiving and Interchange Tag Suitepour le stockage et lrsquoeacutechange des meacutetadonneacutees

FreacuteDoc Brodeaux 11102011 16 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLScheacutema EuDMLNLM Journal Archiving and Interchange Tag Suite

PourLargement testeacute et exploiteacute (EDPS PubMed Central JSTOR )Standard NISOPreacutecis et flexible (donneacutees structureacutees et plates)Support MathML et alternativesDescription du contenu de peacuteriodiques livres collectionsPermet de stocker lrsquoinformation de tous les partenaires et extensible

ContreNeacutecessite un ldquoapplication profilerdquoConccedilu pour les textes inteacutegrauxPas tous les types de documents preacutevus (chapitre dans un livre eacutediteacute )

=rArr EuDML schema v 10Trois types de documents comme conteneurs article book mbookDeacuteviation minimale par rapport aux DTD NLM standardldquoBest practices recommendationrdquo

FreacuteDoc Brodeaux 11102011 17 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Reacutesultats

Reacutesultats de la premiegravere peacuteriodeAnalyse des contenus deacutefinition drsquoun format drsquoeacutechangeConfeacuterence agrave Prague en octobre 2010 pour discuter avec des partenairespotentiels (Springer LMS ) sur la base

Libre accegraves agrave terme (creacuteneau mobile)Nouveauteacutes fournies par les eacutediteurs et indexeacutees rapidementArchivage partageacute dans un reacuteseau de bibliothegraveques numeacuteriques de reacutefeacuterence

Constition drsquoune base de donneacutees avec 235 000 reacutefeacuterencesenviron 15 du contenu numeacuterique existant (13 de lrsquoexistant laquo DML raquo)

Une seacuterie drsquooutils destineacutes agrave ameacuteliorer lrsquoindexation lrsquoaccegraveset la visibiliteacute de ce corpus speacutecifiquement matheacutematique

Premiegravere deacutemo publique drsquoun prototype agrave demi fonctionnel

FreacuteDoc Brodeaux 11102011 18 19

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe
Page 11: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryCIP-ICT-PSP200924 Open access to scientific information

FreacuteDoc Brodeaux 11102011 6 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryVision EuDML (2008)

La bibliothegraveque numeacuterique de matheacutematiques devrait srsquoefforcer de reacuteunirun corpus matheacutematique aussi vaste que possible pour

le preacuteserver agrave tregraves long terme

le rendre disponible en ligne

en accegraves libre agrave terme

sous la forme drsquoun collection de reacutefeacuterence

alimenteacutee en continu par les nouveauteacutes des eacutediteurs

valoriseacutee par des outils de recherche et drsquointeropeacuterabiliteacute sophistiqueacutes

deacuteveloppeacutee et entretenue par un reacuteseau drsquoinstitutions

=rArr EuDML projet pilote CIP 2010-2013

FreacuteDoc Brodeaux 11102011 7 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryVision EuDML (2008)

La bibliothegraveque numeacuterique de matheacutematiques devrait srsquoefforcer de reacuteunirun corpus matheacutematique aussi vaste que possible pour

le preacuteserver agrave tregraves long terme

le rendre disponible en ligne

en accegraves libre agrave terme

sous la forme drsquoun collection de reacutefeacuterence

alimenteacutee en continu par les nouveauteacutes des eacutediteurs

valoriseacutee par des outils de recherche et drsquointeropeacuterabiliteacute sophistiqueacutes

deacuteveloppeacutee et entretenue par un reacuteseau drsquoinstitutions

=rArr EuDML projet pilote CIP 2010-2013

FreacuteDoc Brodeaux 11102011 7 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Le projet EuDMLFiche drsquoidentiteacute

EuDML Impleacutementation pilote (orienteacutee utilisateur final) drsquoun guichetdrsquoaccegraves unique au contenu matheacutematique fourni par11 institutionsavec des fonctions innovantes de recherche accessibiliteacutemultilinguisme navigation et interactiviteacute

Consortium 12 + 12 participants europeacuteens 1 + 12 partenaires associeacutesPortugal (1) Royaume-Uni (2) Espagne (2) France (3)Allemagne (2) Pologne (1) Reacutepublique Tchegraveque (2) Gregravece (1)Bulgarie (1)

Profil 3 anneacutees (01022010-31012013) 487 PMFinancement max CE 16 Meuro

Contenu 250 revues 235 000 textes 2 600 000 pages

FreacuteDoc Brodeaux 11102011 8 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSynthegravese

Collections 225 peacuteriodiques et seacuteries 235 000 textes 2 600 000 pagesAllemagne ERAMJFM GDZ ELibM (85 000 textes)

France Gallica-Math NUMDAM CEDRAM EDPS TEL (50 000 textes)Reacutep Tchegraveque DML-CZ (27 000 textes)

Russie RusDML (17 000 textes)Pologne DML-PL (14 000 textes)

Gregravece HDML (2 400 textes)Espagne DML-E (6 400 textes)Portugal SPMBNP (2 000 textes)Bulgarie BulDML (450 textes)

Reacutetro BNPSPMIST DML-CZ DML-E DML-PL Gallica GDZHDML NUMDAM RusDML

Natif BulDML CEDRAM DML-CZ DML-E DML-PL EDPSELibM NUMDAM

FreacuteDoc Brodeaux 11102011 13 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSeacutelection

Processus En cascade Projet rarr institution rarr collections

Critegraveres Textes matheacutematiques publieacutes et valideacutes scientifiquementdestineacutes agrave servir de reacutefeacuterence

bull Pour ecirctre eacuteligible il faut une paire(texte inteacutegral [PDF] meacutetadonneacutees [XML])archiveacutee par lrsquoune des institutions partenaires

Items Un item EuDML est lrsquouniteacute logique pertinente pour lrsquoutilisateurUne monographie un volume une œuvre en plusieurs tomes unarticle de revue une contribution dans un livre collectif unecommunication publieacutee dans des actes

bull Agrave ce jour 235 000 items dans 12 collections(185 000 articles 45 000 chapitres et contributions 2 500 livres300 œuvres en plusieurs tomes)

FreacuteDoc Brodeaux 11102011 14 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLDeacutetenteurs du copyrightDomaine public Quelques revues la plupart des livres

Public 50 universiteacutes acadeacutemies instituts laboratoires

Fondations Compositio Mathematica quelques ASBL

Socieacuteteacutes 20 socieacuteteacutes savantes

Eacutediteurs 45 revuesBirkhaumluser 5 revues (GDZ)

EDPS 7 revues (5 agrave jour dans NUMDAM)Elsevier 5 revues 1 agrave jour (NUMDAM)

de Gruyter 2 revues (GDZ)Heldermann 6 revues (5 agrave jour dans ELibM)

Hindawi 12 revues (agrave jour dans ELibM)Noordhoff 1 revue (NUMDAM)AK Peters 1 revue (ELibM)

Springer 2 peacuteriodiques (NUMDAM 1 revue agrave jour rarr 2007)9 revues (GDZ)

FreacuteDoc Brodeaux 11102011 15 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLLe babel des formats

Les meacutetadonneacutees ont des structures et des niveaux de deacutetail tregraves variablesSQL Base de donneacutees maison DML-E

DTD maison MathDoc FIZ IST HDML

DTD standard DC Dspace minidml METS NLM

Nous avons baseacute le format EuDML v 10 surNLM Journal Archiving and Interchange Tag Suitepour le stockage et lrsquoeacutechange des meacutetadonneacutees

FreacuteDoc Brodeaux 11102011 16 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLScheacutema EuDMLNLM Journal Archiving and Interchange Tag Suite

PourLargement testeacute et exploiteacute (EDPS PubMed Central JSTOR )Standard NISOPreacutecis et flexible (donneacutees structureacutees et plates)Support MathML et alternativesDescription du contenu de peacuteriodiques livres collectionsPermet de stocker lrsquoinformation de tous les partenaires et extensible

ContreNeacutecessite un ldquoapplication profilerdquoConccedilu pour les textes inteacutegrauxPas tous les types de documents preacutevus (chapitre dans un livre eacutediteacute )

=rArr EuDML schema v 10Trois types de documents comme conteneurs article book mbookDeacuteviation minimale par rapport aux DTD NLM standardldquoBest practices recommendationrdquo

FreacuteDoc Brodeaux 11102011 17 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Reacutesultats

Reacutesultats de la premiegravere peacuteriodeAnalyse des contenus deacutefinition drsquoun format drsquoeacutechangeConfeacuterence agrave Prague en octobre 2010 pour discuter avec des partenairespotentiels (Springer LMS ) sur la base

Libre accegraves agrave terme (creacuteneau mobile)Nouveauteacutes fournies par les eacutediteurs et indexeacutees rapidementArchivage partageacute dans un reacuteseau de bibliothegraveques numeacuteriques de reacutefeacuterence

Constition drsquoune base de donneacutees avec 235 000 reacutefeacuterencesenviron 15 du contenu numeacuterique existant (13 de lrsquoexistant laquo DML raquo)

Une seacuterie drsquooutils destineacutes agrave ameacuteliorer lrsquoindexation lrsquoaccegraveset la visibiliteacute de ce corpus speacutecifiquement matheacutematique

Premiegravere deacutemo publique drsquoun prototype agrave demi fonctionnel

FreacuteDoc Brodeaux 11102011 18 19

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe
Page 12: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryVision EuDML (2008)

La bibliothegraveque numeacuterique de matheacutematiques devrait srsquoefforcer de reacuteunirun corpus matheacutematique aussi vaste que possible pour

le preacuteserver agrave tregraves long terme

le rendre disponible en ligne

en accegraves libre agrave terme

sous la forme drsquoun collection de reacutefeacuterence

alimenteacutee en continu par les nouveauteacutes des eacutediteurs

valoriseacutee par des outils de recherche et drsquointeropeacuterabiliteacute sophistiqueacutes

deacuteveloppeacutee et entretenue par un reacuteseau drsquoinstitutions

=rArr EuDML projet pilote CIP 2010-2013

FreacuteDoc Brodeaux 11102011 7 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryVision EuDML (2008)

La bibliothegraveque numeacuterique de matheacutematiques devrait srsquoefforcer de reacuteunirun corpus matheacutematique aussi vaste que possible pour

le preacuteserver agrave tregraves long terme

le rendre disponible en ligne

en accegraves libre agrave terme

sous la forme drsquoun collection de reacutefeacuterence

alimenteacutee en continu par les nouveauteacutes des eacutediteurs

valoriseacutee par des outils de recherche et drsquointeropeacuterabiliteacute sophistiqueacutes

deacuteveloppeacutee et entretenue par un reacuteseau drsquoinstitutions

=rArr EuDML projet pilote CIP 2010-2013

FreacuteDoc Brodeaux 11102011 7 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Le projet EuDMLFiche drsquoidentiteacute

EuDML Impleacutementation pilote (orienteacutee utilisateur final) drsquoun guichetdrsquoaccegraves unique au contenu matheacutematique fourni par11 institutionsavec des fonctions innovantes de recherche accessibiliteacutemultilinguisme navigation et interactiviteacute

Consortium 12 + 12 participants europeacuteens 1 + 12 partenaires associeacutesPortugal (1) Royaume-Uni (2) Espagne (2) France (3)Allemagne (2) Pologne (1) Reacutepublique Tchegraveque (2) Gregravece (1)Bulgarie (1)

Profil 3 anneacutees (01022010-31012013) 487 PMFinancement max CE 16 Meuro

Contenu 250 revues 235 000 textes 2 600 000 pages

FreacuteDoc Brodeaux 11102011 8 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSynthegravese

Collections 225 peacuteriodiques et seacuteries 235 000 textes 2 600 000 pagesAllemagne ERAMJFM GDZ ELibM (85 000 textes)

France Gallica-Math NUMDAM CEDRAM EDPS TEL (50 000 textes)Reacutep Tchegraveque DML-CZ (27 000 textes)

Russie RusDML (17 000 textes)Pologne DML-PL (14 000 textes)

Gregravece HDML (2 400 textes)Espagne DML-E (6 400 textes)Portugal SPMBNP (2 000 textes)Bulgarie BulDML (450 textes)

Reacutetro BNPSPMIST DML-CZ DML-E DML-PL Gallica GDZHDML NUMDAM RusDML

Natif BulDML CEDRAM DML-CZ DML-E DML-PL EDPSELibM NUMDAM

FreacuteDoc Brodeaux 11102011 13 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSeacutelection

Processus En cascade Projet rarr institution rarr collections

Critegraveres Textes matheacutematiques publieacutes et valideacutes scientifiquementdestineacutes agrave servir de reacutefeacuterence

bull Pour ecirctre eacuteligible il faut une paire(texte inteacutegral [PDF] meacutetadonneacutees [XML])archiveacutee par lrsquoune des institutions partenaires

Items Un item EuDML est lrsquouniteacute logique pertinente pour lrsquoutilisateurUne monographie un volume une œuvre en plusieurs tomes unarticle de revue une contribution dans un livre collectif unecommunication publieacutee dans des actes

bull Agrave ce jour 235 000 items dans 12 collections(185 000 articles 45 000 chapitres et contributions 2 500 livres300 œuvres en plusieurs tomes)

FreacuteDoc Brodeaux 11102011 14 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLDeacutetenteurs du copyrightDomaine public Quelques revues la plupart des livres

Public 50 universiteacutes acadeacutemies instituts laboratoires

Fondations Compositio Mathematica quelques ASBL

Socieacuteteacutes 20 socieacuteteacutes savantes

Eacutediteurs 45 revuesBirkhaumluser 5 revues (GDZ)

EDPS 7 revues (5 agrave jour dans NUMDAM)Elsevier 5 revues 1 agrave jour (NUMDAM)

de Gruyter 2 revues (GDZ)Heldermann 6 revues (5 agrave jour dans ELibM)

Hindawi 12 revues (agrave jour dans ELibM)Noordhoff 1 revue (NUMDAM)AK Peters 1 revue (ELibM)

Springer 2 peacuteriodiques (NUMDAM 1 revue agrave jour rarr 2007)9 revues (GDZ)

FreacuteDoc Brodeaux 11102011 15 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLLe babel des formats

Les meacutetadonneacutees ont des structures et des niveaux de deacutetail tregraves variablesSQL Base de donneacutees maison DML-E

DTD maison MathDoc FIZ IST HDML

DTD standard DC Dspace minidml METS NLM

Nous avons baseacute le format EuDML v 10 surNLM Journal Archiving and Interchange Tag Suitepour le stockage et lrsquoeacutechange des meacutetadonneacutees

FreacuteDoc Brodeaux 11102011 16 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLScheacutema EuDMLNLM Journal Archiving and Interchange Tag Suite

PourLargement testeacute et exploiteacute (EDPS PubMed Central JSTOR )Standard NISOPreacutecis et flexible (donneacutees structureacutees et plates)Support MathML et alternativesDescription du contenu de peacuteriodiques livres collectionsPermet de stocker lrsquoinformation de tous les partenaires et extensible

ContreNeacutecessite un ldquoapplication profilerdquoConccedilu pour les textes inteacutegrauxPas tous les types de documents preacutevus (chapitre dans un livre eacutediteacute )

=rArr EuDML schema v 10Trois types de documents comme conteneurs article book mbookDeacuteviation minimale par rapport aux DTD NLM standardldquoBest practices recommendationrdquo

FreacuteDoc Brodeaux 11102011 17 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Reacutesultats

Reacutesultats de la premiegravere peacuteriodeAnalyse des contenus deacutefinition drsquoun format drsquoeacutechangeConfeacuterence agrave Prague en octobre 2010 pour discuter avec des partenairespotentiels (Springer LMS ) sur la base

Libre accegraves agrave terme (creacuteneau mobile)Nouveauteacutes fournies par les eacutediteurs et indexeacutees rapidementArchivage partageacute dans un reacuteseau de bibliothegraveques numeacuteriques de reacutefeacuterence

Constition drsquoune base de donneacutees avec 235 000 reacutefeacuterencesenviron 15 du contenu numeacuterique existant (13 de lrsquoexistant laquo DML raquo)

Une seacuterie drsquooutils destineacutes agrave ameacuteliorer lrsquoindexation lrsquoaccegraveset la visibiliteacute de ce corpus speacutecifiquement matheacutematique

Premiegravere deacutemo publique drsquoun prototype agrave demi fonctionnel

FreacuteDoc Brodeaux 11102011 18 19

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe
Page 13: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryVision EuDML (2008)

La bibliothegraveque numeacuterique de matheacutematiques devrait srsquoefforcer de reacuteunirun corpus matheacutematique aussi vaste que possible pour

le preacuteserver agrave tregraves long terme

le rendre disponible en ligne

en accegraves libre agrave terme

sous la forme drsquoun collection de reacutefeacuterence

alimenteacutee en continu par les nouveauteacutes des eacutediteurs

valoriseacutee par des outils de recherche et drsquointeropeacuterabiliteacute sophistiqueacutes

deacuteveloppeacutee et entretenue par un reacuteseau drsquoinstitutions

=rArr EuDML projet pilote CIP 2010-2013

FreacuteDoc Brodeaux 11102011 7 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Le projet EuDMLFiche drsquoidentiteacute

EuDML Impleacutementation pilote (orienteacutee utilisateur final) drsquoun guichetdrsquoaccegraves unique au contenu matheacutematique fourni par11 institutionsavec des fonctions innovantes de recherche accessibiliteacutemultilinguisme navigation et interactiviteacute

Consortium 12 + 12 participants europeacuteens 1 + 12 partenaires associeacutesPortugal (1) Royaume-Uni (2) Espagne (2) France (3)Allemagne (2) Pologne (1) Reacutepublique Tchegraveque (2) Gregravece (1)Bulgarie (1)

Profil 3 anneacutees (01022010-31012013) 487 PMFinancement max CE 16 Meuro

Contenu 250 revues 235 000 textes 2 600 000 pages

FreacuteDoc Brodeaux 11102011 8 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSynthegravese

Collections 225 peacuteriodiques et seacuteries 235 000 textes 2 600 000 pagesAllemagne ERAMJFM GDZ ELibM (85 000 textes)

France Gallica-Math NUMDAM CEDRAM EDPS TEL (50 000 textes)Reacutep Tchegraveque DML-CZ (27 000 textes)

Russie RusDML (17 000 textes)Pologne DML-PL (14 000 textes)

Gregravece HDML (2 400 textes)Espagne DML-E (6 400 textes)Portugal SPMBNP (2 000 textes)Bulgarie BulDML (450 textes)

Reacutetro BNPSPMIST DML-CZ DML-E DML-PL Gallica GDZHDML NUMDAM RusDML

Natif BulDML CEDRAM DML-CZ DML-E DML-PL EDPSELibM NUMDAM

FreacuteDoc Brodeaux 11102011 13 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSeacutelection

Processus En cascade Projet rarr institution rarr collections

Critegraveres Textes matheacutematiques publieacutes et valideacutes scientifiquementdestineacutes agrave servir de reacutefeacuterence

bull Pour ecirctre eacuteligible il faut une paire(texte inteacutegral [PDF] meacutetadonneacutees [XML])archiveacutee par lrsquoune des institutions partenaires

Items Un item EuDML est lrsquouniteacute logique pertinente pour lrsquoutilisateurUne monographie un volume une œuvre en plusieurs tomes unarticle de revue une contribution dans un livre collectif unecommunication publieacutee dans des actes

bull Agrave ce jour 235 000 items dans 12 collections(185 000 articles 45 000 chapitres et contributions 2 500 livres300 œuvres en plusieurs tomes)

FreacuteDoc Brodeaux 11102011 14 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLDeacutetenteurs du copyrightDomaine public Quelques revues la plupart des livres

Public 50 universiteacutes acadeacutemies instituts laboratoires

Fondations Compositio Mathematica quelques ASBL

Socieacuteteacutes 20 socieacuteteacutes savantes

Eacutediteurs 45 revuesBirkhaumluser 5 revues (GDZ)

EDPS 7 revues (5 agrave jour dans NUMDAM)Elsevier 5 revues 1 agrave jour (NUMDAM)

de Gruyter 2 revues (GDZ)Heldermann 6 revues (5 agrave jour dans ELibM)

Hindawi 12 revues (agrave jour dans ELibM)Noordhoff 1 revue (NUMDAM)AK Peters 1 revue (ELibM)

Springer 2 peacuteriodiques (NUMDAM 1 revue agrave jour rarr 2007)9 revues (GDZ)

FreacuteDoc Brodeaux 11102011 15 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLLe babel des formats

Les meacutetadonneacutees ont des structures et des niveaux de deacutetail tregraves variablesSQL Base de donneacutees maison DML-E

DTD maison MathDoc FIZ IST HDML

DTD standard DC Dspace minidml METS NLM

Nous avons baseacute le format EuDML v 10 surNLM Journal Archiving and Interchange Tag Suitepour le stockage et lrsquoeacutechange des meacutetadonneacutees

FreacuteDoc Brodeaux 11102011 16 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLScheacutema EuDMLNLM Journal Archiving and Interchange Tag Suite

PourLargement testeacute et exploiteacute (EDPS PubMed Central JSTOR )Standard NISOPreacutecis et flexible (donneacutees structureacutees et plates)Support MathML et alternativesDescription du contenu de peacuteriodiques livres collectionsPermet de stocker lrsquoinformation de tous les partenaires et extensible

ContreNeacutecessite un ldquoapplication profilerdquoConccedilu pour les textes inteacutegrauxPas tous les types de documents preacutevus (chapitre dans un livre eacutediteacute )

=rArr EuDML schema v 10Trois types de documents comme conteneurs article book mbookDeacuteviation minimale par rapport aux DTD NLM standardldquoBest practices recommendationrdquo

FreacuteDoc Brodeaux 11102011 17 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Reacutesultats

Reacutesultats de la premiegravere peacuteriodeAnalyse des contenus deacutefinition drsquoun format drsquoeacutechangeConfeacuterence agrave Prague en octobre 2010 pour discuter avec des partenairespotentiels (Springer LMS ) sur la base

Libre accegraves agrave terme (creacuteneau mobile)Nouveauteacutes fournies par les eacutediteurs et indexeacutees rapidementArchivage partageacute dans un reacuteseau de bibliothegraveques numeacuteriques de reacutefeacuterence

Constition drsquoune base de donneacutees avec 235 000 reacutefeacuterencesenviron 15 du contenu numeacuterique existant (13 de lrsquoexistant laquo DML raquo)

Une seacuterie drsquooutils destineacutes agrave ameacuteliorer lrsquoindexation lrsquoaccegraveset la visibiliteacute de ce corpus speacutecifiquement matheacutematique

Premiegravere deacutemo publique drsquoun prototype agrave demi fonctionnel

FreacuteDoc Brodeaux 11102011 18 19

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe
Page 14: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Le projet EuDMLFiche drsquoidentiteacute

EuDML Impleacutementation pilote (orienteacutee utilisateur final) drsquoun guichetdrsquoaccegraves unique au contenu matheacutematique fourni par11 institutionsavec des fonctions innovantes de recherche accessibiliteacutemultilinguisme navigation et interactiviteacute

Consortium 12 + 12 participants europeacuteens 1 + 12 partenaires associeacutesPortugal (1) Royaume-Uni (2) Espagne (2) France (3)Allemagne (2) Pologne (1) Reacutepublique Tchegraveque (2) Gregravece (1)Bulgarie (1)

Profil 3 anneacutees (01022010-31012013) 487 PMFinancement max CE 16 Meuro

Contenu 250 revues 235 000 textes 2 600 000 pages

FreacuteDoc Brodeaux 11102011 8 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSynthegravese

Collections 225 peacuteriodiques et seacuteries 235 000 textes 2 600 000 pagesAllemagne ERAMJFM GDZ ELibM (85 000 textes)

France Gallica-Math NUMDAM CEDRAM EDPS TEL (50 000 textes)Reacutep Tchegraveque DML-CZ (27 000 textes)

Russie RusDML (17 000 textes)Pologne DML-PL (14 000 textes)

Gregravece HDML (2 400 textes)Espagne DML-E (6 400 textes)Portugal SPMBNP (2 000 textes)Bulgarie BulDML (450 textes)

Reacutetro BNPSPMIST DML-CZ DML-E DML-PL Gallica GDZHDML NUMDAM RusDML

Natif BulDML CEDRAM DML-CZ DML-E DML-PL EDPSELibM NUMDAM

FreacuteDoc Brodeaux 11102011 13 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSeacutelection

Processus En cascade Projet rarr institution rarr collections

Critegraveres Textes matheacutematiques publieacutes et valideacutes scientifiquementdestineacutes agrave servir de reacutefeacuterence

bull Pour ecirctre eacuteligible il faut une paire(texte inteacutegral [PDF] meacutetadonneacutees [XML])archiveacutee par lrsquoune des institutions partenaires

Items Un item EuDML est lrsquouniteacute logique pertinente pour lrsquoutilisateurUne monographie un volume une œuvre en plusieurs tomes unarticle de revue une contribution dans un livre collectif unecommunication publieacutee dans des actes

bull Agrave ce jour 235 000 items dans 12 collections(185 000 articles 45 000 chapitres et contributions 2 500 livres300 œuvres en plusieurs tomes)

FreacuteDoc Brodeaux 11102011 14 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLDeacutetenteurs du copyrightDomaine public Quelques revues la plupart des livres

Public 50 universiteacutes acadeacutemies instituts laboratoires

Fondations Compositio Mathematica quelques ASBL

Socieacuteteacutes 20 socieacuteteacutes savantes

Eacutediteurs 45 revuesBirkhaumluser 5 revues (GDZ)

EDPS 7 revues (5 agrave jour dans NUMDAM)Elsevier 5 revues 1 agrave jour (NUMDAM)

de Gruyter 2 revues (GDZ)Heldermann 6 revues (5 agrave jour dans ELibM)

Hindawi 12 revues (agrave jour dans ELibM)Noordhoff 1 revue (NUMDAM)AK Peters 1 revue (ELibM)

Springer 2 peacuteriodiques (NUMDAM 1 revue agrave jour rarr 2007)9 revues (GDZ)

FreacuteDoc Brodeaux 11102011 15 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLLe babel des formats

Les meacutetadonneacutees ont des structures et des niveaux de deacutetail tregraves variablesSQL Base de donneacutees maison DML-E

DTD maison MathDoc FIZ IST HDML

DTD standard DC Dspace minidml METS NLM

Nous avons baseacute le format EuDML v 10 surNLM Journal Archiving and Interchange Tag Suitepour le stockage et lrsquoeacutechange des meacutetadonneacutees

FreacuteDoc Brodeaux 11102011 16 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLScheacutema EuDMLNLM Journal Archiving and Interchange Tag Suite

PourLargement testeacute et exploiteacute (EDPS PubMed Central JSTOR )Standard NISOPreacutecis et flexible (donneacutees structureacutees et plates)Support MathML et alternativesDescription du contenu de peacuteriodiques livres collectionsPermet de stocker lrsquoinformation de tous les partenaires et extensible

ContreNeacutecessite un ldquoapplication profilerdquoConccedilu pour les textes inteacutegrauxPas tous les types de documents preacutevus (chapitre dans un livre eacutediteacute )

=rArr EuDML schema v 10Trois types de documents comme conteneurs article book mbookDeacuteviation minimale par rapport aux DTD NLM standardldquoBest practices recommendationrdquo

FreacuteDoc Brodeaux 11102011 17 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Reacutesultats

Reacutesultats de la premiegravere peacuteriodeAnalyse des contenus deacutefinition drsquoun format drsquoeacutechangeConfeacuterence agrave Prague en octobre 2010 pour discuter avec des partenairespotentiels (Springer LMS ) sur la base

Libre accegraves agrave terme (creacuteneau mobile)Nouveauteacutes fournies par les eacutediteurs et indexeacutees rapidementArchivage partageacute dans un reacuteseau de bibliothegraveques numeacuteriques de reacutefeacuterence

Constition drsquoune base de donneacutees avec 235 000 reacutefeacuterencesenviron 15 du contenu numeacuterique existant (13 de lrsquoexistant laquo DML raquo)

Une seacuterie drsquooutils destineacutes agrave ameacuteliorer lrsquoindexation lrsquoaccegraveset la visibiliteacute de ce corpus speacutecifiquement matheacutematique

Premiegravere deacutemo publique drsquoun prototype agrave demi fonctionnel

FreacuteDoc Brodeaux 11102011 18 19

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe
Page 15: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSynthegravese

Collections 225 peacuteriodiques et seacuteries 235 000 textes 2 600 000 pagesAllemagne ERAMJFM GDZ ELibM (85 000 textes)

France Gallica-Math NUMDAM CEDRAM EDPS TEL (50 000 textes)Reacutep Tchegraveque DML-CZ (27 000 textes)

Russie RusDML (17 000 textes)Pologne DML-PL (14 000 textes)

Gregravece HDML (2 400 textes)Espagne DML-E (6 400 textes)Portugal SPMBNP (2 000 textes)Bulgarie BulDML (450 textes)

Reacutetro BNPSPMIST DML-CZ DML-E DML-PL Gallica GDZHDML NUMDAM RusDML

Natif BulDML CEDRAM DML-CZ DML-E DML-PL EDPSELibM NUMDAM

FreacuteDoc Brodeaux 11102011 13 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSeacutelection

Processus En cascade Projet rarr institution rarr collections

Critegraveres Textes matheacutematiques publieacutes et valideacutes scientifiquementdestineacutes agrave servir de reacutefeacuterence

bull Pour ecirctre eacuteligible il faut une paire(texte inteacutegral [PDF] meacutetadonneacutees [XML])archiveacutee par lrsquoune des institutions partenaires

Items Un item EuDML est lrsquouniteacute logique pertinente pour lrsquoutilisateurUne monographie un volume une œuvre en plusieurs tomes unarticle de revue une contribution dans un livre collectif unecommunication publieacutee dans des actes

bull Agrave ce jour 235 000 items dans 12 collections(185 000 articles 45 000 chapitres et contributions 2 500 livres300 œuvres en plusieurs tomes)

FreacuteDoc Brodeaux 11102011 14 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLDeacutetenteurs du copyrightDomaine public Quelques revues la plupart des livres

Public 50 universiteacutes acadeacutemies instituts laboratoires

Fondations Compositio Mathematica quelques ASBL

Socieacuteteacutes 20 socieacuteteacutes savantes

Eacutediteurs 45 revuesBirkhaumluser 5 revues (GDZ)

EDPS 7 revues (5 agrave jour dans NUMDAM)Elsevier 5 revues 1 agrave jour (NUMDAM)

de Gruyter 2 revues (GDZ)Heldermann 6 revues (5 agrave jour dans ELibM)

Hindawi 12 revues (agrave jour dans ELibM)Noordhoff 1 revue (NUMDAM)AK Peters 1 revue (ELibM)

Springer 2 peacuteriodiques (NUMDAM 1 revue agrave jour rarr 2007)9 revues (GDZ)

FreacuteDoc Brodeaux 11102011 15 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLLe babel des formats

Les meacutetadonneacutees ont des structures et des niveaux de deacutetail tregraves variablesSQL Base de donneacutees maison DML-E

DTD maison MathDoc FIZ IST HDML

DTD standard DC Dspace minidml METS NLM

Nous avons baseacute le format EuDML v 10 surNLM Journal Archiving and Interchange Tag Suitepour le stockage et lrsquoeacutechange des meacutetadonneacutees

FreacuteDoc Brodeaux 11102011 16 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLScheacutema EuDMLNLM Journal Archiving and Interchange Tag Suite

PourLargement testeacute et exploiteacute (EDPS PubMed Central JSTOR )Standard NISOPreacutecis et flexible (donneacutees structureacutees et plates)Support MathML et alternativesDescription du contenu de peacuteriodiques livres collectionsPermet de stocker lrsquoinformation de tous les partenaires et extensible

ContreNeacutecessite un ldquoapplication profilerdquoConccedilu pour les textes inteacutegrauxPas tous les types de documents preacutevus (chapitre dans un livre eacutediteacute )

=rArr EuDML schema v 10Trois types de documents comme conteneurs article book mbookDeacuteviation minimale par rapport aux DTD NLM standardldquoBest practices recommendationrdquo

FreacuteDoc Brodeaux 11102011 17 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Reacutesultats

Reacutesultats de la premiegravere peacuteriodeAnalyse des contenus deacutefinition drsquoun format drsquoeacutechangeConfeacuterence agrave Prague en octobre 2010 pour discuter avec des partenairespotentiels (Springer LMS ) sur la base

Libre accegraves agrave terme (creacuteneau mobile)Nouveauteacutes fournies par les eacutediteurs et indexeacutees rapidementArchivage partageacute dans un reacuteseau de bibliothegraveques numeacuteriques de reacutefeacuterence

Constition drsquoune base de donneacutees avec 235 000 reacutefeacuterencesenviron 15 du contenu numeacuterique existant (13 de lrsquoexistant laquo DML raquo)

Une seacuterie drsquooutils destineacutes agrave ameacuteliorer lrsquoindexation lrsquoaccegraveset la visibiliteacute de ce corpus speacutecifiquement matheacutematique

Premiegravere deacutemo publique drsquoun prototype agrave demi fonctionnel

FreacuteDoc Brodeaux 11102011 18 19

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe
Page 16: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUn portail global

Un point drsquoaccegraves unifieacutePour les utilisateurs Un portail web personnalisable permettant de feuilleter

fouiller naviguer les collections

Pour les machines Des services pour transformer les reacutefeacuterences en liens

Beacuteneacutefices attendusFouille de textes matheacutematiques faciliteacutee

Plus de visibiliteacute pour un corpus eacuteclateacute

Un seul service pour lier les reacutefeacuterences

Valeur ajouteacutee aux articles nouveaux les reacutefeacuterences pointent quelque part

FreacuteDoc Brodeaux 11102011 9 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSynthegravese

Collections 225 peacuteriodiques et seacuteries 235 000 textes 2 600 000 pagesAllemagne ERAMJFM GDZ ELibM (85 000 textes)

France Gallica-Math NUMDAM CEDRAM EDPS TEL (50 000 textes)Reacutep Tchegraveque DML-CZ (27 000 textes)

Russie RusDML (17 000 textes)Pologne DML-PL (14 000 textes)

Gregravece HDML (2 400 textes)Espagne DML-E (6 400 textes)Portugal SPMBNP (2 000 textes)Bulgarie BulDML (450 textes)

Reacutetro BNPSPMIST DML-CZ DML-E DML-PL Gallica GDZHDML NUMDAM RusDML

Natif BulDML CEDRAM DML-CZ DML-E DML-PL EDPSELibM NUMDAM

FreacuteDoc Brodeaux 11102011 13 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSeacutelection

Processus En cascade Projet rarr institution rarr collections

Critegraveres Textes matheacutematiques publieacutes et valideacutes scientifiquementdestineacutes agrave servir de reacutefeacuterence

bull Pour ecirctre eacuteligible il faut une paire(texte inteacutegral [PDF] meacutetadonneacutees [XML])archiveacutee par lrsquoune des institutions partenaires

Items Un item EuDML est lrsquouniteacute logique pertinente pour lrsquoutilisateurUne monographie un volume une œuvre en plusieurs tomes unarticle de revue une contribution dans un livre collectif unecommunication publieacutee dans des actes

bull Agrave ce jour 235 000 items dans 12 collections(185 000 articles 45 000 chapitres et contributions 2 500 livres300 œuvres en plusieurs tomes)

FreacuteDoc Brodeaux 11102011 14 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLDeacutetenteurs du copyrightDomaine public Quelques revues la plupart des livres

Public 50 universiteacutes acadeacutemies instituts laboratoires

Fondations Compositio Mathematica quelques ASBL

Socieacuteteacutes 20 socieacuteteacutes savantes

Eacutediteurs 45 revuesBirkhaumluser 5 revues (GDZ)

EDPS 7 revues (5 agrave jour dans NUMDAM)Elsevier 5 revues 1 agrave jour (NUMDAM)

de Gruyter 2 revues (GDZ)Heldermann 6 revues (5 agrave jour dans ELibM)

Hindawi 12 revues (agrave jour dans ELibM)Noordhoff 1 revue (NUMDAM)AK Peters 1 revue (ELibM)

Springer 2 peacuteriodiques (NUMDAM 1 revue agrave jour rarr 2007)9 revues (GDZ)

FreacuteDoc Brodeaux 11102011 15 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLLe babel des formats

Les meacutetadonneacutees ont des structures et des niveaux de deacutetail tregraves variablesSQL Base de donneacutees maison DML-E

DTD maison MathDoc FIZ IST HDML

DTD standard DC Dspace minidml METS NLM

Nous avons baseacute le format EuDML v 10 surNLM Journal Archiving and Interchange Tag Suitepour le stockage et lrsquoeacutechange des meacutetadonneacutees

FreacuteDoc Brodeaux 11102011 16 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLScheacutema EuDMLNLM Journal Archiving and Interchange Tag Suite

PourLargement testeacute et exploiteacute (EDPS PubMed Central JSTOR )Standard NISOPreacutecis et flexible (donneacutees structureacutees et plates)Support MathML et alternativesDescription du contenu de peacuteriodiques livres collectionsPermet de stocker lrsquoinformation de tous les partenaires et extensible

ContreNeacutecessite un ldquoapplication profilerdquoConccedilu pour les textes inteacutegrauxPas tous les types de documents preacutevus (chapitre dans un livre eacutediteacute )

=rArr EuDML schema v 10Trois types de documents comme conteneurs article book mbookDeacuteviation minimale par rapport aux DTD NLM standardldquoBest practices recommendationrdquo

FreacuteDoc Brodeaux 11102011 17 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Reacutesultats

Reacutesultats de la premiegravere peacuteriodeAnalyse des contenus deacutefinition drsquoun format drsquoeacutechangeConfeacuterence agrave Prague en octobre 2010 pour discuter avec des partenairespotentiels (Springer LMS ) sur la base

Libre accegraves agrave terme (creacuteneau mobile)Nouveauteacutes fournies par les eacutediteurs et indexeacutees rapidementArchivage partageacute dans un reacuteseau de bibliothegraveques numeacuteriques de reacutefeacuterence

Constition drsquoune base de donneacutees avec 235 000 reacutefeacuterencesenviron 15 du contenu numeacuterique existant (13 de lrsquoexistant laquo DML raquo)

Une seacuterie drsquooutils destineacutes agrave ameacuteliorer lrsquoindexation lrsquoaccegraveset la visibiliteacute de ce corpus speacutecifiquement matheacutematique

Premiegravere deacutemo publique drsquoun prototype agrave demi fonctionnel

FreacuteDoc Brodeaux 11102011 18 19

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe
Page 17: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSynthegravese

Collections 225 peacuteriodiques et seacuteries 235 000 textes 2 600 000 pagesAllemagne ERAMJFM GDZ ELibM (85 000 textes)

France Gallica-Math NUMDAM CEDRAM EDPS TEL (50 000 textes)Reacutep Tchegraveque DML-CZ (27 000 textes)

Russie RusDML (17 000 textes)Pologne DML-PL (14 000 textes)

Gregravece HDML (2 400 textes)Espagne DML-E (6 400 textes)Portugal SPMBNP (2 000 textes)Bulgarie BulDML (450 textes)

Reacutetro BNPSPMIST DML-CZ DML-E DML-PL Gallica GDZHDML NUMDAM RusDML

Natif BulDML CEDRAM DML-CZ DML-E DML-PL EDPSELibM NUMDAM

FreacuteDoc Brodeaux 11102011 13 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSeacutelection

Processus En cascade Projet rarr institution rarr collections

Critegraveres Textes matheacutematiques publieacutes et valideacutes scientifiquementdestineacutes agrave servir de reacutefeacuterence

bull Pour ecirctre eacuteligible il faut une paire(texte inteacutegral [PDF] meacutetadonneacutees [XML])archiveacutee par lrsquoune des institutions partenaires

Items Un item EuDML est lrsquouniteacute logique pertinente pour lrsquoutilisateurUne monographie un volume une œuvre en plusieurs tomes unarticle de revue une contribution dans un livre collectif unecommunication publieacutee dans des actes

bull Agrave ce jour 235 000 items dans 12 collections(185 000 articles 45 000 chapitres et contributions 2 500 livres300 œuvres en plusieurs tomes)

FreacuteDoc Brodeaux 11102011 14 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLDeacutetenteurs du copyrightDomaine public Quelques revues la plupart des livres

Public 50 universiteacutes acadeacutemies instituts laboratoires

Fondations Compositio Mathematica quelques ASBL

Socieacuteteacutes 20 socieacuteteacutes savantes

Eacutediteurs 45 revuesBirkhaumluser 5 revues (GDZ)

EDPS 7 revues (5 agrave jour dans NUMDAM)Elsevier 5 revues 1 agrave jour (NUMDAM)

de Gruyter 2 revues (GDZ)Heldermann 6 revues (5 agrave jour dans ELibM)

Hindawi 12 revues (agrave jour dans ELibM)Noordhoff 1 revue (NUMDAM)AK Peters 1 revue (ELibM)

Springer 2 peacuteriodiques (NUMDAM 1 revue agrave jour rarr 2007)9 revues (GDZ)

FreacuteDoc Brodeaux 11102011 15 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLLe babel des formats

Les meacutetadonneacutees ont des structures et des niveaux de deacutetail tregraves variablesSQL Base de donneacutees maison DML-E

DTD maison MathDoc FIZ IST HDML

DTD standard DC Dspace minidml METS NLM

Nous avons baseacute le format EuDML v 10 surNLM Journal Archiving and Interchange Tag Suitepour le stockage et lrsquoeacutechange des meacutetadonneacutees

FreacuteDoc Brodeaux 11102011 16 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLScheacutema EuDMLNLM Journal Archiving and Interchange Tag Suite

PourLargement testeacute et exploiteacute (EDPS PubMed Central JSTOR )Standard NISOPreacutecis et flexible (donneacutees structureacutees et plates)Support MathML et alternativesDescription du contenu de peacuteriodiques livres collectionsPermet de stocker lrsquoinformation de tous les partenaires et extensible

ContreNeacutecessite un ldquoapplication profilerdquoConccedilu pour les textes inteacutegrauxPas tous les types de documents preacutevus (chapitre dans un livre eacutediteacute )

=rArr EuDML schema v 10Trois types de documents comme conteneurs article book mbookDeacuteviation minimale par rapport aux DTD NLM standardldquoBest practices recommendationrdquo

FreacuteDoc Brodeaux 11102011 17 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Reacutesultats

Reacutesultats de la premiegravere peacuteriodeAnalyse des contenus deacutefinition drsquoun format drsquoeacutechangeConfeacuterence agrave Prague en octobre 2010 pour discuter avec des partenairespotentiels (Springer LMS ) sur la base

Libre accegraves agrave terme (creacuteneau mobile)Nouveauteacutes fournies par les eacutediteurs et indexeacutees rapidementArchivage partageacute dans un reacuteseau de bibliothegraveques numeacuteriques de reacutefeacuterence

Constition drsquoune base de donneacutees avec 235 000 reacutefeacuterencesenviron 15 du contenu numeacuterique existant (13 de lrsquoexistant laquo DML raquo)

Une seacuterie drsquooutils destineacutes agrave ameacuteliorer lrsquoindexation lrsquoaccegraveset la visibiliteacute de ce corpus speacutecifiquement matheacutematique

Premiegravere deacutemo publique drsquoun prototype agrave demi fonctionnel

FreacuteDoc Brodeaux 11102011 18 19

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe
Page 18: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryUne archive reacutepartieUn reacuteseau drsquoinstitutions

Deacutemultiplier lrsquoimpact des projets DML europeacuteens

Une sorte de deacutepot leacutegal volontaire pour les textes matheacutematiques

Une archive reacutepartie indeacutependante des textes inteacutegraux

Des institutions scientifiques peacuterennes sans but lucratif pour assurerlrsquoentretien et la preacuteservation agrave long terme des collections

Beacuteneacutefices attendusLes contenus sont pris en charge par des tiers pour lrsquointeacuterecirct public

Disponibiliteacute du corpus sur le long terme

Les producteurs de contenus nrsquoont pas agrave se preacuteoccuper de lrsquoarchivagepeacuterenne

Les eacutediteurs font leur meacutetier les bibliotheacutecaires le leur(eacutedition susciter seacutelectionner produire les meilleurs textesbibliothegraveques seacutelectionner acqueacuterir organiser indexer donner accegraves)

FreacuteDoc Brodeaux 11102011 10 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSynthegravese

Collections 225 peacuteriodiques et seacuteries 235 000 textes 2 600 000 pagesAllemagne ERAMJFM GDZ ELibM (85 000 textes)

France Gallica-Math NUMDAM CEDRAM EDPS TEL (50 000 textes)Reacutep Tchegraveque DML-CZ (27 000 textes)

Russie RusDML (17 000 textes)Pologne DML-PL (14 000 textes)

Gregravece HDML (2 400 textes)Espagne DML-E (6 400 textes)Portugal SPMBNP (2 000 textes)Bulgarie BulDML (450 textes)

Reacutetro BNPSPMIST DML-CZ DML-E DML-PL Gallica GDZHDML NUMDAM RusDML

Natif BulDML CEDRAM DML-CZ DML-E DML-PL EDPSELibM NUMDAM

FreacuteDoc Brodeaux 11102011 13 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSeacutelection

Processus En cascade Projet rarr institution rarr collections

Critegraveres Textes matheacutematiques publieacutes et valideacutes scientifiquementdestineacutes agrave servir de reacutefeacuterence

bull Pour ecirctre eacuteligible il faut une paire(texte inteacutegral [PDF] meacutetadonneacutees [XML])archiveacutee par lrsquoune des institutions partenaires

Items Un item EuDML est lrsquouniteacute logique pertinente pour lrsquoutilisateurUne monographie un volume une œuvre en plusieurs tomes unarticle de revue une contribution dans un livre collectif unecommunication publieacutee dans des actes

bull Agrave ce jour 235 000 items dans 12 collections(185 000 articles 45 000 chapitres et contributions 2 500 livres300 œuvres en plusieurs tomes)

FreacuteDoc Brodeaux 11102011 14 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLDeacutetenteurs du copyrightDomaine public Quelques revues la plupart des livres

Public 50 universiteacutes acadeacutemies instituts laboratoires

Fondations Compositio Mathematica quelques ASBL

Socieacuteteacutes 20 socieacuteteacutes savantes

Eacutediteurs 45 revuesBirkhaumluser 5 revues (GDZ)

EDPS 7 revues (5 agrave jour dans NUMDAM)Elsevier 5 revues 1 agrave jour (NUMDAM)

de Gruyter 2 revues (GDZ)Heldermann 6 revues (5 agrave jour dans ELibM)

Hindawi 12 revues (agrave jour dans ELibM)Noordhoff 1 revue (NUMDAM)AK Peters 1 revue (ELibM)

Springer 2 peacuteriodiques (NUMDAM 1 revue agrave jour rarr 2007)9 revues (GDZ)

FreacuteDoc Brodeaux 11102011 15 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLLe babel des formats

Les meacutetadonneacutees ont des structures et des niveaux de deacutetail tregraves variablesSQL Base de donneacutees maison DML-E

DTD maison MathDoc FIZ IST HDML

DTD standard DC Dspace minidml METS NLM

Nous avons baseacute le format EuDML v 10 surNLM Journal Archiving and Interchange Tag Suitepour le stockage et lrsquoeacutechange des meacutetadonneacutees

FreacuteDoc Brodeaux 11102011 16 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLScheacutema EuDMLNLM Journal Archiving and Interchange Tag Suite

PourLargement testeacute et exploiteacute (EDPS PubMed Central JSTOR )Standard NISOPreacutecis et flexible (donneacutees structureacutees et plates)Support MathML et alternativesDescription du contenu de peacuteriodiques livres collectionsPermet de stocker lrsquoinformation de tous les partenaires et extensible

ContreNeacutecessite un ldquoapplication profilerdquoConccedilu pour les textes inteacutegrauxPas tous les types de documents preacutevus (chapitre dans un livre eacutediteacute )

=rArr EuDML schema v 10Trois types de documents comme conteneurs article book mbookDeacuteviation minimale par rapport aux DTD NLM standardldquoBest practices recommendationrdquo

FreacuteDoc Brodeaux 11102011 17 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Reacutesultats

Reacutesultats de la premiegravere peacuteriodeAnalyse des contenus deacutefinition drsquoun format drsquoeacutechangeConfeacuterence agrave Prague en octobre 2010 pour discuter avec des partenairespotentiels (Springer LMS ) sur la base

Libre accegraves agrave terme (creacuteneau mobile)Nouveauteacutes fournies par les eacutediteurs et indexeacutees rapidementArchivage partageacute dans un reacuteseau de bibliothegraveques numeacuteriques de reacutefeacuterence

Constition drsquoune base de donneacutees avec 235 000 reacutefeacuterencesenviron 15 du contenu numeacuterique existant (13 de lrsquoexistant laquo DML raquo)

Une seacuterie drsquooutils destineacutes agrave ameacuteliorer lrsquoindexation lrsquoaccegraveset la visibiliteacute de ce corpus speacutecifiquement matheacutematique

Premiegravere deacutemo publique drsquoun prototype agrave demi fonctionnel

FreacuteDoc Brodeaux 11102011 18 19

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe
Page 19: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSynthegravese

Collections 225 peacuteriodiques et seacuteries 235 000 textes 2 600 000 pagesAllemagne ERAMJFM GDZ ELibM (85 000 textes)

France Gallica-Math NUMDAM CEDRAM EDPS TEL (50 000 textes)Reacutep Tchegraveque DML-CZ (27 000 textes)

Russie RusDML (17 000 textes)Pologne DML-PL (14 000 textes)

Gregravece HDML (2 400 textes)Espagne DML-E (6 400 textes)Portugal SPMBNP (2 000 textes)Bulgarie BulDML (450 textes)

Reacutetro BNPSPMIST DML-CZ DML-E DML-PL Gallica GDZHDML NUMDAM RusDML

Natif BulDML CEDRAM DML-CZ DML-E DML-PL EDPSELibM NUMDAM

FreacuteDoc Brodeaux 11102011 13 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSeacutelection

Processus En cascade Projet rarr institution rarr collections

Critegraveres Textes matheacutematiques publieacutes et valideacutes scientifiquementdestineacutes agrave servir de reacutefeacuterence

bull Pour ecirctre eacuteligible il faut une paire(texte inteacutegral [PDF] meacutetadonneacutees [XML])archiveacutee par lrsquoune des institutions partenaires

Items Un item EuDML est lrsquouniteacute logique pertinente pour lrsquoutilisateurUne monographie un volume une œuvre en plusieurs tomes unarticle de revue une contribution dans un livre collectif unecommunication publieacutee dans des actes

bull Agrave ce jour 235 000 items dans 12 collections(185 000 articles 45 000 chapitres et contributions 2 500 livres300 œuvres en plusieurs tomes)

FreacuteDoc Brodeaux 11102011 14 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLDeacutetenteurs du copyrightDomaine public Quelques revues la plupart des livres

Public 50 universiteacutes acadeacutemies instituts laboratoires

Fondations Compositio Mathematica quelques ASBL

Socieacuteteacutes 20 socieacuteteacutes savantes

Eacutediteurs 45 revuesBirkhaumluser 5 revues (GDZ)

EDPS 7 revues (5 agrave jour dans NUMDAM)Elsevier 5 revues 1 agrave jour (NUMDAM)

de Gruyter 2 revues (GDZ)Heldermann 6 revues (5 agrave jour dans ELibM)

Hindawi 12 revues (agrave jour dans ELibM)Noordhoff 1 revue (NUMDAM)AK Peters 1 revue (ELibM)

Springer 2 peacuteriodiques (NUMDAM 1 revue agrave jour rarr 2007)9 revues (GDZ)

FreacuteDoc Brodeaux 11102011 15 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLLe babel des formats

Les meacutetadonneacutees ont des structures et des niveaux de deacutetail tregraves variablesSQL Base de donneacutees maison DML-E

DTD maison MathDoc FIZ IST HDML

DTD standard DC Dspace minidml METS NLM

Nous avons baseacute le format EuDML v 10 surNLM Journal Archiving and Interchange Tag Suitepour le stockage et lrsquoeacutechange des meacutetadonneacutees

FreacuteDoc Brodeaux 11102011 16 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLScheacutema EuDMLNLM Journal Archiving and Interchange Tag Suite

PourLargement testeacute et exploiteacute (EDPS PubMed Central JSTOR )Standard NISOPreacutecis et flexible (donneacutees structureacutees et plates)Support MathML et alternativesDescription du contenu de peacuteriodiques livres collectionsPermet de stocker lrsquoinformation de tous les partenaires et extensible

ContreNeacutecessite un ldquoapplication profilerdquoConccedilu pour les textes inteacutegrauxPas tous les types de documents preacutevus (chapitre dans un livre eacutediteacute )

=rArr EuDML schema v 10Trois types de documents comme conteneurs article book mbookDeacuteviation minimale par rapport aux DTD NLM standardldquoBest practices recommendationrdquo

FreacuteDoc Brodeaux 11102011 17 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Reacutesultats

Reacutesultats de la premiegravere peacuteriodeAnalyse des contenus deacutefinition drsquoun format drsquoeacutechangeConfeacuterence agrave Prague en octobre 2010 pour discuter avec des partenairespotentiels (Springer LMS ) sur la base

Libre accegraves agrave terme (creacuteneau mobile)Nouveauteacutes fournies par les eacutediteurs et indexeacutees rapidementArchivage partageacute dans un reacuteseau de bibliothegraveques numeacuteriques de reacutefeacuterence

Constition drsquoune base de donneacutees avec 235 000 reacutefeacuterencesenviron 15 du contenu numeacuterique existant (13 de lrsquoexistant laquo DML raquo)

Une seacuterie drsquooutils destineacutes agrave ameacuteliorer lrsquoindexation lrsquoaccegraveset la visibiliteacute de ce corpus speacutecifiquement matheacutematique

Premiegravere deacutemo publique drsquoun prototype agrave demi fonctionnel

FreacuteDoc Brodeaux 11102011 18 19

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe
Page 20: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryLibre accegraves agrave termeLe creacuteneau mobile

Lorsqursquoun eacutediteur a compleacuteteacute sa production une copie archivable(meacutetadonneacutees et tectes inteacutegraux) est fournie agrave lrsquoinstitution ad hoc

Ces contenus sont valideacutes et enregistreacutes

Les nouveaux textes sont indexeacutes et apparaissent dans les reacutesultats derecherches

Lrsquoaccegraves aux textes inteacutegraux se fait sur le site de lrsquoeacutediteur sous son controcircle

Agrave lrsquoissue du creacuteneau mobile la copie locale devient librement accessible

Beacuteneacutefices attendusLes textes inteacutegraux sont archiveacutes par des tiers peacuterennes

Meilleures visibiliteacute et navigabiliteacute du corpus y compris reacutecent

La quantiteacute de textes de reacutefeacuterence en libre accegraves augmente

La matheacutematique eacutetablie megravere de toutes les sciences agrave la porteacutee de tous

FreacuteDoc Brodeaux 11102011 11 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSynthegravese

Collections 225 peacuteriodiques et seacuteries 235 000 textes 2 600 000 pagesAllemagne ERAMJFM GDZ ELibM (85 000 textes)

France Gallica-Math NUMDAM CEDRAM EDPS TEL (50 000 textes)Reacutep Tchegraveque DML-CZ (27 000 textes)

Russie RusDML (17 000 textes)Pologne DML-PL (14 000 textes)

Gregravece HDML (2 400 textes)Espagne DML-E (6 400 textes)Portugal SPMBNP (2 000 textes)Bulgarie BulDML (450 textes)

Reacutetro BNPSPMIST DML-CZ DML-E DML-PL Gallica GDZHDML NUMDAM RusDML

Natif BulDML CEDRAM DML-CZ DML-E DML-PL EDPSELibM NUMDAM

FreacuteDoc Brodeaux 11102011 13 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSeacutelection

Processus En cascade Projet rarr institution rarr collections

Critegraveres Textes matheacutematiques publieacutes et valideacutes scientifiquementdestineacutes agrave servir de reacutefeacuterence

bull Pour ecirctre eacuteligible il faut une paire(texte inteacutegral [PDF] meacutetadonneacutees [XML])archiveacutee par lrsquoune des institutions partenaires

Items Un item EuDML est lrsquouniteacute logique pertinente pour lrsquoutilisateurUne monographie un volume une œuvre en plusieurs tomes unarticle de revue une contribution dans un livre collectif unecommunication publieacutee dans des actes

bull Agrave ce jour 235 000 items dans 12 collections(185 000 articles 45 000 chapitres et contributions 2 500 livres300 œuvres en plusieurs tomes)

FreacuteDoc Brodeaux 11102011 14 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLDeacutetenteurs du copyrightDomaine public Quelques revues la plupart des livres

Public 50 universiteacutes acadeacutemies instituts laboratoires

Fondations Compositio Mathematica quelques ASBL

Socieacuteteacutes 20 socieacuteteacutes savantes

Eacutediteurs 45 revuesBirkhaumluser 5 revues (GDZ)

EDPS 7 revues (5 agrave jour dans NUMDAM)Elsevier 5 revues 1 agrave jour (NUMDAM)

de Gruyter 2 revues (GDZ)Heldermann 6 revues (5 agrave jour dans ELibM)

Hindawi 12 revues (agrave jour dans ELibM)Noordhoff 1 revue (NUMDAM)AK Peters 1 revue (ELibM)

Springer 2 peacuteriodiques (NUMDAM 1 revue agrave jour rarr 2007)9 revues (GDZ)

FreacuteDoc Brodeaux 11102011 15 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLLe babel des formats

Les meacutetadonneacutees ont des structures et des niveaux de deacutetail tregraves variablesSQL Base de donneacutees maison DML-E

DTD maison MathDoc FIZ IST HDML

DTD standard DC Dspace minidml METS NLM

Nous avons baseacute le format EuDML v 10 surNLM Journal Archiving and Interchange Tag Suitepour le stockage et lrsquoeacutechange des meacutetadonneacutees

FreacuteDoc Brodeaux 11102011 16 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLScheacutema EuDMLNLM Journal Archiving and Interchange Tag Suite

PourLargement testeacute et exploiteacute (EDPS PubMed Central JSTOR )Standard NISOPreacutecis et flexible (donneacutees structureacutees et plates)Support MathML et alternativesDescription du contenu de peacuteriodiques livres collectionsPermet de stocker lrsquoinformation de tous les partenaires et extensible

ContreNeacutecessite un ldquoapplication profilerdquoConccedilu pour les textes inteacutegrauxPas tous les types de documents preacutevus (chapitre dans un livre eacutediteacute )

=rArr EuDML schema v 10Trois types de documents comme conteneurs article book mbookDeacuteviation minimale par rapport aux DTD NLM standardldquoBest practices recommendationrdquo

FreacuteDoc Brodeaux 11102011 17 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Reacutesultats

Reacutesultats de la premiegravere peacuteriodeAnalyse des contenus deacutefinition drsquoun format drsquoeacutechangeConfeacuterence agrave Prague en octobre 2010 pour discuter avec des partenairespotentiels (Springer LMS ) sur la base

Libre accegraves agrave terme (creacuteneau mobile)Nouveauteacutes fournies par les eacutediteurs et indexeacutees rapidementArchivage partageacute dans un reacuteseau de bibliothegraveques numeacuteriques de reacutefeacuterence

Constition drsquoune base de donneacutees avec 235 000 reacutefeacuterencesenviron 15 du contenu numeacuterique existant (13 de lrsquoexistant laquo DML raquo)

Une seacuterie drsquooutils destineacutes agrave ameacuteliorer lrsquoindexation lrsquoaccegraveset la visibiliteacute de ce corpus speacutecifiquement matheacutematique

Premiegravere deacutemo publique drsquoun prototype agrave demi fonctionnel

FreacuteDoc Brodeaux 11102011 18 19

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe
Page 21: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSynthegravese

Collections 225 peacuteriodiques et seacuteries 235 000 textes 2 600 000 pagesAllemagne ERAMJFM GDZ ELibM (85 000 textes)

France Gallica-Math NUMDAM CEDRAM EDPS TEL (50 000 textes)Reacutep Tchegraveque DML-CZ (27 000 textes)

Russie RusDML (17 000 textes)Pologne DML-PL (14 000 textes)

Gregravece HDML (2 400 textes)Espagne DML-E (6 400 textes)Portugal SPMBNP (2 000 textes)Bulgarie BulDML (450 textes)

Reacutetro BNPSPMIST DML-CZ DML-E DML-PL Gallica GDZHDML NUMDAM RusDML

Natif BulDML CEDRAM DML-CZ DML-E DML-PL EDPSELibM NUMDAM

FreacuteDoc Brodeaux 11102011 13 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSeacutelection

Processus En cascade Projet rarr institution rarr collections

Critegraveres Textes matheacutematiques publieacutes et valideacutes scientifiquementdestineacutes agrave servir de reacutefeacuterence

bull Pour ecirctre eacuteligible il faut une paire(texte inteacutegral [PDF] meacutetadonneacutees [XML])archiveacutee par lrsquoune des institutions partenaires

Items Un item EuDML est lrsquouniteacute logique pertinente pour lrsquoutilisateurUne monographie un volume une œuvre en plusieurs tomes unarticle de revue une contribution dans un livre collectif unecommunication publieacutee dans des actes

bull Agrave ce jour 235 000 items dans 12 collections(185 000 articles 45 000 chapitres et contributions 2 500 livres300 œuvres en plusieurs tomes)

FreacuteDoc Brodeaux 11102011 14 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLDeacutetenteurs du copyrightDomaine public Quelques revues la plupart des livres

Public 50 universiteacutes acadeacutemies instituts laboratoires

Fondations Compositio Mathematica quelques ASBL

Socieacuteteacutes 20 socieacuteteacutes savantes

Eacutediteurs 45 revuesBirkhaumluser 5 revues (GDZ)

EDPS 7 revues (5 agrave jour dans NUMDAM)Elsevier 5 revues 1 agrave jour (NUMDAM)

de Gruyter 2 revues (GDZ)Heldermann 6 revues (5 agrave jour dans ELibM)

Hindawi 12 revues (agrave jour dans ELibM)Noordhoff 1 revue (NUMDAM)AK Peters 1 revue (ELibM)

Springer 2 peacuteriodiques (NUMDAM 1 revue agrave jour rarr 2007)9 revues (GDZ)

FreacuteDoc Brodeaux 11102011 15 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLLe babel des formats

Les meacutetadonneacutees ont des structures et des niveaux de deacutetail tregraves variablesSQL Base de donneacutees maison DML-E

DTD maison MathDoc FIZ IST HDML

DTD standard DC Dspace minidml METS NLM

Nous avons baseacute le format EuDML v 10 surNLM Journal Archiving and Interchange Tag Suitepour le stockage et lrsquoeacutechange des meacutetadonneacutees

FreacuteDoc Brodeaux 11102011 16 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLScheacutema EuDMLNLM Journal Archiving and Interchange Tag Suite

PourLargement testeacute et exploiteacute (EDPS PubMed Central JSTOR )Standard NISOPreacutecis et flexible (donneacutees structureacutees et plates)Support MathML et alternativesDescription du contenu de peacuteriodiques livres collectionsPermet de stocker lrsquoinformation de tous les partenaires et extensible

ContreNeacutecessite un ldquoapplication profilerdquoConccedilu pour les textes inteacutegrauxPas tous les types de documents preacutevus (chapitre dans un livre eacutediteacute )

=rArr EuDML schema v 10Trois types de documents comme conteneurs article book mbookDeacuteviation minimale par rapport aux DTD NLM standardldquoBest practices recommendationrdquo

FreacuteDoc Brodeaux 11102011 17 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Reacutesultats

Reacutesultats de la premiegravere peacuteriodeAnalyse des contenus deacutefinition drsquoun format drsquoeacutechangeConfeacuterence agrave Prague en octobre 2010 pour discuter avec des partenairespotentiels (Springer LMS ) sur la base

Libre accegraves agrave terme (creacuteneau mobile)Nouveauteacutes fournies par les eacutediteurs et indexeacutees rapidementArchivage partageacute dans un reacuteseau de bibliothegraveques numeacuteriques de reacutefeacuterence

Constition drsquoune base de donneacutees avec 235 000 reacutefeacuterencesenviron 15 du contenu numeacuterique existant (13 de lrsquoexistant laquo DML raquo)

Une seacuterie drsquooutils destineacutes agrave ameacuteliorer lrsquoindexation lrsquoaccegraveset la visibiliteacute de ce corpus speacutecifiquement matheacutematique

Premiegravere deacutemo publique drsquoun prototype agrave demi fonctionnel

FreacuteDoc Brodeaux 11102011 18 19

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe
Page 22: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

The European Digital Mathematics LibraryInnovation

Nous inteacutegrons des nouvelles technologiesMeacutetadonneacutees MathML (OCR conversions LATEX extraction PDF)

Recherche de formules

Matheacutematiques accessibles

Relations seacutemantiques

Similariteacute et classification des textes

Beacuteneacutefices attendusProgregraves en gestion des savoirs matheacutematiques

Nouvelles modaliteacutes de deacutecouverte et de navigation

Banc drsquoessai pour de nouveaux modes drsquointeraction avec le corpus

Eacuteprouver des outils de production reacuteutilisables

Retourner des meacutetadonneacutees ameacutelioreacutees aux fournisseurs de contenu

FreacuteDoc Brodeaux 11102011 12 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSynthegravese

Collections 225 peacuteriodiques et seacuteries 235 000 textes 2 600 000 pagesAllemagne ERAMJFM GDZ ELibM (85 000 textes)

France Gallica-Math NUMDAM CEDRAM EDPS TEL (50 000 textes)Reacutep Tchegraveque DML-CZ (27 000 textes)

Russie RusDML (17 000 textes)Pologne DML-PL (14 000 textes)

Gregravece HDML (2 400 textes)Espagne DML-E (6 400 textes)Portugal SPMBNP (2 000 textes)Bulgarie BulDML (450 textes)

Reacutetro BNPSPMIST DML-CZ DML-E DML-PL Gallica GDZHDML NUMDAM RusDML

Natif BulDML CEDRAM DML-CZ DML-E DML-PL EDPSELibM NUMDAM

FreacuteDoc Brodeaux 11102011 13 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSeacutelection

Processus En cascade Projet rarr institution rarr collections

Critegraveres Textes matheacutematiques publieacutes et valideacutes scientifiquementdestineacutes agrave servir de reacutefeacuterence

bull Pour ecirctre eacuteligible il faut une paire(texte inteacutegral [PDF] meacutetadonneacutees [XML])archiveacutee par lrsquoune des institutions partenaires

Items Un item EuDML est lrsquouniteacute logique pertinente pour lrsquoutilisateurUne monographie un volume une œuvre en plusieurs tomes unarticle de revue une contribution dans un livre collectif unecommunication publieacutee dans des actes

bull Agrave ce jour 235 000 items dans 12 collections(185 000 articles 45 000 chapitres et contributions 2 500 livres300 œuvres en plusieurs tomes)

FreacuteDoc Brodeaux 11102011 14 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLDeacutetenteurs du copyrightDomaine public Quelques revues la plupart des livres

Public 50 universiteacutes acadeacutemies instituts laboratoires

Fondations Compositio Mathematica quelques ASBL

Socieacuteteacutes 20 socieacuteteacutes savantes

Eacutediteurs 45 revuesBirkhaumluser 5 revues (GDZ)

EDPS 7 revues (5 agrave jour dans NUMDAM)Elsevier 5 revues 1 agrave jour (NUMDAM)

de Gruyter 2 revues (GDZ)Heldermann 6 revues (5 agrave jour dans ELibM)

Hindawi 12 revues (agrave jour dans ELibM)Noordhoff 1 revue (NUMDAM)AK Peters 1 revue (ELibM)

Springer 2 peacuteriodiques (NUMDAM 1 revue agrave jour rarr 2007)9 revues (GDZ)

FreacuteDoc Brodeaux 11102011 15 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLLe babel des formats

Les meacutetadonneacutees ont des structures et des niveaux de deacutetail tregraves variablesSQL Base de donneacutees maison DML-E

DTD maison MathDoc FIZ IST HDML

DTD standard DC Dspace minidml METS NLM

Nous avons baseacute le format EuDML v 10 surNLM Journal Archiving and Interchange Tag Suitepour le stockage et lrsquoeacutechange des meacutetadonneacutees

FreacuteDoc Brodeaux 11102011 16 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLScheacutema EuDMLNLM Journal Archiving and Interchange Tag Suite

PourLargement testeacute et exploiteacute (EDPS PubMed Central JSTOR )Standard NISOPreacutecis et flexible (donneacutees structureacutees et plates)Support MathML et alternativesDescription du contenu de peacuteriodiques livres collectionsPermet de stocker lrsquoinformation de tous les partenaires et extensible

ContreNeacutecessite un ldquoapplication profilerdquoConccedilu pour les textes inteacutegrauxPas tous les types de documents preacutevus (chapitre dans un livre eacutediteacute )

=rArr EuDML schema v 10Trois types de documents comme conteneurs article book mbookDeacuteviation minimale par rapport aux DTD NLM standardldquoBest practices recommendationrdquo

FreacuteDoc Brodeaux 11102011 17 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Reacutesultats

Reacutesultats de la premiegravere peacuteriodeAnalyse des contenus deacutefinition drsquoun format drsquoeacutechangeConfeacuterence agrave Prague en octobre 2010 pour discuter avec des partenairespotentiels (Springer LMS ) sur la base

Libre accegraves agrave terme (creacuteneau mobile)Nouveauteacutes fournies par les eacutediteurs et indexeacutees rapidementArchivage partageacute dans un reacuteseau de bibliothegraveques numeacuteriques de reacutefeacuterence

Constition drsquoune base de donneacutees avec 235 000 reacutefeacuterencesenviron 15 du contenu numeacuterique existant (13 de lrsquoexistant laquo DML raquo)

Une seacuterie drsquooutils destineacutes agrave ameacuteliorer lrsquoindexation lrsquoaccegraveset la visibiliteacute de ce corpus speacutecifiquement matheacutematique

Premiegravere deacutemo publique drsquoun prototype agrave demi fonctionnel

FreacuteDoc Brodeaux 11102011 18 19

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe
Page 23: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSynthegravese

Collections 225 peacuteriodiques et seacuteries 235 000 textes 2 600 000 pagesAllemagne ERAMJFM GDZ ELibM (85 000 textes)

France Gallica-Math NUMDAM CEDRAM EDPS TEL (50 000 textes)Reacutep Tchegraveque DML-CZ (27 000 textes)

Russie RusDML (17 000 textes)Pologne DML-PL (14 000 textes)

Gregravece HDML (2 400 textes)Espagne DML-E (6 400 textes)Portugal SPMBNP (2 000 textes)Bulgarie BulDML (450 textes)

Reacutetro BNPSPMIST DML-CZ DML-E DML-PL Gallica GDZHDML NUMDAM RusDML

Natif BulDML CEDRAM DML-CZ DML-E DML-PL EDPSELibM NUMDAM

FreacuteDoc Brodeaux 11102011 13 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSeacutelection

Processus En cascade Projet rarr institution rarr collections

Critegraveres Textes matheacutematiques publieacutes et valideacutes scientifiquementdestineacutes agrave servir de reacutefeacuterence

bull Pour ecirctre eacuteligible il faut une paire(texte inteacutegral [PDF] meacutetadonneacutees [XML])archiveacutee par lrsquoune des institutions partenaires

Items Un item EuDML est lrsquouniteacute logique pertinente pour lrsquoutilisateurUne monographie un volume une œuvre en plusieurs tomes unarticle de revue une contribution dans un livre collectif unecommunication publieacutee dans des actes

bull Agrave ce jour 235 000 items dans 12 collections(185 000 articles 45 000 chapitres et contributions 2 500 livres300 œuvres en plusieurs tomes)

FreacuteDoc Brodeaux 11102011 14 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLDeacutetenteurs du copyrightDomaine public Quelques revues la plupart des livres

Public 50 universiteacutes acadeacutemies instituts laboratoires

Fondations Compositio Mathematica quelques ASBL

Socieacuteteacutes 20 socieacuteteacutes savantes

Eacutediteurs 45 revuesBirkhaumluser 5 revues (GDZ)

EDPS 7 revues (5 agrave jour dans NUMDAM)Elsevier 5 revues 1 agrave jour (NUMDAM)

de Gruyter 2 revues (GDZ)Heldermann 6 revues (5 agrave jour dans ELibM)

Hindawi 12 revues (agrave jour dans ELibM)Noordhoff 1 revue (NUMDAM)AK Peters 1 revue (ELibM)

Springer 2 peacuteriodiques (NUMDAM 1 revue agrave jour rarr 2007)9 revues (GDZ)

FreacuteDoc Brodeaux 11102011 15 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLLe babel des formats

Les meacutetadonneacutees ont des structures et des niveaux de deacutetail tregraves variablesSQL Base de donneacutees maison DML-E

DTD maison MathDoc FIZ IST HDML

DTD standard DC Dspace minidml METS NLM

Nous avons baseacute le format EuDML v 10 surNLM Journal Archiving and Interchange Tag Suitepour le stockage et lrsquoeacutechange des meacutetadonneacutees

FreacuteDoc Brodeaux 11102011 16 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLScheacutema EuDMLNLM Journal Archiving and Interchange Tag Suite

PourLargement testeacute et exploiteacute (EDPS PubMed Central JSTOR )Standard NISOPreacutecis et flexible (donneacutees structureacutees et plates)Support MathML et alternativesDescription du contenu de peacuteriodiques livres collectionsPermet de stocker lrsquoinformation de tous les partenaires et extensible

ContreNeacutecessite un ldquoapplication profilerdquoConccedilu pour les textes inteacutegrauxPas tous les types de documents preacutevus (chapitre dans un livre eacutediteacute )

=rArr EuDML schema v 10Trois types de documents comme conteneurs article book mbookDeacuteviation minimale par rapport aux DTD NLM standardldquoBest practices recommendationrdquo

FreacuteDoc Brodeaux 11102011 17 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Reacutesultats

Reacutesultats de la premiegravere peacuteriodeAnalyse des contenus deacutefinition drsquoun format drsquoeacutechangeConfeacuterence agrave Prague en octobre 2010 pour discuter avec des partenairespotentiels (Springer LMS ) sur la base

Libre accegraves agrave terme (creacuteneau mobile)Nouveauteacutes fournies par les eacutediteurs et indexeacutees rapidementArchivage partageacute dans un reacuteseau de bibliothegraveques numeacuteriques de reacutefeacuterence

Constition drsquoune base de donneacutees avec 235 000 reacutefeacuterencesenviron 15 du contenu numeacuterique existant (13 de lrsquoexistant laquo DML raquo)

Une seacuterie drsquooutils destineacutes agrave ameacuteliorer lrsquoindexation lrsquoaccegraveset la visibiliteacute de ce corpus speacutecifiquement matheacutematique

Premiegravere deacutemo publique drsquoun prototype agrave demi fonctionnel

FreacuteDoc Brodeaux 11102011 18 19

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe
Page 24: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLSeacutelection

Processus En cascade Projet rarr institution rarr collections

Critegraveres Textes matheacutematiques publieacutes et valideacutes scientifiquementdestineacutes agrave servir de reacutefeacuterence

bull Pour ecirctre eacuteligible il faut une paire(texte inteacutegral [PDF] meacutetadonneacutees [XML])archiveacutee par lrsquoune des institutions partenaires

Items Un item EuDML est lrsquouniteacute logique pertinente pour lrsquoutilisateurUne monographie un volume une œuvre en plusieurs tomes unarticle de revue une contribution dans un livre collectif unecommunication publieacutee dans des actes

bull Agrave ce jour 235 000 items dans 12 collections(185 000 articles 45 000 chapitres et contributions 2 500 livres300 œuvres en plusieurs tomes)

FreacuteDoc Brodeaux 11102011 14 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLDeacutetenteurs du copyrightDomaine public Quelques revues la plupart des livres

Public 50 universiteacutes acadeacutemies instituts laboratoires

Fondations Compositio Mathematica quelques ASBL

Socieacuteteacutes 20 socieacuteteacutes savantes

Eacutediteurs 45 revuesBirkhaumluser 5 revues (GDZ)

EDPS 7 revues (5 agrave jour dans NUMDAM)Elsevier 5 revues 1 agrave jour (NUMDAM)

de Gruyter 2 revues (GDZ)Heldermann 6 revues (5 agrave jour dans ELibM)

Hindawi 12 revues (agrave jour dans ELibM)Noordhoff 1 revue (NUMDAM)AK Peters 1 revue (ELibM)

Springer 2 peacuteriodiques (NUMDAM 1 revue agrave jour rarr 2007)9 revues (GDZ)

FreacuteDoc Brodeaux 11102011 15 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLLe babel des formats

Les meacutetadonneacutees ont des structures et des niveaux de deacutetail tregraves variablesSQL Base de donneacutees maison DML-E

DTD maison MathDoc FIZ IST HDML

DTD standard DC Dspace minidml METS NLM

Nous avons baseacute le format EuDML v 10 surNLM Journal Archiving and Interchange Tag Suitepour le stockage et lrsquoeacutechange des meacutetadonneacutees

FreacuteDoc Brodeaux 11102011 16 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLScheacutema EuDMLNLM Journal Archiving and Interchange Tag Suite

PourLargement testeacute et exploiteacute (EDPS PubMed Central JSTOR )Standard NISOPreacutecis et flexible (donneacutees structureacutees et plates)Support MathML et alternativesDescription du contenu de peacuteriodiques livres collectionsPermet de stocker lrsquoinformation de tous les partenaires et extensible

ContreNeacutecessite un ldquoapplication profilerdquoConccedilu pour les textes inteacutegrauxPas tous les types de documents preacutevus (chapitre dans un livre eacutediteacute )

=rArr EuDML schema v 10Trois types de documents comme conteneurs article book mbookDeacuteviation minimale par rapport aux DTD NLM standardldquoBest practices recommendationrdquo

FreacuteDoc Brodeaux 11102011 17 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Reacutesultats

Reacutesultats de la premiegravere peacuteriodeAnalyse des contenus deacutefinition drsquoun format drsquoeacutechangeConfeacuterence agrave Prague en octobre 2010 pour discuter avec des partenairespotentiels (Springer LMS ) sur la base

Libre accegraves agrave terme (creacuteneau mobile)Nouveauteacutes fournies par les eacutediteurs et indexeacutees rapidementArchivage partageacute dans un reacuteseau de bibliothegraveques numeacuteriques de reacutefeacuterence

Constition drsquoune base de donneacutees avec 235 000 reacutefeacuterencesenviron 15 du contenu numeacuterique existant (13 de lrsquoexistant laquo DML raquo)

Une seacuterie drsquooutils destineacutes agrave ameacuteliorer lrsquoindexation lrsquoaccegraveset la visibiliteacute de ce corpus speacutecifiquement matheacutematique

Premiegravere deacutemo publique drsquoun prototype agrave demi fonctionnel

FreacuteDoc Brodeaux 11102011 18 19

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe
Page 25: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Les contenus EuDMLDeacutetenteurs du copyrightDomaine public Quelques revues la plupart des livres

Public 50 universiteacutes acadeacutemies instituts laboratoires

Fondations Compositio Mathematica quelques ASBL

Socieacuteteacutes 20 socieacuteteacutes savantes

Eacutediteurs 45 revuesBirkhaumluser 5 revues (GDZ)

EDPS 7 revues (5 agrave jour dans NUMDAM)Elsevier 5 revues 1 agrave jour (NUMDAM)

de Gruyter 2 revues (GDZ)Heldermann 6 revues (5 agrave jour dans ELibM)

Hindawi 12 revues (agrave jour dans ELibM)Noordhoff 1 revue (NUMDAM)AK Peters 1 revue (ELibM)

Springer 2 peacuteriodiques (NUMDAM 1 revue agrave jour rarr 2007)9 revues (GDZ)

FreacuteDoc Brodeaux 11102011 15 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLLe babel des formats

Les meacutetadonneacutees ont des structures et des niveaux de deacutetail tregraves variablesSQL Base de donneacutees maison DML-E

DTD maison MathDoc FIZ IST HDML

DTD standard DC Dspace minidml METS NLM

Nous avons baseacute le format EuDML v 10 surNLM Journal Archiving and Interchange Tag Suitepour le stockage et lrsquoeacutechange des meacutetadonneacutees

FreacuteDoc Brodeaux 11102011 16 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLScheacutema EuDMLNLM Journal Archiving and Interchange Tag Suite

PourLargement testeacute et exploiteacute (EDPS PubMed Central JSTOR )Standard NISOPreacutecis et flexible (donneacutees structureacutees et plates)Support MathML et alternativesDescription du contenu de peacuteriodiques livres collectionsPermet de stocker lrsquoinformation de tous les partenaires et extensible

ContreNeacutecessite un ldquoapplication profilerdquoConccedilu pour les textes inteacutegrauxPas tous les types de documents preacutevus (chapitre dans un livre eacutediteacute )

=rArr EuDML schema v 10Trois types de documents comme conteneurs article book mbookDeacuteviation minimale par rapport aux DTD NLM standardldquoBest practices recommendationrdquo

FreacuteDoc Brodeaux 11102011 17 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Reacutesultats

Reacutesultats de la premiegravere peacuteriodeAnalyse des contenus deacutefinition drsquoun format drsquoeacutechangeConfeacuterence agrave Prague en octobre 2010 pour discuter avec des partenairespotentiels (Springer LMS ) sur la base

Libre accegraves agrave terme (creacuteneau mobile)Nouveauteacutes fournies par les eacutediteurs et indexeacutees rapidementArchivage partageacute dans un reacuteseau de bibliothegraveques numeacuteriques de reacutefeacuterence

Constition drsquoune base de donneacutees avec 235 000 reacutefeacuterencesenviron 15 du contenu numeacuterique existant (13 de lrsquoexistant laquo DML raquo)

Une seacuterie drsquooutils destineacutes agrave ameacuteliorer lrsquoindexation lrsquoaccegraveset la visibiliteacute de ce corpus speacutecifiquement matheacutematique

Premiegravere deacutemo publique drsquoun prototype agrave demi fonctionnel

FreacuteDoc Brodeaux 11102011 18 19

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe
Page 26: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLLe babel des formats

Les meacutetadonneacutees ont des structures et des niveaux de deacutetail tregraves variablesSQL Base de donneacutees maison DML-E

DTD maison MathDoc FIZ IST HDML

DTD standard DC Dspace minidml METS NLM

Nous avons baseacute le format EuDML v 10 surNLM Journal Archiving and Interchange Tag Suitepour le stockage et lrsquoeacutechange des meacutetadonneacutees

FreacuteDoc Brodeaux 11102011 16 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLScheacutema EuDMLNLM Journal Archiving and Interchange Tag Suite

PourLargement testeacute et exploiteacute (EDPS PubMed Central JSTOR )Standard NISOPreacutecis et flexible (donneacutees structureacutees et plates)Support MathML et alternativesDescription du contenu de peacuteriodiques livres collectionsPermet de stocker lrsquoinformation de tous les partenaires et extensible

ContreNeacutecessite un ldquoapplication profilerdquoConccedilu pour les textes inteacutegrauxPas tous les types de documents preacutevus (chapitre dans un livre eacutediteacute )

=rArr EuDML schema v 10Trois types de documents comme conteneurs article book mbookDeacuteviation minimale par rapport aux DTD NLM standardldquoBest practices recommendationrdquo

FreacuteDoc Brodeaux 11102011 17 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Reacutesultats

Reacutesultats de la premiegravere peacuteriodeAnalyse des contenus deacutefinition drsquoun format drsquoeacutechangeConfeacuterence agrave Prague en octobre 2010 pour discuter avec des partenairespotentiels (Springer LMS ) sur la base

Libre accegraves agrave terme (creacuteneau mobile)Nouveauteacutes fournies par les eacutediteurs et indexeacutees rapidementArchivage partageacute dans un reacuteseau de bibliothegraveques numeacuteriques de reacutefeacuterence

Constition drsquoune base de donneacutees avec 235 000 reacutefeacuterencesenviron 15 du contenu numeacuterique existant (13 de lrsquoexistant laquo DML raquo)

Une seacuterie drsquooutils destineacutes agrave ameacuteliorer lrsquoindexation lrsquoaccegraveset la visibiliteacute de ce corpus speacutecifiquement matheacutematique

Premiegravere deacutemo publique drsquoun prototype agrave demi fonctionnel

FreacuteDoc Brodeaux 11102011 18 19

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe
Page 27: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Meacutetadonneacutees EuDMLScheacutema EuDMLNLM Journal Archiving and Interchange Tag Suite

PourLargement testeacute et exploiteacute (EDPS PubMed Central JSTOR )Standard NISOPreacutecis et flexible (donneacutees structureacutees et plates)Support MathML et alternativesDescription du contenu de peacuteriodiques livres collectionsPermet de stocker lrsquoinformation de tous les partenaires et extensible

ContreNeacutecessite un ldquoapplication profilerdquoConccedilu pour les textes inteacutegrauxPas tous les types de documents preacutevus (chapitre dans un livre eacutediteacute )

=rArr EuDML schema v 10Trois types de documents comme conteneurs article book mbookDeacuteviation minimale par rapport aux DTD NLM standardldquoBest practices recommendationrdquo

FreacuteDoc Brodeaux 11102011 17 19

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Reacutesultats

Reacutesultats de la premiegravere peacuteriodeAnalyse des contenus deacutefinition drsquoun format drsquoeacutechangeConfeacuterence agrave Prague en octobre 2010 pour discuter avec des partenairespotentiels (Springer LMS ) sur la base

Libre accegraves agrave terme (creacuteneau mobile)Nouveauteacutes fournies par les eacutediteurs et indexeacutees rapidementArchivage partageacute dans un reacuteseau de bibliothegraveques numeacuteriques de reacutefeacuterence

Constition drsquoune base de donneacutees avec 235 000 reacutefeacuterencesenviron 15 du contenu numeacuterique existant (13 de lrsquoexistant laquo DML raquo)

Une seacuterie drsquooutils destineacutes agrave ameacuteliorer lrsquoindexation lrsquoaccegraveset la visibiliteacute de ce corpus speacutecifiquement matheacutematique

Premiegravere deacutemo publique drsquoun prototype agrave demi fonctionnel

FreacuteDoc Brodeaux 11102011 18 19

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe
Page 28: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

Doc math EuDML Contenus Meacutetadonneacutees Reacutesultats

Reacutesultats

Reacutesultats de la premiegravere peacuteriodeAnalyse des contenus deacutefinition drsquoun format drsquoeacutechangeConfeacuterence agrave Prague en octobre 2010 pour discuter avec des partenairespotentiels (Springer LMS ) sur la base

Libre accegraves agrave terme (creacuteneau mobile)Nouveauteacutes fournies par les eacutediteurs et indexeacutees rapidementArchivage partageacute dans un reacuteseau de bibliothegraveques numeacuteriques de reacutefeacuterence

Constition drsquoune base de donneacutees avec 235 000 reacutefeacuterencesenviron 15 du contenu numeacuterique existant (13 de lrsquoexistant laquo DML raquo)

Une seacuterie drsquooutils destineacutes agrave ameacuteliorer lrsquoindexation lrsquoaccegraveset la visibiliteacute de ce corpus speacutecifiquement matheacutematique

Premiegravere deacutemo publique drsquoun prototype agrave demi fonctionnel

FreacuteDoc Brodeaux 11102011 18 19

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe
Page 29: Le projet EuDML - The European Digital Mathematics Librarybouche/Slides/EUDML_Fredoc.pdf · Dimension modeste, forte croissance Une estimation de la taille du corpus mathématique

This being partially funded by the CIPCOMPETITIVENESS AND INNOVATION FRAMEWORK PROGRAMME

(ICT PSP Digital Libraries project 250503)

We will delivera truly opensustainableand innovativeframeworkfor access andexploitation ofEuropersquos richheritage ofmathematics

Thierry BOUCHEInstitut Fourier amp Cellule MathDoc GrenobleMathDoc directorEuDML scientific coordinatorEMS Electronic Publishing CommitteeCICM Steering CommitteeIMU Committee on Electronic Information

and Communication

  • La documentation matheacutematique
    • Stakes
    • Reference library
    • Idiosyncrasies
    • Size
    • Size
      • EuDML Objectifs
        • Vision
        • profile
        • One access point
        • A distributed archive
        • Eventual open access
        • Innovation
          • Les contenus
            • Size
            • Content
              • Meacutetadonneacutees
                • EuDML metadata babel
                • EuDML metadata schema
                  • Reacutesultats
                    • 1
                      • Annexe