corpus numériques et shs : infrastructures, outils, isidore
DESCRIPTION
TRANSCRIPT
![Page 1: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/1.jpg)
Signalement, accès, et mise à disposition des données numériques de la recherche en SHS
rechercheisidore.fr
Stéphane POUYLLAU, Ingénieur de recherche au CNRSDirecteur de Corpus-IR (UMS 3534)
Responsable du projet ISIDORE - TGE AdonisTwitter @spouyllau – Email [email protected]
![Page 2: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/2.jpg)
Adonis
- Adonis est un très grand équipement pour les sciences humaines et sociales
- Acteur de la feuille de route ESFRI (DARIAH)
- Missions 2012-2015 :
- Accès aux données et documents numérique des SHS (ISIDORE)
- Grille de services : hébergement web ; stokage de données ; Archivage à long terme (OAIS / CINES-SIAF)
- Site : www.tge-adonis.fr
- Contact : [email protected]
![Page 3: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/3.jpg)
Corpus-IR
- Corpus-IR (très grande Infrastructure de Recherche) est un réseau d'équipes produisant des corpus numériques de sources :
- Équipes (UMR, EA, etc.)
- consortiums « disciplinaires » (mais pas que)
- 12 consortiums à 15 consortiums
- Financement de la production de corpus (numérisation ; documentation ; diffusion des données)
- Points clés : qualité des métadonnées ; diffusion obligatoire des métadonnées ; diffusion selon des formats ouverts et normalisés (ISIDORE ; Gallica ; Europeana)
![Page 4: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/4.jpg)
Corpus-IR
- Acteur de la feuille de route ESFRI (CLARIN)
- UMS 3534 (Aix Marseille Université et CNRS)
● Paris / Marseille
- Contact : www.corpus-ir.fr
![Page 5: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/5.jpg)
Des corpus... Isidore de Séville ? Mais de quoi parle-t-il ?
![Page 6: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/6.jpg)
Photos : SP. 2006.
![Page 7: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/7.jpg)
Photos : SP. 1999-2009.
![Page 8: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/8.jpg)
Photos : SP. 2006.
![Page 9: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/9.jpg)
![Page 10: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/10.jpg)
![Page 11: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/11.jpg)
![Page 12: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/12.jpg)
![Page 13: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/13.jpg)
![Page 14: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/14.jpg)
![Page 15: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/15.jpg)
Production de données « sources »
- Sources ? Données et matériaux numériques – souvent non édités/éditables (coûts, place, droits)
- Monde numérique (capteurs ; photos ; enregistrements ; GPS ; enquêtes en ligne ; numérisation de sauvegarde...)
- Utilisation et ré-utilisation ? Reconnaissance du travail de collecte et de création de « corpus »
- Valorisation des fonds documentaires
![Page 16: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/16.jpg)
![Page 17: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/17.jpg)
ISIDORE et les fonds d'archives
Mettre en place l'environnement pour relier données de la recherche et publications
- Faciliter l'administration de la preuve scientifique
ISIDORE est un outil pour les communautés scientifiques
ISIDORE est un outil de signalement et d'accès
- Exposition générique des données
- Importance de la qualité des métadonnées
ISIDORE est un moteur de recherche ; un site web ; un point d'accès à des métadonnnées enrichies et reliées aux publications scientifiques
![Page 18: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/18.jpg)
![Page 19: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/19.jpg)
![Page 20: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/20.jpg)
ISIDORE est un site web... avec « une »
+ de 1000 sources de données moissonnées
+ de 1.300.000 ressources indexés
![Page 21: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/21.jpg)
Quelques chiffres
Début du projet : mai 2009
Ouverture : déc. 2010
Version 1 : mars 2011
Version 1.2 : déc. 2011
Version 2 : sept. 2012
+ 1.700.000 de ressources numériques : archives et corpus, actualités scientifiques publications, etc.
+ 1600 sources de données
+ 60000 visiteurs uniques / mois
![Page 22: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/22.jpg)
Participer à ISIDORE ?
![Page 23: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/23.jpg)
Données
Données Données
Données
RéférentielsRéférentiels
Référentiels
Fonctionnement général (1)
![Page 24: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/24.jpg)
Données
Collecte(crawl)
Traitements Accès(API et facettes)
Gestion, Monitoring, Statistiques
Utilisateurs
RéférentielsNormalisés (RDF/SKOS)
SPARQL endpoint pour les producteurs de données
Fonctionnement général (2) rech
erc
heis
idore
.fr
Extension de recherche sur les catalogues de bibliothèques (SRU/SRW - Z3950)
Données
Données
Données
OAI-PMH
RDFa
RSS
Enrichissement des des métadonnées
et données(format pivot RDF)
Référentiels Référentiels
![Page 25: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/25.jpg)
ISIDORE
Pactols
Rameau Geonames(lieux)
Thésaurus W (SIAF)
Lexvo(langues)
RéférentielsHALSHS
(personnes,disciplines)
OpenEditionCalenda.org(catégories)
![Page 26: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/26.jpg)
Isidore dans le nuage du web sémantique
![Page 27: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/27.jpg)
Principes du projet
- Implication des opérateurs SHS produisant des données (non-éditées, sources éditées, publications)
- Utilisation de standards internationaux
- Formats ouverts (indépendance vis à vis de fournisseurs de données)
- Mise en valeur des données, métadonnées, référentiels structurés produits par les équipes.
- Développement et mode de fonctionnement itératif
![Page 28: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/28.jpg)
Aspects documentaires
- ISIDORE collecte des métadonnées et indexe le texte intégral ou les données « embarquées » (IPTC ; XMP ; MS Word ; MS Excel ; ODT ; MPEG 7)
- métadonnées (OAI-PMH + Dces / DC Terms)
- actulités (RSS ; Atom)
- données (RDFa = RDF dans une page web)
![Page 29: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/29.jpg)
Aspects éditoriaux (1)
- ISIDORE collecte tous les types de données (publications ; corpus ; actualités scientifiques)
- L'important dans ISIDORE : l'information
- la question du « bibliographique »
- Annuaire des sources : http://www.rechercheisidore.fr/annuaire
- Ils participent : Open Edition ; Erudit ; Cairn ; Persee ; CCSD (HAL-SHS, MédiHAL) ; plate-forme de MSH ; UQAM ; UOH ; Cerimes ; Gallica/BNF ; ABES...
![Page 30: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/30.jpg)
Aspects éditoriaux (2)
-ISIDORE affecte aux métadonnées moissonnées des identifiants pérennes (handle) ce qui permet de citer les « notices » d'ISIDORE et donc les ressources
- Si le producteur à déjà donné un id. pérenne (DOI, ark, handle, OAI)
=> ISIDORE peut ré-exposer celui du producteur
- Dans tous les cas, les handle ISIDORE sont à votre disposition (producteurs, utilisateurs)
=> C'est un service gratuit
![Page 31: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/31.jpg)
Alors ? Et vous ?
![Page 32: Corpus numériques et SHS : infrastructures, outils, ISIDORE](https://reader033.vdocuments.fr/reader033/viewer/2022051323/54748a5ab4af9f980a8b56aa/html5/thumbnails/32.jpg)
En tous cas, nous vous attendons dans ISIDORE...
… et merci pour votre attention !