fabien arnaud, cécile pignol, anne-lise develle … · la cyber-carothèque nationale une bd...
TRANSCRIPT
?
C a r o t t e s e t b a s e s d e d o n n é e s
Les données issues de carottages dans le réseau lacs sentinelles contextualisées aux niveaux national et international
De la gestion des données à l'établissement de rétro-observatoires
Fabien Arnaud, Cécile Pignol, Anne-Lise Develle EDYTEM
Les besoins en matières de données des scientifiques « paléo »
Niv 1 :
- Historique de la prise de la carotte (mission) : => RAP. MISSION /CAMPAGNE
qui, pour qui (PI), ou, comment (Logistique, techniques), pourquoi (objectifs scientifiques)
- Où se trouve l’objet physique ? => GESTION DE STOCKS
Niv2 :
- Puis-je échantillonner (reste-t-il du sédiment …), qui contacter ?
- Suivi analytique : Qu’est-ce qui a déjà été fait sur ce prélèvement :
- Quels types de données existe-t-il ? (acquisition routines, analyses spécifiques)
Niv3 :
- Niveau de la donnée existante (brute, nettoyée )
et la qualité de la données (Protocoles, paramètres …) ?
- Comment retrouver les données à long terme (accès, partage, embargo, …),
Niv4 :
- Comment la ré-utiliser (Charte, Licences d’utilisation) ?
- Comment croiser des données (en fonction de l’Age, proxies, …)
=> ENTREPOTS DATA
=> LIMS
=> PORTAIL THEMATIQUE
Les besoins en matières de données des scientifiques « paléo »
Niv 1 : (PHASE 1)
- Historique de la prise de la carotte (mission) : => RAP. MISSION /CAMPAGNE
qui, pour qui (PI), ou, comment (Logistique, techniques), pourquoi (objectifs scientifiques)
- Où se trouve l’objet physique ? => GESTION DE STOCKS
Niv2 : (PHASE 2)
- Puis-je échantillonner (reste-t-il du sédiment …), qui contacter ?
- Suivi analytique : Qu’est-ce qui a déjà été fait sur ce prélèvement :
- Quels types de données existe-t-il ? (acquisition routines, analyses spécifiques)
Niv3 :
- Niveau de la donnée existante (brute, nettoyée )
et la qualité de la données (Protocoles, paramètres …) ?
- Comment retrouver les données à long terme (accès, partage, embargo, …),
Niv4 :
- Comment la ré-utiliser (Charte, Licences d’utilisation) ?
- Comment croiser des données (en fonction de l’Age, proxies, …)
=> ENTREPOTS DATA
=> LIMS
=> PORTAIL THEMATIQUE
«Cyber-carothèque nationale»
Rétro-observatoires
MO
ISSO
NN
AG
E
Flu
x C
SW, W
MS
…
Portail national Inter-organismes CNRS – IFREMER – MNHN – INRA
La cyber-carothèque nationale
Une BD générique en cours de construction
PHASE 2 : Système de gestion d’info. de laboratoire (LIMS)
Métadonnées d’analyse (quels échantillons, quelles analyses,
dispo. du matériel etc.)
PHASE 1 INVENTAIRES (LEGACY)
LABOS LABOS RESEAU
Contexte national : «Cyber-carothèque nationale»
GESTION STOCK Intra/Inter-labo
En prévoir 2sem. 2015
Carotte (Métadonnées mini) Nom mission
Nom carotte
Chef de mission
Site - Lac
Année
Nb sections LATITUDE
LONGITUDE
Profondeur bathy
Longueur totale
Localisation_archive …/…
ANDROID
Rapport de mission «carottage» en ligne
En cours 1er sem. 2015
Métadonnées de sondage (détails des opérations, localisation, noms
des carottes etc.) GPRS
Contexte national : «Cyber-carothèque nationale»
Monde : 3643 carottes issues de 308 missions Alpes : 388 carottes, 77 missions
http://www.climcor-cyber.fr/cores/
VISIBILITE INTERNATIONALE IMLGS (NOAA) « Index to Marine and Lacustrine Geological Samples» (flux en construction)
Vers une CONNEXION à des PORTAILS INTERNATIONAUX
- ISO19115 - INSPIRE
- Système international de référencement des échantillons
- Persitant ID des chercheurs
- PID institutions
- PID des publications (ou jeux de données)
IGSN : EDY-GKT00025
PROTOCLES, NORMES et STANDARDS
Contexte national : «Cyber-carothèque nationale»
Semi-distributed architecture : Using Interoperabily
CONTINENTAL’s LABS
DATA
GPRS
SISMER PORTAL
DATA
GPRS
ICE’s LAB DATA
CSW
ETE
DA
TA
Cyber Core
Repository
MARINE’s LABS
DATA
Contexte national : «Cyber-carothèque nationale»
BD Cyber-Carothèque Prélèvements – échantillons (CAROTTES)
SOCLE VERS LES DONNEES
Rôle du scientifique : Dataset associées aux publis => WDC : PANGAEA – NOAA
Données publiées dans les articles scientifiques
représentent seulement la « partie émergée de
l'iceberg » du BIG DATA
VIS
IBIL
ITE
Enjeu : développer des BDs « intermédiaires»
Majorité des BDs
CLIMCOR: paleoCLIMatic CORing: High Resolution and Innovations Carottage paléoclimatique: Haute Résolution et Innovations
http://climcor-equipex.dt.insu.cnrs.fr 9
ANR-11-EQPX-0009-CLIMCOR Dir. Denis-Didier Rousseau ([email protected]), Dir. Adj. Michel Calzas
BD Cyber-Carothèque Prélèvements – échantillons (CAROTTES)
SOCLE VERS LES DONNEES
Rôle du scientifique : Dataset associées aux publis => WDC : PANGAEA – NOAA
Données publiées dans les articles scientifiques
représentent seulement la « partie émergée de
l'iceberg » du BIG DATA
VIS
IBIL
ITE
ROZA : le rétro-observatoire des zones ateliers Enjeu : développer une BD intermédiaire
Lacs sentinelles
R O
R O
Rétro-Observatoires : concept et protoypes
Concept de « rétro-observatoire »
- Prolonger l’observation vers le passé via des archives naturelles
- Conserver et rendre visible les données et métadonnées permettant de réutiliser des sites de carottages (via échantillons ou carottes conservés OU via nouvelles carottes)
- Permettre l’utilisation de carottes sédimentaires pour répondre à des problématiques non anticipées au moment du carottage
ROZA - un ensemble de sites bien étudiés dispersés dans 11 des 13 Zones Ateliers du CNRS - Un projet-pilote de « RO »
- Définition de la liste des données obligatoires (logging, datations, mesures std) - Connections (inter)nationales (no ‘black hole’!)
Lacs sentinelles - En projet : un RO intégré au système d’observation des lacs alpins (SOERE - OLA) - « Lacs sentinelles » intégrés à ce RO ? - Homogénéiser les méthodes de conservation des échantillons et des données