fabien arnaud, cécile pignol, anne-lise develle … · la cyber-carothèque nationale une bd...

10
? Carottes et bases de données Les données issues de carottages dans le réseau lacs sentinelles contextualisées aux niveaux national et international De la gestion des données à l'établissement de rétro-observatoires Fabien Arnaud, Cécile Pignol, Anne-Lise Develle EDYTEM

Upload: tranmien

Post on 07-Sep-2018

215 views

Category:

Documents


0 download

TRANSCRIPT

?

C a r o t t e s e t b a s e s d e d o n n é e s

Les données issues de carottages dans le réseau lacs sentinelles contextualisées aux niveaux national et international

De la gestion des données à l'établissement de rétro-observatoires

Fabien Arnaud, Cécile Pignol, Anne-Lise Develle EDYTEM

Les besoins en matières de données des scientifiques « paléo »

Niv 1 :

- Historique de la prise de la carotte (mission) : => RAP. MISSION /CAMPAGNE

qui, pour qui (PI), ou, comment (Logistique, techniques), pourquoi (objectifs scientifiques)

- Où se trouve l’objet physique ? => GESTION DE STOCKS

Niv2 :

- Puis-je échantillonner (reste-t-il du sédiment …), qui contacter ?

- Suivi analytique : Qu’est-ce qui a déjà été fait sur ce prélèvement :

- Quels types de données existe-t-il ? (acquisition routines, analyses spécifiques)

Niv3 :

- Niveau de la donnée existante (brute, nettoyée )

et la qualité de la données (Protocoles, paramètres …) ?

- Comment retrouver les données à long terme (accès, partage, embargo, …),

Niv4 :

- Comment la ré-utiliser (Charte, Licences d’utilisation) ?

- Comment croiser des données (en fonction de l’Age, proxies, …)

=> ENTREPOTS DATA

=> LIMS

=> PORTAIL THEMATIQUE

Les besoins en matières de données des scientifiques « paléo »

Niv 1 : (PHASE 1)

- Historique de la prise de la carotte (mission) : => RAP. MISSION /CAMPAGNE

qui, pour qui (PI), ou, comment (Logistique, techniques), pourquoi (objectifs scientifiques)

- Où se trouve l’objet physique ? => GESTION DE STOCKS

Niv2 : (PHASE 2)

- Puis-je échantillonner (reste-t-il du sédiment …), qui contacter ?

- Suivi analytique : Qu’est-ce qui a déjà été fait sur ce prélèvement :

- Quels types de données existe-t-il ? (acquisition routines, analyses spécifiques)

Niv3 :

- Niveau de la donnée existante (brute, nettoyée )

et la qualité de la données (Protocoles, paramètres …) ?

- Comment retrouver les données à long terme (accès, partage, embargo, …),

Niv4 :

- Comment la ré-utiliser (Charte, Licences d’utilisation) ?

- Comment croiser des données (en fonction de l’Age, proxies, …)

=> ENTREPOTS DATA

=> LIMS

=> PORTAIL THEMATIQUE

«Cyber-carothèque nationale»

Rétro-observatoires

MO

ISSO

NN

AG

E

Flu

x C

SW, W

MS

Portail national Inter-organismes CNRS – IFREMER – MNHN – INRA

La cyber-carothèque nationale

Une BD générique en cours de construction

PHASE 2 : Système de gestion d’info. de laboratoire (LIMS)

Métadonnées d’analyse (quels échantillons, quelles analyses,

dispo. du matériel etc.)

PHASE 1 INVENTAIRES (LEGACY)

LABOS LABOS RESEAU

Contexte national : «Cyber-carothèque nationale»

GESTION STOCK Intra/Inter-labo

En prévoir 2sem. 2015

Carotte (Métadonnées mini) Nom mission

Nom carotte

Chef de mission

Site - Lac

Année

Nb sections LATITUDE

LONGITUDE

Profondeur bathy

Longueur totale

Localisation_archive …/…

ANDROID

Rapport de mission «carottage» en ligne

En cours 1er sem. 2015

Métadonnées de sondage (détails des opérations, localisation, noms

des carottes etc.) GPRS

Contexte national : «Cyber-carothèque nationale»

Monde : 3643 carottes issues de 308 missions Alpes : 388 carottes, 77 missions

http://www.climcor-cyber.fr/cores/

VISIBILITE INTERNATIONALE IMLGS (NOAA) « Index to Marine and Lacustrine Geological Samples» (flux en construction)

Vers une CONNEXION à des PORTAILS INTERNATIONAUX

- ISO19115 - INSPIRE

- Système international de référencement des échantillons

- Persitant ID des chercheurs

- PID institutions

- PID des publications (ou jeux de données)

IGSN : EDY-GKT00025

PROTOCLES, NORMES et STANDARDS

Contexte national : «Cyber-carothèque nationale»

Semi-distributed architecture : Using Interoperabily

CONTINENTAL’s LABS

DATA

GPRS

SISMER PORTAL

DATA

GPRS

ICE’s LAB DATA

CSW

ETE

DA

TA

Cyber Core

Repository

MARINE’s LABS

DATA

Contexte national : «Cyber-carothèque nationale»

BD Cyber-Carothèque Prélèvements – échantillons (CAROTTES)

SOCLE VERS LES DONNEES

Rôle du scientifique : Dataset associées aux publis => WDC : PANGAEA – NOAA

Données publiées dans les articles scientifiques

représentent seulement la « partie émergée de

l'iceberg » du BIG DATA

VIS

IBIL

ITE

Enjeu : développer des BDs « intermédiaires»

Majorité des BDs

CLIMCOR: paleoCLIMatic CORing: High Resolution and Innovations Carottage paléoclimatique: Haute Résolution et Innovations

http://climcor-equipex.dt.insu.cnrs.fr 9

ANR-11-EQPX-0009-CLIMCOR Dir. Denis-Didier Rousseau ([email protected]), Dir. Adj. Michel Calzas

([email protected])

BD Cyber-Carothèque Prélèvements – échantillons (CAROTTES)

SOCLE VERS LES DONNEES

Rôle du scientifique : Dataset associées aux publis => WDC : PANGAEA – NOAA

Données publiées dans les articles scientifiques

représentent seulement la « partie émergée de

l'iceberg » du BIG DATA

VIS

IBIL

ITE

ROZA : le rétro-observatoire des zones ateliers Enjeu : développer une BD intermédiaire

Lacs sentinelles

R O

R O

Rétro-Observatoires : concept et protoypes

Concept de « rétro-observatoire »

- Prolonger l’observation vers le passé via des archives naturelles

- Conserver et rendre visible les données et métadonnées permettant de réutiliser des sites de carottages (via échantillons ou carottes conservés OU via nouvelles carottes)

- Permettre l’utilisation de carottes sédimentaires pour répondre à des problématiques non anticipées au moment du carottage

ROZA - un ensemble de sites bien étudiés dispersés dans 11 des 13 Zones Ateliers du CNRS - Un projet-pilote de « RO »

- Définition de la liste des données obligatoires (logging, datations, mesures std) - Connections (inter)nationales (no ‘black hole’!)

Lacs sentinelles - En projet : un RO intégré au système d’observation des lacs alpins (SOERE - OLA) - « Lacs sentinelles » intégrés à ce RO ? - Homogénéiser les méthodes de conservation des échantillons et des données