gestion pérenne des données scientifiques...3 le cycle de vie des données préparation du projet...

Post on 02-Jan-2021

1 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

SIST 2018 28-29 Juin 2018 wilfried.heintz@inra.fr

Gestion pérenne des données scientifiques

Du Plan de Gestion des données au Datapaper

2

Contexte général

3

Le cycle de vie des données

Préparation du projetRédaction du

protocole et du PGDCollecte

ObservationExpérimentation

Pré-traitement des données brutes

Catalogage(métadonnées)

Archivage

Livraison &

Structuration du Jeu de données

Traitements &Analyses

PublicationDiffusion

Valorisation

4

Une gestion à chaque étape

PublicationDiffusion

Valorisation

Traitements &Analyses

Livraison &

Structuration du Jeu de données

ArchivagePré-traitement des

données brutesCatalogage

(métadonnées)Préparation du projet

Rédaction du protocole

CollecteObservation

Expérimentation

Les objectifs poursuivis (≠ atteints !)

- Traçabilité des projets et de leurs données

- Accès aux données facilité pour tous les

agents de l’UMR

- « Chaîne de la donnée » (= sans rupture)

- Standardisation → Ouverture → Valorisation

5

Préparation du projetRédaction du

Protocole et du PGD

Pour garantir la réussite de la campagne de collecte

→ Quels objectifs poursuivis ?

→ Quel cadre scientifique ?

→ Quel type de données à collecter ?

→ Qui fait quoi ?

→ Mode opératoire …

PLANIFIER

6

Dialogue entre tous les acteurs + documents de références

→Meilleure anticipation

→ Premières métadonnées

PLANIFIER

Préparation du projetRédaction du

Protocole et du PGD

7

Dialogue entre tous les acteurs + documents de références

→Meilleure anticipation

→ Premières métadonnées

⇒ Protocole écrit et diffusé à l’avance

(Sharepoint, protocols.io)

⇒ Plan de gestion des données

(Opidor)

PLANIFIER

Préparation du projetRédaction du

Protocole et du PGD

8

Préparation du projetRédaction du

Protocole et du PGDCollecte

ObservationExpérimentation

Etape cruciale mais souvent négligée

→ Bonne collecte ssi protocole complet et disponible

→ Contrôle de la qualité in situ

→ Gestion des échantillons

Collec-Science

ACQUÉRIR

9

CollecteObservation

Expérimentation

Etape cruciale mais souvent négligée

→ Bonne collecte ssi protocole complet et disponible

→ Contrôle de la qualité in situ

→ Gestion des échantillons

⇒ Apport des outils embarqués pour initier le flux des données :

Assistance à la saisie – BDD alimentée sur le terrain

Collec-Science

ACQUÉRIR

Préparation du projetRédaction du

Protocole et du PGD

10

CollecteObservation

Expérimentation

Pré-traitement des données brutes

Vérifications post-terrain

→ Contrôle de l’intégrité des données

→ Éliminations des valeurs aberrantes

CONTRÔLER

Préparation du projetRédaction du

Protocole et du PGD

11

CollecteObservation

Expérimentation

Pré-traitement des données brutes

Vérifications post-terrain

→ Contrôle de l’intégrité des données

→ Éliminations des valeurs aberrantes

⇒ Scripts R, OpenRefine, ETL ...

CONTRÔLER

Préparation du projetRédaction du

Protocole et du PGD

12

Pré-traitement des données brutes

Catalogage(métadonnées)

Garantir la pérennité du jeu de données

→ Décrire les données et leur contexte

→ Faciliter la réutilisation

→ Normaliser pour une compréhension commune

CollecteObservation

Expérimentation

DÉCRIRE

Préparation du projetRédaction du

Protocole et du PGD

13

Pré-traitement des données brutes

Catalogage(métadonnées)

Garantir la pérennité du jeu de données

→ Décrire les données et leur contexte

→ Faciliter la réutilisation

→ Normaliser pour une compréhension commune

⇒ Geonetwork, IPT, GeoNAPI R

CollecteObservation

Expérimentation

DÉCRIRE

Préparation du projetRédaction du

Protocole et du PGD

14

Pré-traitement des données brutes

Catalogage(métadonnées)

Archivage

Stocker le jeu de données sur le long terme

→ Sauvegarder les données brutes

→ Permettre l’accès futur aux données

→ Garantir l’intégrité de la ressource

CollecteObservation

Expérimentation

DataCenter

STOCKER

Préparation du projetRédaction du

Protocole et du PGD

15

Pré-traitement des données brutes

Catalogage(métadonnées)

Archivage

Stocker le jeu de données sur le long terme

→ Sauvegarder les données brutes

→ Permettre l’accès futur aux données

→ Garantir l’intégrité de la ressource

⇒ Datacenter

CollecteObservation

Expérimentation

DataCenter

STOCKER

Préparation du projetRédaction du

Protocole et du PGD

16

Pré-traitement des données brutes

Catalogage(métadonnées)

Archivage

Livraison &

Structuration du Jeu de données

Intégrer les données dans le Sys. d’information

→Bases de données partagées

ORGANISER

CollecteObservation

Expérimentation

Préparation du projetRédaction du

Protocole et du PGD

17

Pré-traitement des données brutes

Catalogage(métadonnées)

Archivage

Livraison &

Structuration du Jeu de données

Intégrer les données dans le Sys. d’information

→Bases de données partagées

⇒ Infrastructure de Données Géographiques (IDG)

ORGANISER

CollecteObservation

Expérimentation

Préparation du projetRédaction du

Protocole et du PGD

18

Pré-traitement des données brutes

Catalogage(métadonnées)

Archivage

Livraison &

Structuration du Jeu de données

Traitements &Analyses

Traitements « scientifiques »

→Statistiques, SIG, algorithmes, interprétation …

ANALYSER

CollecteObservation

Expérimentation

Préparation du projetRédaction du

Protocole et du PGD

19

Pré-traitement des données brutes

Catalogage(métadonnées)

Archivage

Livraison &

Structuration du Jeu de données

Traitements &Analyses

Traitements « scientifiques »

→Statistiques, SIG, algorithmes, interprétation …

⇒ WPS, publication de scripts

ANALYSER

CollecteObservation

Expérimentation

Préparation du projetRédaction du

Protocole et du PGD

20

Pré-traitement des données brutes

Catalogage(métadonnées)

Archivage

Livraison &

Structuration du Jeu de données

Traitements &Analyses

PublicationDiffusion

Valorisation

OPEN SCIENCE !

→Mettre en oeuvre la réutilisation

PARTAGER

CollecteObservation

Expérimentation

Préparation du projetRédaction du

Protocole et du PGD

21

Pré-traitement des données brutes

Catalogage(métadonnées)

Archivage

Livraison &

Structuration du Jeu de données

Traitements &Analyses

PublicationDiffusion

Valorisation

OPEN SCIENCE !

→Mettre en oeuvre la réutilisation

⇒ WFS, R, IPT, DOI & Datapaper

PARTAGER

CollecteObservation

Expérimentation

Préparation du projetRédaction du

Protocole et du PGD

22

Appli Web

SYGADE (IRSTEA) Gestionnaire

de données d’enquêtes

TERRAIN

LABO

Réseau antennes GPS centimétriques

WEB

IPT

Télédétection

Enquêtes

WebmapMétadonnées

Observations

Collec-Science

Relevés naturalistes

Geo Data

23

Appli Web

SYGADE (IRSTEA) Gestionnaire

de données d’enquêtes

TERRAIN

LABO

Réseau antennes GPS centimétriques

WEB

IPT

Télédétection

Enquêtes

Métadonnées

Observations

Collec-Science

Relevés naturalistes

Geo Data

Webmap

24

wilfried.heintz@inra.fr

Merci

top related