de la « normalisation » à l’échange des données sur l’eau : le sandre · 2014-11-27 · de...

Post on 25-Jul-2020

0 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

De la « normalisation » à l’échange des

données sur l’eau : le Sandre

Dimitri MEUNIER : d.meunier@oieau.fr

Le cadre de travail

• Le système d’information sur l’eau (SIE) est un dispositif pour le partage des données sur

l'eau du secteur public à l’échelle de la France.

=> C’est plusieurs millions de données sur l’eau portant sur les milieux aquatiques, leurs

usages et les services publics d’eau et d’assainissement.

• Le schéma national des données sur l’eau (SNDE) et ses annexes techniques constituent le

référentiel technique pour la mise en œuvre du SIE (cf. décret n°2009-1543 du 11

décembre 2009 à l’article L213-2 du code de l’environnement).

• Le portail Eaufrance a pour but de faciliter l’accès aux informations du SIE. Il renvoie à des

sites internet thématiques. Ils ont été construits selon des principes d’interopérabilité visant à les

rendre cohérents et interopérables vis à vis du SIE et du Web.

• Le Sandre (Service d'Administration Nationale des Données et des Référentiels sur l'Eau) est

chargé de diffuser les référentiels sur l’eau du SIE. Ces référentiels portent notamment sur la

description du vocabulaire sur l’eau et l’échange des données métiers rattachées à ce

vocabulaire, entre les utilisateurs et les systèmes d’informations du SIE.

La problématique

Quand 2 personnes discutent, elles choisissent une langue commune et un ensemble de mots (ie. champ

lexicale) pour se comprendre. Chaque domaine (la cuisine, la musique, l’aéronautique…) a son propre

champ lexical. Quand le domaine est vaste comme celui de l’eau, il y a des sous domaines et autant de

champs lexicaux (l’assainissement, l’eau potable, l’hydrométrie…) !

Allo Mr Chombier, je viens de faire le

prélèvement d’eau, j’ai bien trouvé 18

Ctenophora près de Abancourt Dans de l’eau douce Incroyable, j’informe

l’Onema. Etes-vous en amont du barrage ?

Quel barrage ? Je suis à 1 km du

pont de …

N’y aurait-il pas confusion ?

Sans connaissance partagée, il est impossible de comprendre, décider et agir !

De la méthodologie aux « produits »

Sandre Pour s’entendre sur un langage commun des spécialistes de l’eau, le secrétariat du Sandre réunit un

groupe ad’hoc. Sur la base des textes réglementaires, des protocoles de prélèvement normalisés, des

fichiers de données, de leurs connaissances, etc, ces informations sont décortiquées et structurées.

Chaque mot encadré peut correspondre à un

concept du monde réel, à l’une de ses

caractéristiques, à une donnée d’un concept.

Par exemple, « Ctenophora » est une donnée

du concept appellations de taxons. La liste des

taxons forme un jeu de données de

référence.

Allo Mr Chombier, je viens de

faire le prélèvement d’eau, j’ai

bien trouvé 18 Ctenophora

près de Abancourt Informations métiers en entrée

Jeux de données de référence

- géographique ou pas (liste de

codes) - Sandre en sortie

Dictionnaires de données

(prescriptions) – Sandre en

sortie

Les concepts sont reliés ensemble pour former

un modèle de données. Ce modèle

accompagné des mots et leurs définitions

forment un dictionnaire de données Sandre.

De la méthodologie aux « produits »

Sandre Pour parfaire le langage commun Sandre, son secrétariat collecte de la documentation sur le sujet du

dictionnaire. Sur la base des textes réglementaires, des rapports d’étude, des données métiers, etc, ces

informations sont étudiées et croisées avec les concepts du dictionnaire de données Sandre. Ce

travail est ensuite commenté et validé par le groupe ad’hoc.

Dictionnaire

en entrée

Document de présentation

en sortie

Informations métiers en entrée

Les concepts sont présentés de

manière pédagogique avec des

illustrations, des schémas et des

exemples de données... Ce travail

aboutit à un document de

présentation Sandre.

De la méthodologie aux « produits »

Sandre Pour partager des données des spécialistes de l’eau, le secrétariat du Sandre sélectionne les

dictionnaires portant les données à échanger. Sur la base des dictionnaires des données Sandre, les

métadonnées sont choisies pour être échangées et complétées. Ce travail est ensuite commenté et

validé par le groupe ad’hoc.

Dictionnaires

en entrée

Scénario d’échange

en sortie

Scénario de service

web en sortie

Les métadonnées des

dictionnaires et les jeux de

données Sandre sont

organisés au sein d’un format

de fichier. Ce travail aboutit à

un scénario Sandre.

De la théorie à la pratique

Présentation

d’un concept

pour le

comprendre

Description et

structure des

données pour les

bancariser

Organisation

des données

pour les

échanger

Description

des interfaces

des données

pour les

exposer par

des services

web

Liste de codes, pour rattacher

les données d'observation et

d'évaluation à ces codes et

ainsi rendre comparable les

résultats entre eux.

Allo, Mr Chombier, j’ai relevé

une température de 20 degré

à… Je vous ai envoyé les

résultats au « format » Sandre : Métadonnées Jeux de données de référence

Données

Le Sandre ne diffuse que les métadonnées et les jeux

de données de référence. Les données d’observation et

d’évaluation sont diffusées par leurs producteurs.

Le dispositif technique

Pour conserver la cohérence des « produits » Sandre malgré ses évolutions permanentes, un

dispositif technique et organisationnel est opérationnel et bien « huilé ».

PARTENAIRES

CONTRIBUTEURS

GESTION DU CYCLE DE

VIE DE LA DONNEE

(Master Data Managment)

+800 000 visites/an

GESTION DE LA

QUALITE ISO 9001

GESTION DU CYCLE DES DICTIONNAIRES

En 3 ans, le Sandre a multiplié sa capacité de production par 2 pour les

spécifications et le travail de codification a plus que doublé en un an.

Qualité des référentiels

géographiques

• Respect des spécifications Sandre

• Types de contrôles:

– présence de doublons

– champs obligatoires renseignés

– respect des nomenclatures

– longueur et format des champs

– cohérence de certains champs: codes identifiants, dates,…

– concordance projection / coordonnées / emprise géographique

– validité de la géométrie

– confrontation aux référentiels associés: codes en cours de

validité, positionnement

Dimitri MEUNIER

Les principaux champs lexicaux

Eaux superficielles

Pluviométrie

Industrie

Eaux littorales

Eaux souterraines

Prélèvement d’eau

Alimentation en eau potable

Assainissement et épandage

L’exemple d’interopérabilité

Dictionnaires de

données Sandre

Relation entre les concepts

Description des concepts

Le SEEE repose sur des définitions et une structure

de données présentées dans le dictionnaire Sandre.

Sémantique Sandre

D’autres

applications du

SIE

Vocabulaire contrôlé

XML Schema, un langage de description permettant

de définir la structure et le type de contenu d'un

document XML.

Des métadonnées exploitées pour structurer les

échanges de données en XML entre systèmes

d’information.

Le dispositif technique

Structures privées

Collectivités

locales

Etablissements publics Services de l'État

Plusieurs millions de données sur l’eau… Comment s’assurer que les fichiers de données

échangées respectent les spécifications Sandre ? Les acteurs ont à disposition sur le site internet

Sandre un service web de vérification assurant 13 000 conformités par an !

Contrôles et diffusion par service Web

Des jeux de données de référence accessibles sous formats

XML, JSON CSV...

Service Web de traitement et

de diffusion de données

Vérification du contenant et une

partie du contenu

Les données « d’ailleurs »

Il existe des spécifications produites par d’autres (cas d’Inspire). A l’échelle du Web, d’autres données et

d’autres vocabulaires existent donc. Ils sont susceptibles d’intéresser le SIE et inversement (DBpedia,

Freebase, Geonames...)

ISO1900…

Les données « d’ailleurs »

Modèle INSPIRE Modèle SANDRE

Les données « d’ailleurs »

Des concepts Sandre rattachés à d’autres

WEB

Des données Sandre rattachées à d’autres

Comment relier les données ?

Relier des vocabulaires et des données

Dictionnaires Sandre

XML

RDFS (vocabulaire)

OWL (ontologie)

Jeux de données

http://id.sandre.eaufrance.fr/com/38185 Côté Sandre

(en réflexion)

Comment relier les données ?

Les jeux de données géographiques diffusés par le Sandre embarquent des objets

décrits selon les vocabulaires Gml et Sandre

Des métadonnées décrites au

sein des schémas Sandre Des métadonnées décrites au

sein des schémas GML

En résumé

des données de référence accessibles sur le web

des données explicites et structurées

des dictionnaires de données (vocabulaire)

des scénarios d’échange (format) non-propriétaires

Le Sandre met à disposition librement :

Dimitri MEUNIER

mais pas encore :

Les produits et services

Plus de 100 fonds

cartographiques

à télécharger

La gestion des jeux de données

référence et la production

des spécifications sont certifiés

ISO 9001

Merci

Dimitri MEUNIER : d.meunier@oieau.fr

top related