Intégration et visualisation de données thématiques sur un référentiel
topographique de support
Contexte
De récentes démarches politiques et avancées technologiques ont conduit à la mise à
disposition de jeux de données produits par les administrations et les collectivités locales
(ex : http://www.data.gouv.fr/, http://data.lacub.fr/) afin de favoriser l’information des
citoyens et la création de nouveaux services. La valorisation de ces diverses sources de
données nécessite de faciliter leur réutilisation au sein d’applications, en particulier leur
croisement entre elles. Sur le Web, l’initiative du LOD (Linked Open Data :
http://linkeddata.org/, [1] [2] [3] [4]) encourage la publication de jeux de données libres
conformes à un modèle permettant le croisement de données entre elles. Ce modèle
technique est utilisé par exemple en France, pour la publication de jeux de données de l’IGN
(http://data.ign.fr/), de l’INSEE (http://rdf.insee.fr/), ou encore de la BNF
(http://data.bnf.fr/).
Parmi les données disponibles, de nombreuses ressources font référence, de façon directe
ou indirecte, à une localisation. Cette composante spatiale des données constitue l’un des
critères privilégiés pour leur interconnexion avec d’autres sources de données ou encore
leur valorisation au travers d’applications cartographiques (citons par exemple le site réalisé
à l’aide de données issues de data.gouv.fr: http://www.hicnunc.mobi/j_aime_ma_gare/).
Rendre accessibles et utilisables ensemble des données décrivant les territoires a conduit la
Commission Européenne à instaurer la directive INSPIRE [5] pour la mise en place d’une
infrastructure de données géographiques européenne (SDI, Spatial Data Infrastructures) [6].
Par rapport à l’approche Linked Data, l’approche adoptée dans le cadre d’INSPIRE a
d’avantage mis l’accent sur l’harmonisation des schémas et le traitement des géométries,
afin de permettre la création d’un jeu de données géographiques harmonisé.
Sujet
Dans ce contexte, permettre l’intégration de données au modèle Linked data avec un
référentiel géographique (le Référentiel à Grande Échelle de l’IGN) constitue un enjeu
important pour favoriser l’interconnexion et la valorisation des données ainsi publiées. Ce
travail de thèse consistera donc dans un premier temps à proposer et mettre en œuvre une
approche pour l’intégration de données au modèle Linked data avec le Référentiel à Grande
Échelle :
- Mise à profit des ontologies décrivant les données afin d’en tirer des indications sur
le type de géoréférencement utilisé, la représentation éventuelle des géométries, ou
encore le système de coordonnées utilisé.
- Reconstitution de géométries cartographiables à partir de ces données (géométries
fournies par les données ou géocodage)
- Intégration de ces données à des données géographiques « classiques » :
appariement, recalage.
Un verrou important au croisement des sources de données disponibles sur le Web est la
bonne représentation formelle du positionnement, ce que nous appelons "la sémantique du
X, Y". Il conviendra donc de proposer une représentation efficace de l’information de
positionnement : quel est le lien entre une géométrie et l’élément du terrain réel qu’elle
représente (contour d’un bâtiment, centre d’un carrefour) ou encore quelle est la relation
qui lie un objet thématique à un objet topographique (un service public hébergé dans un
bâtiment) ? Ces connaissances ainsi formalisées devront ensuite être mises à profit dans le
cadre d’une approche d’interconnexion de données utilisant le Référentiel à Grande Échelle
comme source de données de support.
Enfin, parmi les applications découlant de cette intégration de linked data avec un
référentiel géographique, leur visualisation cartographique permet leur mise en valeur en
fournissant aux utilisateurs un moyen de découverte convivial de ces données. Quelques
applications de ce type existent déjà, mais se limitent à positionner des points sur un fond
cartographique (voir figures 1 et 2). La mise à profit des ontologies décrivant les données
pour proposer des solutions de visualisation cartographique adaptées sera donc étudiée. On
s’intéressera en particulier à l’utilisation de la sémantique des données pour leur
généralisation.
Figure 1: Visualisation de Linked Data sur un fond cartographique (Open Street Map) :
http://browser.linkedgeodata.org/?
Figure 2: Visualisation de Linked Data sur un fond cartographique (Google Maps) :
http://geo.linkeddata.es/web/guest/visualizacion-beta
Compétences particulières et formation requise
Informatique, linked data, une compétence en SIG est un plus.
Titulaire d’un Master 2 ou d’un diplôme d’ingénieur en géomatique,
Titulaire d’un Master 2 ou d’un diplôme d’ingénieur en informatique avec un intérêt pour la
géomatique.
Accueil et encadrement
La thèse sera réalisée au Laboratoire COGIT de l’IGN, Saint-Mandé (limitrophe Paris), en
partenariat avec le CNAM. La direction et l’encadrement de la thèse seront réalisés par
Nathalie Abadie (IGN), Bénédicte Bucher (IGN), et Fayçal Hamdi (CNAM). Le contrat doctoral,
de trois ans, pourra être réalisé avec ou sans charge de cours, selon le profil du candidat et
les besoins de l’Ecole Nationale des Sciences Géographiques.
Contact et candidature
Contact pour tout renseignement: Nathalie Abadie (nathalie-f.abadie[at]ign.fr, 01 43 98 80
03) et Fayçal Hamdi (faycal.hamdi[at]cnam.fr)
Pour candidater : envoyer par E-mail a minima CV, lettre de motivation, notes de l’année en
cours et passée, à Nathalie Abadie (nathalie-f.abadie[at]ign.fr), avec copie à la DRH de l’IGN
([email protected]), avant le 30 avril 2013.
Bibliographie
[1] Berners-Lee, T.: Design Issues: Linked Data. Online, Retrieved May 25, 2009, from http://www.w3.org/DesignIssues/LinkedData.html
[2] Bizer, C., Heath, T., Berners-Lee, T.: Linked data - the story so far. Journal on Semantic Web and Information Systems (in press) (2009).
[3] Resource Description Framework (RDF): Concepts and Abstract Syntax, Graham Klyne and Jeremy J. Carroll, Editors, W3C Recommendation, 10 février 2004, http://www.w3.org/TR/2004/REC-rdf-concepts-20040210/. Dernière version : http://www.w3.org/TR/rdf-concepts/.
[4] SPARQL Query Language for RDF, Eric Prud'hommeaux and Andy Seaborne, Editors, W3C Recommendation, 15 janvier 2008, Dernière version: http://www.w3.org/TR/rdf-sparql-query/
[5] Parlement Européen et Conseil de l’Union Européenne. Directive 2007/2/CE du Parlement Européen et du Conseil du 14 mars 2007 établissant une infrastructure d’information géographique dans la Communauté européenne (INSPIRE) *en ligne+. Journal officiel de l’Union Européenne du 25 avril 2007, L108/1, Disponible sur : http://eur-lex.europa.eu/LexUriServ/LexUriServ.do?uri=OJ:L:2007:108:0001:0014:FR:PDF (Consulté le 08.07.2011). 2007
[6] Nebert, D.D. Developing Spatial Data Infrastructures: The SDI cookbook. Douglas D. Nebert, Technical Working Group Chair, G. S. D. I. (ed.). 2004, pp. 171