atemezing talk-ic2012

24
Ghis lain Atemezing Raphaël Troncy Vers une meilleure interopérabilité Vers une meilleure interopérabilité des données géographiques des données géographiques français es s ur le Web de données français es s ur le Web de données

Upload: eurecom

Post on 08-Jul-2015

157 views

Category:

Education


0 download

DESCRIPTION

Cette présentation a été faite au cours de la conférence de l'Ingénierie des connaissances (IC 2012) tenue à PAris, du 26 au 29 juin.

TRANSCRIPT

Page 1: Atemezing talk-ic2012

Ghis lain AtemezingRaphaël Troncy

Vers une meilleure interopérabilité Vers une meilleure interopérabilité des données géographiques des données géographiques

françaises sur le Web de donnéesfrançaises sur le Web de données

Page 2: Atemezing talk-ic2012

PlanPlan

Où sont les données géographiques ?Le m ob ile e t l’utilisation d e la g o-localisationéD onn e s g ograph ique s sur le we b s m antiqueé é é

Modélisation des objets géographiquesMod lisation d e s e ntit s g ograph ique sé é éMod lisation d e la g om trieé é é Illustration ave c d e s sc nariosé

Aligner les représentations

Formuler quelques recommandations

Conclus ion et travaux futurs

29/06/201 2 - 2IC 201 2, ParisIC 201 2, Paris

Page 3: Atemezing talk-ic2012

Où sont les données géographiques?Où sont les données géographiques?

IC 201 2, Paris - 3

G e oPortail

C IA Factbook

Foursquare : PO I..

Opengeocoder:Bounding Box..

G e oNam e s :

C od e s d e s pays

29/06/201 2

Page 4: Atemezing talk-ic2012

Où sont les données géographiques liées?Où sont les données géographiques liées?

- 4

DBpedia, GeoNames

LinkedGeodata (OpenS treetMap), Freebase (Google)

Ordnance S urvey (UK) , GeoLinkedData (ES )

GADM-RDF

NUTS -RDF

data.ign.fr (FR)

IC 201 2, Paris29/06/201 2

Fournis seur #Donnée disponible

D Bpe d ia 727 232 triple ts

G e oNam e s 5 240 032 ( e ntit s )« é »Linke d G e oD ata 60 356 364 triple ts

O rd nance S urve y 6 295 triple ts

Fre e base 8,5 MB (tsv fich ie rs )

G e oLinke d D ata.e s 1 01 01 8 triple ts

Proje t G AD M 682 605 triple ts

Proje t NU TS 31 6 238 triple ts

Page 5: Atemezing talk-ic2012

Données géographiques liées et LODDonnées géographiques liées et LOD

5

Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzs ch. http://lod-cloud.net/

31 je ux d e d onn e sé1 9.43% triple ts

http://lod-cloud.net/s tate

29/06/201 2 IC 201 2, Paris

Page 6: Atemezing talk-ic2012

29/06/201 2 - 6

Les vocabulaires utilis ésLes vocabulaires utilis és

IC 201 2, Paris

Page 7: Atemezing talk-ic2012

Quels sont les modèles IC utilis és ? Quels sont les modèles IC utilis és ?

Des lis tes d’autorité de termes (Foursquare)Pe u structur eéRe pr se nte le s cat gorie s d e s Points d ’Int r té é é êTyp ique m e nt, un type r ponse d ’une APIéN ce ss ite d ’e xplicite r la s m antiqueé é

Des catégories S KOS (GeoNames ) Le s classe s sont d e s skos:conceptSchemeLe s cod e s sont d e s skos:Concept Pe u d e classe s , d e nom bre ux cod e s

IC 201 2, Paris - 729/06/201 2

Page 8: Atemezing talk-ic2012

Quels sont les modèles IC utilis és ? Quels sont les modèles IC utilis és ?

Des ontologies spécifiques au domaineLe s ontologie s par sous-d om aine (transport, unit é

ad m in is trative , hyd rograph ie , e tc.)

O ntologie s inte rconne ct e s (owl:im ports)éU K (O S ) – E S (G e oLinke d D ata)

Des ontologies riches cons truites par des outils automatiques / TALLe s classe s d e haut-nive au pour structure r

LinkedGeoData (1 6 classe s d e haut-nive au; 1 294

classe s au total)

GeOnto (2 classe s d e haut-nive au ; 783 classe s au total)

IC 201 2, Paris - 829/06/201 2

Page 9: Atemezing talk-ic2012

- 9

Point ( lat/long) Vocabulaire WG S 84 d crit au W3Cé

Rectangle (“ bounding box” ) Vocabulaire g opolitique (FAO )é

Points dans une lis te («  Nodes  », « waynodes  ») S que nce d e points (Linke d G e oD ata)é

Points dans un groupe de res sources RDF U n obje t e s t “formedB y” Lis tO fPoints (G e oLinke d D ata.e s )

Littéraux (représentation GML incluse en RDF) O rd nance S urvey(U K)

Représentation complètement s tructurée Le vocabulaire N e oG e o (G e oVocam p)

IC 201 2, Paris29/06/201 2

Modélisation de la geométrie Modélisation de la geométrie

Page 10: Atemezing talk-ic2012

Scénario: Tour Eiffel / Paris 7èmeScénario: Tour Eiffel / Paris 7ème

- 1 0IC 201 2, Paris29/06/201 2

Page 11: Atemezing talk-ic2012

La Tour Eiffel sur DBpedia La Tour Eiffel sur DBpedia (un “Building”…)(un “Building”…)

- 1 1

dbpedia:Eiffel_Tower a dbpedia-owl:Building ;

a <http://schema.org/Place> ; (16 “types” différent) rdfs:label "Tour Eiffel"@fr ; geo:lat "48.858299"^^xsd:float ; (WGS84 ) geo:long "2.294500"^^xsd:float ; geo:geometry "POINT(2.2945 48.8583)" ;

dbpprop:buildingType "Observation tower"@en ; dbpprop:elevatorCount "9"^^xsd:int ; dbpprop:location dbpedia:Paris ; dbpprop:isofRegion "FR-75" ; dbpprop:architect dbpedia:Stephen_Sauvestre .

IC 201 2, Paris29/06/201 2

Page 12: Atemezing talk-ic2012

La Tour Eiffel sur Freebase (un “skyscraper”)La Tour Eiffel sur Freebase (un “skyscraper”)

- 1 2

fb:en.eiffel_tower a fb:architecture.building ;

a fb:architecture.skyscraper ; (12 rdf:type in total)

fb:architecture.skyscraper.height_with_antenna_spire_meters "324.0"^^xsd:float ; fb:location.geocode [

fb:location.geocode.longitude "2.2946"^^xsd:float ; fb:location.geocode.latitude "48.85839"^^xsd:float . ] ;

IC 201 2, Paris29/06/201 2

Page 13: Atemezing talk-ic2012

La Tour Eiffel sur GeoNames (un “S.MMT”)La Tour Eiffel sur GeoNames (un “S.MMT”)

- 1 3

gnr:6254976 a gn:Feature ;

gn:name "Eiffel Tower" ; gn:alternateName " 에펠 탑 "@ko ; (en 45 langues différentes) gn:featureClass gn:S [ a skos:ConceptScheme ; rdfs:comment "spot, building, farm, ..."@en . ] ;

gn:featureCode gn:S.MMT [ a skos:Concept ; rdfs:comment "a commemorative structure or statue"@en . ] ;

gn:countryCode "FR" ; geo:lat "48.8583" ; geo:long "2.29452" .

IC 201 2, Paris29/06/201 2

Page 14: Atemezing talk-ic2012

La Tour Eiffel sur LGD La Tour Eiffel sur LGD (un “chemin” de 45 points)(un “chemin” de 45 points)

- 1 4

lgd:way5013364 a lgdo:Building , lgdo:ManMadeTower , lgdo:Attraction ; rdfs:label "Wieża Eiffel'a"@pl ; (en 13 langues.) lgdo:layer "2"; lgdp:building:height "301"; lgdp:importance "international"; lgdo:hasNodes <http://linkedgeodata.org/triplify/way5013364/nodes>.

rdf:_1 lgd:node33388356; …………; rdf:_10 lgd:node33388333 ;

(tous les 45 points du polygone)

IC 201 2, Paris29/06/201 2

Page 15: Atemezing talk-ic2012

7ème Arrondissement in DBpedia (a gml_Feature)7ème Arrondissement in DBpedia (a gml_Feature)

- 1 5

dbpedia:7th_arrondissement_of_Paris a gml:_Feature ; (gml n’est pas en OWL )

a <http://dbpedia.org/class/yago/1900SummerOlympicVenuEs> (Yago Class)

rdfs:label "巴黎第七區 "@zh; (14 different languages)

dbpprop:commune "Paris" ; dbpprop:département dbpedia:Paris ; dbpprop:région dbpedia:Île-de-France_(region) ;

grs:point "48.85916666666667 2.312777777777778" ; geo:geometry "POINT(2.31278 48.8592)" ; (fake property?!) geo:lat "48.859165"^^xsd:float; geo:long "2.312778"^^xsd:float.

IC 201 2, Paris29/06/201 2

Page 16: Atemezing talk-ic2012

7ème Arrondissement in GeoNames (a A.ADM4)7ème Arrondissement in GeoNames (a A.ADM4)

- 1 6

gnr:6618613 a gn:Feature ; gn:name "Paris 07";

gn:alternateName "7ème arrondissement"; gn:featureClass gn:A [ a skos:ConceptScheme ; rdfs:comment "country, state, region ..."@en . ] ;

gn:featureColde gn:A.ADM4 [ a skos:Concept ; rdfs:comment "a subdivision of a third-order administrative division"@en . ];

gn:countryCode "FR"; gn:population "57410"; geo:lat "48.8565"; geo:long "2.321".

IC 201 2, Paris29/06/201 2

Page 17: Atemezing talk-ic2012

7ème Arrondissement in LGD (a “Suburb”)7ème Arrondissement in LGD (a “Suburb”)

- 1 7

lgd:node248177663 a lgdo:Suburb ;

rdfs:label "7th Arrondissement"@en , "7e Arrondissement" ; lgdo:contributor lgd:user13442 ;

<http://linkedgeodata.org/ontology/ref%3AINSEE> 75107 ;

lgdp:alt_name "VIIe Arrondissement" ;

georss:point "48.8570281 2.3201953" ; geo:lat 48.8570281 ; geo:long 2.3201953 .

IC 201 2, Paris29/06/201 2

Page 18: Atemezing talk-ic2012

Vocabulaire GeOntoVocabulaire GeOnto

Ontologie des objets géographiques (PI)R sultat d ’un proje t ANRéO bte nue par d e s outils d e TAL

Re couvre la partie BD Topo (IG N)

Clas ses en françaisrdfs:labels e n FR & E N

Pas d e rdfs:commentsPe u d e re lations

783 classe s

- 1 8IC 201 2, Paris29/06/201 2 IC 201 2, Paris

Page 19: Atemezing talk-ic2012

Méthodologie d’alignementMéthodologie d’alignement

Alignement de GeOnto avec 4 vocabulaires et 2 taxonomies LG D , D Bpe d ia, S che m a.org, G e oN am e s

Foursquare , G oogle Place s

Recherche des owl:equivalentClass O util : S ilk

M trique s : Leve nshte inD is tance , Jaro é Labe ls : @ e n d e s classe s

Fonction d ’agr gation : m oye nneé

Validation manuelle Pour le s rd fs :s ubC lassO f « » Aligne m e nt sp cifique ave c G e oN am e sé

- 1 9IC 201 2, Paris29/06/201 2 IC 201 2, Paris

Page 20: Atemezing talk-ic2012

Procédé d’alignement avec GeoNamesProcédé d’alignement avec GeoNames

geOnto:AGeoConcept a owl:Class; rdfs:label “a laben”@en; rdfs:subClassOf gn:Feature; owl:equivalentClass [a owl:Restriction; owl:onProperty gn:featureCode; owl:hasValue gn:CODE. ]

- 20IC 201 2, Paris29/06/201 2 IC 201 2, Paris

Page 21: Atemezing talk-ic2012

Résultats /EvaluationRésultats /Evaluation

Precis ions généralement > 80%

S auf P(S chema.org) = 50%. Raison pos s ib le : le s e ntit s G e O nto plus s p cifique s la Franceé é à N ive au trop d taill d e s e ntit s s ur S che m a.org é é é

- 21IC 201 2, Paris

Vocab/taxonomies #Clas ses #C las ses alignées

LG D owl:Class: 1 294 1 78

D Bpe d ia owl:Class:366 42

S che m a.org owl:Class: 296 52

G e oNam e s skos:Concept:699 287

Foursquare 359 46

G oogle Place 1 26 41

29/06/201 2 IC 201 2, Paris

Page 22: Atemezing talk-ic2012

Recommendations Recommendations S éparation des objets de leur géométrie

Bie n d is tingue r d ans le s e space s d e nom m age

E xe m ple : spatial:Feature vs geom:G eometry

Usage du vocabulaire WGS 84 pour représenter les points R utilis e r le s propri t s native s (long; lat; alt)é é é

Géométrie complexe (polygone, courbe, etc.) U tilis e r le s re pr se ntations plus s tructur e sé é E vite r au m axim um le s n ud s anonym e s d ans le s d onn e sœ é Propose r d e s transform ations aux form ats S IG (KML, G ML, e tc.)

Extens ion de GeOnto U n bon cand id at: N e oG e o

Publie r s e lon le s Bonne s Pratique s (d ata.ign.fr)

- 22IC 201 2, Paris29/06/201 2 IC 201 2, Paris

Page 23: Atemezing talk-ic2012

PerspectivesPerspectives

Publier GeOnto++S e lon le s Bonne s Pratique s d u we b d e d onn e s li e sé é

«  Lifter » les données de l’IGNE n utilisant le vocabulaire

Poursuivre les A lignementsS che m a.org, Foursquare , G oogle Place ( volutif)éG e oS PARQ L

Proc d e r d e s aligne m e nts au nive au d e s d onn s é à é

- 23IC 201 2, Paris29/06/201 2 IC 201 2, Paris

Page 24: Atemezing talk-ic2012

Ques tionsQues tions ??

Merci pour votre attention !