données liées et web sémantique : quand le lien fait sens

Post on 08-Jul-2015

5.570 Views

Category:

Internet

2 Downloads

Preview:

Click to see full reader

DESCRIPTION

Présentation "Données liées et Web sémantique : quand le lien fait sens" pour les rencontres Inria Industrie "Technologies du Web"

TRANSCRIPT

Données liées et Web sémantique

quand le lien fait sensFabien Gandon

#inria_industrie

@fabien_gandon / http://fabien.info

2

étendre la mémoire humaine

Vannevar BUSH

3

étendre la mémoire humaine

Vannevar BUSH

Memex, Life Magazine, 10/09/1945

4

structure de données des hypermédias

Vannevar BUSH

Memex, Life Magazine, 10/09/1945

Ted Nelson

5

structure de données des hypermédias

Vannevar BUSH

Memex, Life Magazine, 10/09/1945

Ted Nelson

HyperText, T. H. Nelson, ACM, 1965

6

identifiants et liens partagés en réseaux

Vannevar BUSH

Memex, Life Magazine, 10/09/1945

Ted Nelson

HyperText, T. H. Nelson, ACM, 1965

Tim Berners-Lee

7

identifiants et liens partagés en réseaux

Vannevar BUSH

Memex, Life Magazine, 10/09/1945

Ted Nelson

HyperText, T. H. Nelson, ACM, 1965 Information Management: A Proposal

Tim Berners-Lee, CERN, March 1989

Tim Berners-Lee

8

Les trois composants de l’architecture Web

1. identification (URI) & adressage (URL)ex. http://www.inria.fr

HTTP

URL

HTML

référence adresse

communication

WEB

9

Les trois composants de l’architecture Web

1. identification (URI) & adressage (URL)ex. http://www.inria.fr

2. communication / protocole (HTTP)GET /centre/sophia HTTP/1.1

Host: www.inria.fr

HTTP

URL

HTML

référence adresse

communication

WEB

10

Les trois composants de l’architecture Web

1. identification (URI) & adressage (URL)ex. http://www.inria.fr

2. communication / protocole (HTTP)GET /centre/sophia HTTP/1.1

Host: www.inria.fr

3. langage de représentation (HTML)Fabien travaille chez

<a href="http://inria.fr">Inria</a>

HTTP

URL

HTML

référence adresse

communication

WEB

11

multiplication des références au Web

HTTP

URL

HTML

référence adresse

communication

WEB

12

changement de statut de la référence

URLidentifier ce qui existe sur le web

http://mon-site.fr

13

changement de statut de la référence

URLidentifier ce qui existe sur le web

http://mon-site.fr

URIidentifier,

sur le web,ce qui existe

http://animaux.fr/ce-zèbre

15

changement de statut de la référence

URLidentifier ce qui existe sur le web

http://mon-site.fr

URIidentifier,

sur le web,ce qui existe

http://animaux.fr/ce-zèbre

IRIidentifier,

sur le web,en toute langue

ce qui existe

http://الحيوانات.tn/斑馬

16

le web est un réseau de ressources

URL URI IRI

17

le web est un réseau de ressources

URL URI IRIRESSOURCEtout ce qui peut être identifié

18

HTTP

référence adresse

communication

WEB

IRI

décrire et relier des ressources

HTTP

URL

HTML

référence adresse

communication

WEB

19

principes techniques: le web appliqué aux données

1. utiliser des URI HTTP (URL)

pour que l’on puisse les suivreex. http://chercheurs.fr/fgandon

20

principes techniques: le web appliqué aux données

1. utiliser des URI HTTP (URL)

pour que l’on puisse les suivreex. http://chercheurs.fr/fgandon

2. lorsqu’un URI est suivi renvoyer des

données sur ce qu’il représente

(HTTP)

21

principes techniques: le web appliqué aux données

1. utiliser des URI HTTP (URL)

pour que l’on puisse les suivreex. http://chercheurs.fr/fgandon

2. lorsqu’un URI est suivi renvoyer des

données sur ce qu’il représente

(HTTP)

3. inclure dans ces données des liens

vers d’autres données (Web)

22

principes techniques: le web appliqué aux données

URI ???...

« http://fr.dbpedia.org/resource/Paris »

23

principes techniques: le web appliqué aux données

HTTP URI

24

principes techniques: le web appliqué aux données

HTTP URI

GET

25

principes techniques: le web appliqué aux données

HTTP URI

GET

HTML, …

26

principes techniques: le web appliqué aux données

HTTP URI

GET

HTML,XML,…

27

données liées

28

« linked open data »

l’explosion des données ouvertes et liées

0

50

100

150

200

250

300

350

01/05/2007 01/05/2008 01/05/2009 01/05/2010 01/05/2011

nombre de jeux de données libres, publiés et liés

29

principes techniques: le web appliqué aux données

ex. DBpedia

30

pile de standardisation

Pile des standards du Web de données W3C®

31

pile de standardisation

Pile des standards du Web de données W3C®

32

pile de standardisation

Pile des standards du Web de données W3C®

33

RDF: modèle de base

Pile des standards du Web de données W3C®

HTTP

URI

RDF

référence adresse

communication

web de données

34

RDFdécompose les descriptions en triplets

( sujet , prédicat , objet )

35

RDFdécompose les descriptions en triplets

( sujet , prédicat , objet )

ex. « doc.html a pour auteur Fabien

et a pour thème la Musique »

36

RDFdécompose les descriptions en triplets

( sujet , prédicat , objet )

ex. doc.html a pour auteur Fabien

doc.html a pour thème Musique

37

RDFest un modèle de graphes

( doc.html , auteur, Fabien )

( doc.html , thème, Musique )

( sujet , prédicat, objet )doc.html

Musique

Fabien

auteur

thème

38

"Musique"

RDFgraphes distribué à l’échelle mondiale

http://inria.fr/rr/doc.html

http://ns.inria.fr/fabien.gandon#me

http://inria.fr/schema#author

http://inria.fr/schema#theme

http://inria.fr/rr/doc.html

39

RDFa une syntaxe historique en XML et d’autres

syntaxes: Turtle, TriG, JSON-LD, N-Triples, N-Quads

W3C ©

40

Corese

KGram

41

pile de standardisation

Pile des standards du Web de données W3C®

42

pile de standardisation

Pile des standards du Web de données W3C®

HTTP

URI

RDF

référence adresse

communication

web de données

43

ex. personne ayant au moins 18 ans

PREFIX ex: <http://inria.fr/schema#>

SELECT ?person ?name

WHERE {

?person rdf:type ex:Person ;

ex:name ?name ;

ex:age ?age .

FILTER (xsd:integer(?age)> 17)

}

44

ex. visualiser

45

société coopérative spin-off wimmics

Xxxx

xxxx

Xxxx

xxxx

x

xxxx

xxxx

x

xxxx

Xxxx

xx

xxxx

x

Xxxxxx

xxxxxx

xxxxxxXxxxxx

xxxxxx

xxxxxx

Xxxxxx

xxxxxx

xxxxxx

contribute

Xxxxxx

xxxxxx

xxxxxxcontributes

exhange

Xxxxxx

xxxxxx

xxxxxx

Xxxxxx

xxxxxx

xxxxxx

lier, enrichir

analyser, assister

intégration aux SI, veille, intelligence, réseaux sociaux d’entreprise

46

pile de standardisation

Pile des standards du Web de données W3C®

47

pile de standardisation

Pile des standards du Web de données W3C®

HTTP

URI

RDFSOWL

référence adresse

communication

web de données

48

OWL in one…une vue graphique des constructeurs logiques offerts

prop. algébriques

prop. disjointes

cardinalité qualifiée1..1

!négation prop. indiv

restriction !cardinalité

1..1

chaîne

intersection

union

complément

disjonction

énumération

union disjointe

équivalence clefs [>18]restrict. valeur

49 DiscoveryHub.co

50

pile de standardisation

Pile des standards du Web de données W3C®

51

PROV-O: schéma pour tracer la provenance décrire les entités et les activités de la création d’une ressource

52

PROV-O: schéma pour tracer la provenance décrire les entités et les activités de la création d’une ressource

53

pile de standardisation

Pile des standards du Web de données W3C®

54 qakis.org

55

SMILK:

laboratoire

commun

56

URL, URI, IRI

RDF

HTTP, SPARQL, LDP

RDFS & OWL

PROV-O

LES FINS ET LES MOYENS

identifier

décrire et lier

interroger

raisonner

tracer

57

beaucoup d’outils dans beaucoup de langages

http://www.w3.org/2001/sw/wiki/Tools

59

price

convert?

person

contact?

other sellers?

Web 1.0, 2.0, 3.0 …

60

un et un seul webun espace unique dans tous les sens du terme:

données

personnes documents

programmes

métadonnées

celui qui contrôle les

métadonnées contrôle le web,

et à travers le world-wide web

une part grandissante de notre

monde.

world-wide wayalors que le web se diffuse dans le monde,le monde se diffuse dans le web.

world-wild webla complexité naturelle de notre monde contamine le web

63

wwwmmm

world wide web

méthode massivement multidisciplinairefabien, gandon

@fabien_gandon

http://fabien.info

top related