le web semantique_2013_2014

47
Les Systèmes d’Information Sémantiques S. Garlatti

Upload: serge-garlatti

Post on 15-Nov-2014

501 views

Category:

Education


0 download

DESCRIPTION

 

TRANSCRIPT

Page 1: Le web semantique_2013_2014

Les Systèmes d’Information Sémantiques

S. Garlatti

Page 2: Le web semantique_2013_2014

page 2

Le Google d’aujourd’hui

Utilisez-vous Google pour rechercher de l’information ?

• Trouvez-vous toujours ce que vous cherchez ?

• Quels sont les problèmes ?

• Etes-vous satisfait ?

Page 3: Le web semantique_2013_2014

Semantic Web in Actionpage 3

Problématique

Requête : « directeur » « Paul Friedel »

• Intention : On ne veut que le site de Telecom Bretagne !

• XXX 000 résultats : toutes les pages qui contiennent ces deux termes ou l’un des deux

Page 4: Le web semantique_2013_2014

Semantic Web in Actionpage 4

Problématique

Recherche d’information de type Google

• Polysémie

• Nombre de résultats très important

Page 5: Le web semantique_2013_2014

Le Google d’Hier

page 5

=

Page 6: Le web semantique_2013_2014

Semantic Web in Action

Le Google d’Aujourd’hui

Google Now

page 6

Page 7: Le web semantique_2013_2014

Semantic Web in Action

Le Google d’Aujourd’hui

Google Now

page 7

Page 8: Le web semantique_2013_2014

Semantic Web in Action

Le Google d’Aujourd’hui

Google Now

page 8

Page 9: Le web semantique_2013_2014

Semantic Web in Action

Le Google d’Aujourd’hui

Google Now

page 9

Page 10: Le web semantique_2013_2014

Semantic Web in Action

Le Google d’Aujourd’hui

page 10

Page 11: Le web semantique_2013_2014

Quelques

page 11

Page 12: Le web semantique_2013_2014

Semantic Web in Action

Le Google d’Aujourd’hui

page 12

Knowledge Graph

Page 13: Le web semantique_2013_2014

Le Google Intelligent

page 13

=

Page 14: Le web semantique_2013_2014

Quelques exemples

Facebook : Graph Search • Restaurants londoniens où mes amis sont allés ?• Musique que mes amis aiment ?• Amateurs de cyclisme ?• Photos avant 1990 ?• Photos de mes amis à Philadelphie ?

page 14

Page 15: Le web semantique_2013_2014

Le Google Intelligent

page 15

Données

& Services

RechercheFils de nouvellesSyndicationFiltrage

Recommandation

ContenuTags

SocialInformation

Page 16: Le web semantique_2013_2014

Le Google Intelligent

Pourquoi ?• Offrir de nouveaux services aux entreprises et au grand

public

- Comment : En réutilisant automatiquement le résultat d’une recherche d’information

– Proposer des visites guidées, proposer de l’aide pour voyager en train, en avion, en fonction de vos besoins et/ou de vos préférences, etc.

– Rechercher des entreprises ayant les compétences requises pour de la sous-traitance

– Etc.

page 16

Page 17: Le web semantique_2013_2014

Problématique

Mais pour cela, il faut donner

Du SENS

aux Données !

Page 18: Le web semantique_2013_2014

Problématique

Que voyez-vous ?

Page 19: Le web semantique_2013_2014

Problématique

Que voyez-vous ?

Page 20: Le web semantique_2013_2014

Problématique

Comment attribuons-nous du sens aux données ?

Que voyez-vous ?

Page 21: Le web semantique_2013_2014

Problématique

Que voyez-vous ?

Page 22: Le web semantique_2013_2014

Problématique

Que voyez-vous ?

Page 23: Le web semantique_2013_2014

Problématique

Que voyez-vous ?

Page 24: Le web semantique_2013_2014

Problématique

Que voyez-vous ?

Page 25: Le web semantique_2013_2014

Problématique

Que voyez-vous ?

Page 26: Le web semantique_2013_2014

Problématique

Que voyez-vous ?

Page 27: Le web semantique_2013_2014

Problématique

Que voyez-vous ?

Page 29: Le web semantique_2013_2014

Problématique

Page 30: Le web semantique_2013_2014

Problématique

Pour Donner du sens aux données

• Nous utilisons nos Connaissances dans des Domaines Spécifiques pour Identifier / Reconnaître ces données

• Connaissances partagées par des communautés

Page 31: Le web semantique_2013_2014

Problématique

Enjeu principal du Web Sémantique & Linked Data

• Utiliser ces connaissances pour annoter les ressources au niveau sémantique

• Pour rechercher, réutiliser et partager, si possible automatiquement, les informations

Page 32: Le web semantique_2013_2014

Le Google Intelligent

Démonstration• Recherche d’informations sur LinkedMDB

- Copie « Intelligente » de IMDB

- Trouver tous les films d’un acteur : Bruce Willis, etc.

- Trouver le ou les acteurs qui ont joué dans un ou des films de deux producteurs :

– Sofia Coppola Francis Ford Coppola– Clint Eastwood Buddy Van Horn– Paul McGuigan Robert Schwentke

page 32

Page 33: Le web semantique_2013_2014

Semantic Web & Linked Data

Démonstrations sur LINKEDMDB et Dbpedia

• http://3s-web.enstb.org/Demo_Linked_Data/

page 33

Page 34: Le web semantique_2013_2014

page 34

Le Google Intelligent : Comment ?

Description des informations dans LinkedMDB• Des phrases de type :

Sujet Verbe Complément

• Exemple

- Le film « RED » a pour acteur Bruce Willis

- Le film « Red » a pour page web http://…..

- Le film « RED » a pour producteur Robert Schwentke

Page 35: Le web semantique_2013_2014

page 35

Le Google Intelligent : Comment ?

Compréhension de ces phrases• Différents contextes : différents termes

- « acteur », « actor », « director » « producteur », …

• Interprétation commune liée à des connaissances communes

- Utilisation de vocabulaires standards partagés par tous !

- Chaque vocabulaire détermine un sens unique aux verbes, aux catégories de sujets et de compléments

Page 36: Le web semantique_2013_2014

page 36

Le Google Intelligent : Comment ?

Plus formellement, ou presque- « Red » movie:actor « Bruce Willis »

- « Red » movie:director « Robert Schwentke »

• « Red » rdf:type movie:film

- « Red » foaf:page http://www.freebase…

Question• Trouver tous les films dont Bruce Willis est acteur ?

- ?Film movie:actor « Bruce Willis »

- ?Film rdf:type movie:film

Page 37: Le web semantique_2013_2014

page 37

Le Google Intelligent : Comment ?

Site Linkedmdb• Film Red

http://data.linkedmdb.org/page/film/97209• Acteur Bruce Willis

http://data.linkedmdb.org/page/actor/29961

Page 38: Le web semantique_2013_2014

Semantic Web in Action

Freebase Parallax

« Faceted Semantic Search »• http://parallax.freebaseapps.com/• Question

- Which Schools did the Children of Republican Us Presidents?

– Comment faire avec Wikipédia ?

– Comment fait-on avec Freebase Parallax ?

page 38

Page 39: Le web semantique_2013_2014

Semantic Web in Action

Freebase Parallax

Question : comment répondre ?

• US President are Presidents

• US Presidents Belong to a Party

• Republican Party is a Party

• US Presidents have Children

• Children studies in Schools

page 39

Page 40: Le web semantique_2013_2014

Semantic Web & Linked Data

page 40

RDF Graph

http://webofdata.wordpress.com/2010/09/27/linked-enterprise-data-in-a-nutshell/

Page 41: Le web semantique_2013_2014

Semantic Web & Linked Data

page 41

Source 1

Source 2

Source 3

Page 42: Le web semantique_2013_2014

Semantic Web & Linked Data

page 42

Page 43: Le web semantique_2013_2014

page 43

Le Google Intelligent : Comment ?

Page 44: Le web semantique_2013_2014

Linked Data = ? = Big Data

Une type particulier de Big Data• DBpedia: Linked Data version of Wikipedia : more than 103 million RDF triples.

• The Bio2RDF project, a Semantic web atlas of post-genomic knowledge about human and mouse, has published 27 biology-, gene- and medical-related data sets : altogether 2.3 billion triples

• data.gov official website of the US government making over 1000 US government datasets available as Linked Data (around 6.4 billion triples).

• GovTrack.us from Joshua Tauberer publishes linked data about members of the U.S. Congress, as well as bills, committees and votes. 12M triples

• PDB2RDF Projekt making the Protein Data Bank available as Linked Data and via a SPARQL endpoint (approximately 14 billion triples).

• RDF Book Mashup: Provides bibliographic information, reviews and sales offers for most books that have a ISBN number. Maps data from Amazon and Google base to RDF. Size of the data set: Unknown, billions of triples

• Etc.

page 44

Page 46: Le web semantique_2013_2014

Linked Data pour le Big Data

Avantages

• Sémantique unique des entités

• Linked Data

- « A New architectural platform for interconnecting, mapping, indexing, feeding real-time information from a variety of sources »

• Tim Berners Lee

- Web = « Global Giant Graph »– Comme une unique base de données globale

– Requêtes complexes sur plusieurs sources

page 46

Page 47: Le web semantique_2013_2014

Linked Data pour le Big Data

Avantages• Déduction de nouvelles relations

- Qui pourront être utilisées plus tard pour de nouvelles analyses

• Standards

- SPARQL 1.1, OWL, RDF, RDFS, …..

• Passage à l’échelle

page 47