le web semantique_2013_2014
Post on 15-Nov-2014
501 Views
Preview:
DESCRIPTION
TRANSCRIPT
Les Systèmes d’Information Sémantiques
S. Garlatti
page 2
Le Google d’aujourd’hui
Utilisez-vous Google pour rechercher de l’information ?
• Trouvez-vous toujours ce que vous cherchez ?
• Quels sont les problèmes ?
• Etes-vous satisfait ?
Semantic Web in Actionpage 3
Problématique
Requête : « directeur » « Paul Friedel »
• Intention : On ne veut que le site de Telecom Bretagne !
• XXX 000 résultats : toutes les pages qui contiennent ces deux termes ou l’un des deux
Semantic Web in Actionpage 4
Problématique
Recherche d’information de type Google
• Polysémie
• Nombre de résultats très important
Le Google d’Hier
page 5
=
Semantic Web in Action
Le Google d’Aujourd’hui
Google Now
page 6
Semantic Web in Action
Le Google d’Aujourd’hui
Google Now
page 7
Semantic Web in Action
Le Google d’Aujourd’hui
Google Now
page 8
Semantic Web in Action
Le Google d’Aujourd’hui
Google Now
page 9
Semantic Web in Action
Le Google d’Aujourd’hui
page 10
Quelques
page 11
Semantic Web in Action
Le Google d’Aujourd’hui
page 12
Knowledge Graph
Le Google Intelligent
page 13
=
Quelques exemples
Facebook : Graph Search • Restaurants londoniens où mes amis sont allés ?• Musique que mes amis aiment ?• Amateurs de cyclisme ?• Photos avant 1990 ?• Photos de mes amis à Philadelphie ?
page 14
Le Google Intelligent
page 15
Données
& Services
RechercheFils de nouvellesSyndicationFiltrage
Recommandation
ContenuTags
SocialInformation
Le Google Intelligent
Pourquoi ?• Offrir de nouveaux services aux entreprises et au grand
public
- Comment : En réutilisant automatiquement le résultat d’une recherche d’information
– Proposer des visites guidées, proposer de l’aide pour voyager en train, en avion, en fonction de vos besoins et/ou de vos préférences, etc.
– Rechercher des entreprises ayant les compétences requises pour de la sous-traitance
– Etc.
page 16
Problématique
Mais pour cela, il faut donner
Du SENS
aux Données !
Problématique
Que voyez-vous ?
Problématique
Que voyez-vous ?
Problématique
Comment attribuons-nous du sens aux données ?
Que voyez-vous ?
Problématique
Que voyez-vous ?
Problématique
Que voyez-vous ?
Problématique
Que voyez-vous ?
Problématique
Que voyez-vous ?
Problématique
Que voyez-vous ?
Problématique
Que voyez-vous ?
Problématique
Que voyez-vous ?
Problématique
Shotokan-ryu Goju-ryu Wado-ryu Shito-ryu Shorin-ryu
Que voyez-vous ?
Problématique
Problématique
Pour Donner du sens aux données
• Nous utilisons nos Connaissances dans des Domaines Spécifiques pour Identifier / Reconnaître ces données
• Connaissances partagées par des communautés
Problématique
Enjeu principal du Web Sémantique & Linked Data
• Utiliser ces connaissances pour annoter les ressources au niveau sémantique
• Pour rechercher, réutiliser et partager, si possible automatiquement, les informations
Le Google Intelligent
Démonstration• Recherche d’informations sur LinkedMDB
- Copie « Intelligente » de IMDB
- Trouver tous les films d’un acteur : Bruce Willis, etc.
- Trouver le ou les acteurs qui ont joué dans un ou des films de deux producteurs :
– Sofia Coppola Francis Ford Coppola– Clint Eastwood Buddy Van Horn– Paul McGuigan Robert Schwentke
page 32
Semantic Web & Linked Data
Démonstrations sur LINKEDMDB et Dbpedia
• http://3s-web.enstb.org/Demo_Linked_Data/
page 33
page 34
Le Google Intelligent : Comment ?
Description des informations dans LinkedMDB• Des phrases de type :
Sujet Verbe Complément
• Exemple
- Le film « RED » a pour acteur Bruce Willis
- Le film « Red » a pour page web http://…..
- Le film « RED » a pour producteur Robert Schwentke
page 35
Le Google Intelligent : Comment ?
Compréhension de ces phrases• Différents contextes : différents termes
- « acteur », « actor », « director » « producteur », …
• Interprétation commune liée à des connaissances communes
- Utilisation de vocabulaires standards partagés par tous !
- Chaque vocabulaire détermine un sens unique aux verbes, aux catégories de sujets et de compléments
page 36
Le Google Intelligent : Comment ?
Plus formellement, ou presque- « Red » movie:actor « Bruce Willis »
- « Red » movie:director « Robert Schwentke »
• « Red » rdf:type movie:film
- « Red » foaf:page http://www.freebase…
Question• Trouver tous les films dont Bruce Willis est acteur ?
- ?Film movie:actor « Bruce Willis »
- ?Film rdf:type movie:film
page 37
Le Google Intelligent : Comment ?
Site Linkedmdb• Film Red
http://data.linkedmdb.org/page/film/97209• Acteur Bruce Willis
http://data.linkedmdb.org/page/actor/29961
Semantic Web in Action
Freebase Parallax
« Faceted Semantic Search »• http://parallax.freebaseapps.com/• Question
- Which Schools did the Children of Republican Us Presidents?
– Comment faire avec Wikipédia ?
– Comment fait-on avec Freebase Parallax ?
page 38
Semantic Web in Action
Freebase Parallax
Question : comment répondre ?
• US President are Presidents
• US Presidents Belong to a Party
• Republican Party is a Party
• US Presidents have Children
• Children studies in Schools
page 39
Semantic Web & Linked Data
page 40
RDF Graph
http://webofdata.wordpress.com/2010/09/27/linked-enterprise-data-in-a-nutshell/
Semantic Web & Linked Data
page 41
Source 1
Source 2
Source 3
Semantic Web & Linked Data
page 42
page 43
Le Google Intelligent : Comment ?
Linked Data = ? = Big Data
Une type particulier de Big Data• DBpedia: Linked Data version of Wikipedia : more than 103 million RDF triples.
• The Bio2RDF project, a Semantic web atlas of post-genomic knowledge about human and mouse, has published 27 biology-, gene- and medical-related data sets : altogether 2.3 billion triples
• data.gov official website of the US government making over 1000 US government datasets available as Linked Data (around 6.4 billion triples).
• GovTrack.us from Joshua Tauberer publishes linked data about members of the U.S. Congress, as well as bills, committees and votes. 12M triples
• PDB2RDF Projekt making the Protein Data Bank available as Linked Data and via a SPARQL endpoint (approximately 14 billion triples).
• RDF Book Mashup: Provides bibliographic information, reviews and sales offers for most books that have a ISBN number. Maps data from Amazon and Google base to RDF. Size of the data set: Unknown, billions of triples
• Etc.
page 44
Linked Data
Linked Open Data• http://validator.lod-cloud.net/
Linked Sciences• Linked Open Piracy (LOP)
- http://semanticweb.cs.vu.nl/poseidon/ns/home
- http://cliopatria.swi-prolog.org/help/source/doc/home/vnc/prolog/src/ClioPatria/web/tutorial/Piracy.txt
Linked Data pour le Big Data
Avantages
• Sémantique unique des entités
• Linked Data
- « A New architectural platform for interconnecting, mapping, indexing, feeding real-time information from a variety of sources »
• Tim Berners Lee
- Web = « Global Giant Graph »– Comme une unique base de données globale
– Requêtes complexes sur plusieurs sources
page 46
Linked Data pour le Big Data
Avantages• Déduction de nouvelles relations
- Qui pourront être utilisées plus tard pour de nouvelles analyses
• Standards
- SPARQL 1.1, OWL, RDF, RDFS, …..
• Passage à l’échelle
page 47
top related