qu’est-ce le web sémantique? ivan herman, w3ccopyright © 2008, w3c c (66) tout ceci produit des...

Post on 06-Oct-2020

0 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Qu’est-ce le Web sémantique?

Ivan Herman, W3C

Copyright © 2008, W3C

C

(2)

Organisons un voyage à Budapest en Organisons un voyage à Budapest en utilisant le Web!utilisant le Web!

Copyright © 2008, W3C

C

(3)

On essaye de trouver un vol approprié On essaye de trouver un vol approprié avec …avec …

Copyright © 2008, W3C

C

(4)

… … une grosse compagnie réputée, ou …une grosse compagnie réputée, ou …

Copyright © 2008, W3C

C

(5)

… … la compagnie du pays de destination, ou …la compagnie du pays de destination, ou …

Copyright © 2008, W3C

C

(6)

… … une compagnie low costune compagnie low cost

Copyright © 2008, W3C

C

(7)

Nous devons aussi trouver un hôtel, donc Nous devons aussi trouver un hôtel, donc on essaye de trouver…on essaye de trouver…

Copyright © 2008, W3C

C

(8)

… … un hôtel très bon marché, ou …un hôtel très bon marché, ou …

Copyright © 2008, W3C

C

(9)

… … un hôtel de luxe, ou …un hôtel de luxe, ou …

Copyright © 2008, W3C

C

(10)

… … un hôtel abordable mais correct …un hôtel abordable mais correct …

Copyright © 2008, W3C

C

(11)

aïe, ce site pose un problème, c’est en aïe, ce site pose un problème, c’est en Hongrois, une langue que presque Hongrois, une langue que presque

personne ne comprend ; mais…personne ne comprend ; mais…

Copyright © 2008, W3C

C

(12)

… … celui-ci devrait allercelui-ci devrait aller

Copyright © 2008, W3C

C

(13)

Naturellement, nous pouvons aussi nous Naturellement, nous pouvons aussi nous fier à un site spécialisé…fier à un site spécialisé…

Copyright © 2008, W3C

C

(14)

… … comme celui-ci, ou…comme celui-ci, ou…

Copyright © 2008, W3C

C

(15)

… … celui-làcelui-là

Copyright © 2008, W3C

C

(16)

Vous voudriez, peut-être, avoir une idée de Vous voudriez, peut-être, avoir une idée de Budapest avant d’y aller ; essayons de Budapest avant d’y aller ; essayons de

trouver des photos…trouver des photos…

Copyright © 2008, W3C

C

(17)

… … sur flickr …sur flickr …

Copyright © 2008, W3C

C

(18)

… … sur Google …sur Google …

Copyright © 2008, W3C

C

(19)

… … vous pouvez aussi regarder mes photos vous pouvez aussi regarder mes photos

Copyright © 2008, W3C

C

(20)

……ou consulter un site (social) de voyagesou consulter un site (social) de voyages

Copyright © 2008, W3C

C

(21)

Qu’avons nous fait ?Qu’avons nous fait ?Nous avons consulté un nombre de sites de styles différents créés pour des utilisations différentes, peut-être même dans des langues différentes…Nous avons dû intégrer toutes ces informations pour arriver à notre butNous savons tous que, dans certains cas, il s’agit là d’un processus long et fatigant !

Copyright © 2008, W3C

C

(22)

En fait, toutes ces pages ne sont que les parties visibles de l’iceberg ! En effet :

les vrais données sont cachées dans des bases de données, des fichiers XML, des pages Excel…nous avons accès uniquement à ce que les concepteurs des sites nous laissent voir

Copyright © 2008, W3C

C

(23)

Les sites spécialisées (Expedia, TripAdvisor) font un peu plus :

ils collectent et combinent des données de sources diverses mais ils continuent a contrôler ce que l’utilisateur peut voir

Dans certains cas, vous voudriez personnaliser : c’est à dire, accéder aux données et les combiner vous-même !

Copyright © 2008, W3C

C

(24)

Voici un exemple…Voici un exemple…

Copyright © 2008, W3C

C

(25)

Des compagnies utilisatrices sont contraintes à embaucher des experts pour manier ce genres de bases de données !

Copyright © 2008, W3C

C

(26)

Un autre exemple : les sites sociaux. J’ai Un autre exemple : les sites sociaux. J’ai une liste « d’amis » sur…une liste « d’amis » sur…

Copyright © 2008, W3C

C

(27)

… … Dopplr, Dopplr,

Copyright © 2008, W3C

C

(28)

… … Twine,Twine,

Copyright © 2008, W3C

C

(29)

… … LinkedIn,LinkedIn,

Copyright © 2008, W3C

C

(30)

… … et, naturellement, Facebooket, naturellement, Facebook

Copyright © 2008, W3C

C

(31)

J’ai dû re-ajouter et re-contacter mes amis pour tous les sites, indépendamment l’un de l’autreCeci est même pire qu’avant : c’est moi qui ajoute à l’iceberg, mais je n’ai pas nécessairement accès à mes propre données…

Copyright © 2008, W3C

C

(32)

Que voudrions-nous avoir ?Que voudrions-nous avoir ?Pouvoir utiliser les données sur le Web comme nous utilisons les documents :

pouvoir créer des liens à des données (indépendamment de leur présentation)pouvoir utiliser les données comme nous le voulons sur nos sites et programmes sur le Web

Copyright © 2008, W3C

C

(33)

En d’autres termes…En d’autres termes…Nous voudrions élargir le Web actuel pour arriver à un « Web des données »

permettre aux applications d’exploiter les données directement

Copyright © 2008, W3C

C

(34)

Une minuteUne minute  ! N’est-ce pas ce que les ! N’est-ce pas ce que les ««  mashupsmashups  » font déjà» font déjà  ??

Copyright © 2008, W3C

C

(35)

Un exemple d’un «Un exemple d’un «  mashupmashup  » :» :

Copyright © 2008, W3C

C

(36)

D’un certain sens oui, et cela montre le potentiel énorme du Web des donnéesMais ces sites sont contraints à faire un travail ad-hoc :

les données ne sont souvent accessibles que par le biais de servicestous ont des APIs, des logiques, des structures différentespour toutes nouvelles données, les sites doivent recommencer à zéro, parce qu’il n’existe aucun moyen standard pour accéder aux données

Copyright © 2008, W3C

C

(37)

En d’autre termes …En d’autre termes …Nous voudrions élargir le Web actuel pour arriver à un « Web des données » par des moyens standards

Copyright © 2008, W3C

C

(38)

Mais qu’est-ce que cela veut direMais qu’est-ce que cela veut dire en  en pratique pratique ? ?

Comment fonctionne le Web actuel ?des document sont créésils reçoivent une adresse (un URI) et ils sont mis à disposition sur le Web

Copyright © 2008, W3C

C

(39)

Un exemple : le site de Steven sur AmsterdamUn exemple : le site de Steven sur Amsterdam(créé pour des amis)(créé pour des amis)

Copyright © 2008, W3C

C

(40)

Puis vient la magie…Puis vient la magie…D’autres découvrent le site et ils s’y « lient » Plus il y a ce genre de liens, plus la page est importante, donc plus la page est connu

c’est l’essentiel du fonctionnement de Google !C’est « l’effet réseau » : certaines pages deviennent importants, sont exploitées par d’autres, souvent d’une manière inattendue même pour l’auteur de l’original

Copyright © 2008, W3C

C

(41)

Ceci n’était pas une surprise…Ceci n’était pas une surprise…

Copyright © 2008, W3C

C

(42)

mais celui-ci, provenant de l’autre bout du mais celui-ci, provenant de l’autre bout du Globe, en était une…Globe, en était une…

Copyright © 2008, W3C

C

(43)

Que veut dire tout cela pour le Web des Que veut dire tout cela pour le Web des données?données?

Nous devrions être capable de« publier » les données sur le Web par des moyens standards

en analogie avec les documents : donnons des URI aux données

créer des liens aux URI-s à partir d’autres données (documents ou autres)

une solution générique et standard devrait être utilisée les applications ne devraient pas être forcées de développer

des approches différentes pour toutes sources de donnéeset laissons l’effet réseau agir …

Copyright © 2008, W3C

C

(44)

Exemple : combiner des donnéesExemple : combiner des donnéesUne compagnie pharmaceutique a une quantité importante de données sur son intranet

dans des formats différents (XML, BdD,…)

Courtesy of Nigel Wilkinson, Lee Harland, Pfizer Ltd, Melliyal Annamalai, Oracle (SWEO Case Study)

Pour les réutiliser :les informations essentielles sont mises sur le Web par des moyens standardsun outil public est utilisé pour l’intégration, la visualisation, la recherche

Copyright © 2008, W3C

C

(45)

En pratique, c’est un peu plus compliquéEn pratique, c’est un peu plus compliquéSur le Web traditionnel l’humain est implicitement pris en compte :

un lien a aussi un « contexte » qu’une personne peut reconnaître et utiliser

Copyright © 2008, W3C

C

(46)

Par exemple, l’adresse sur ma pagePar exemple, l’adresse sur ma page

Copyright © 2008, W3C

C

(47)

… … mène a la page suivante :mène a la page suivante :

Copyright © 2008, W3C

C

(48)

L’humain comprend que ceci est la page d’accueil de mon institutionIl saura, plus ou moins, que cela signifie un institut de recherche à AmsterdamSur le Web des données il y a donc quelque chose qui manque : en soi, la machine ne comprend pas la signification du lien

Copyright © 2008, W3C

C

(49)

Une nouvelle contrainte :un élément d’information doit être ajoutée au lien : « ceci est un lien vers mon institution, un institut de recherche »cette information doit être accessible par la machine

Ceci est, en fait, une classification (caractérisation) aussi bien du lien que de la page qui est liée

en certain cas, cette classification peut permettre un forme limitée de raisonnement

Copyright © 2008, W3C

C

(50)

Mettons tout ensemble !Mettons tout ensemble !Pour un Web des données, nous avons besoin :

de l’utilisation des URI-s pour publier nos donnéesde permettre de créer des liens à partir des données vers d’autres donnéesde caractériser/classifier les données et les liens pour transmettre un peu plus d’informationd’utiliser des moyens standards pour tout cela !

Copyright © 2008, W3C

C

(51)

Exemple : trouver les experts chez NASAExemple : trouver les experts chez NASA

Il y a presque 70,000 fonctionnaires chez la NASA, répartis sur tous les États UnisLeur expertise est décrite dans 6-7 bases de données différentes, réparties sur tout le territoire des USA, avec des schémas, des structures, etc. tous différents …Problème : trouver les experts requis pour une tâche spécifique au sein de la NASA!

Michael Grove, Clark & Parsia, LLC, and Andrew Schain, NASA, (SWEO Case Study)

Copyright © 2008, W3C

C

(52)

Exemple : trouver les experts chez NASAExemple : trouver les experts chez NASAL’approche choisie : intégration standard des données, description des données et des liens avec des vocabulaires génériques

Michael Grove, Clark & Parsia, LLC, and Andrew Schain, NASA, (SWEO Case Study)

Copyright © 2008, W3C

C

(53)

Mais qu’est ce que c’est le Web Mais qu’est ce que c’est le Web sémantique ?sémantique ?

Copyright © 2008, W3C

C

(54)

Un ensemble de technologies standards Un ensemble de technologies standards pour réaliser le Web des donnéespour réaliser le Web des données

Copyright © 2008, W3C

C

(55)

C’est aussi simple que cela…Naturellement, les détails peuvent être compliqués

un modèle commun doit être défini pour une structure des liens et pour les classifications pour un domaine spécifique, la classifications des termes peut être très compliquée : c’est là où les ontologies, les vocabulaires, etc, entrent en jeu

Copyright © 2008, W3C

C

(56)

ExempleExemple : eTourism à Zaragoza: eTourism à Zaragoza

Service d’itinéraire personnaliséIntégration de bases de données à Zaragoza (utilisant des ontologies)Utilisation d’un moteur de raisonnement

Courtesy of Jesús Fernández, Municipality of Zaragoza, and Antonio Campos, CTIC (SWEO Use Case)

Copyright © 2008, W3C

C

(57)

Une minuteUne minute ! Dois-je convertir toute mes ! Dois-je convertir toute mes données pour pouvoir fonctionner sur un données pour pouvoir fonctionner sur un

Web des donnéesWeb des données ??

Copyright © 2008, W3C

C

(58)

Pas nécessairement ; ça ne serait pas toujours possibleIl y a des technologies pour accéder aux données par des moyens standards sans les convertir

des « ponts » (par exemple, ré-écriture des requêtes)annotations des données existantes (par exemple, des pages XHTML)

Ces techniques sont encore en développement

Copyright © 2008, W3C

C

(59)

ExempleExemple : intégration des connaissances de : intégration des connaissances de la médecine chinoise traditionnelle la médecine chinoise traditionnelle

Intégration de plus de 80 bases de donnéesUtilisation d’ontologies spécifiquesGénération des interrogation en SQL « on the fly »

Courtesy of Huajun Chen, Zhejiang University, (SWEO Case Study)

Copyright © 2008, W3C

C

(60)

Groupe d’intérêt de W3C pour la santé et les Groupe d’intérêt de W3C pour la santé et les sciences du vivantsciences du vivant

La communauté « HCLS » se trouve en face de problèmes majeurs d’intégration

recherche pharmaceutique, données médicales des patients, processus pour approuver de nouveaux médicaments,…

La communauté avait besoin d’un lieu neutre pour discuter des problèmes techniquesd’un contact plus direct avec la communauté du Web sémantique

W3C avait besoindes contacts avec une communauté d’utilisateurs majeurede pouvoir ajuster les choix techniques au besoins pratiques, de bénéficier des expériences

Copyright © 2008, W3C

C

(61)

Groupe HCLSGroupe HCLSDéveloppe des « expérimentations », des démonstrations pour prouver la fiabilité de la technologie

le groupe est divisé en « task forces » pour se concentrer sur des problèmes différents

Publie des notes, des articles, etc, sur le sujetDéveloppe des stratégies de communication vers l’industrie (réunions, conférences, rencontres industrielles)Offre un forum de discussion pour les experts

Copyright © 2008, W3C

C

(62)

Démonstration HCLS : cibles pour la maladie Démonstration HCLS : cibles pour la maladie d’Alzheimerd’Alzheimer

Signal transduction pathways are considered to be rich in proteins that might respond to chemical therapy

CA1 Pyramidal Neurons are known to be particularly damaged in Alzheimer’s disease

Can we find candidate genes known to be involved in signal transduction and active in Pyramidal Neurons?

Copyright © 2008, W3C

C

(63)

Pour la réponse : intégration de donnéesPour la réponse : intégration de donnéesW3C HCLS IG a intégré un nombre de bases de données et d’ontologies publiques

assigner un URI aux entités biologiquesconversion ou accès aux données avec des techniques du Web sémantique (400M de relations en mai 2007)utilisation d’un moteur d’inférence pour trouver des nouvelles relationsutilisation d’un langage d’interrogation pour répondre aux questions spécifiques

Copyright © 2008, W3C

C

(64)

Les bases de donnéesLes bases de données

Copyright © 2008, W3C

C

(65)

Utilisation du langage d’interrogation…Utilisation du langage d’interrogation…

prefix go: <http://purl.org/obo/owl/GO#>prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#>prefix owl: <http://www.w3.org/2002/07/owl#>prefix mesh: <http://purl.org/commons/record/mesh/>prefix sc: <http://purl.org/science/owl/sciencecommons/>prefix ro: <http://www.obofoundry.org/ro/ro.owl#>

select ?genename ?processnamewhere{ graph <http://purl.org/commons/hcls/pubmesh> { ?paper ?p mesh:D017966 . ?article sc:identified_by_pmid ?paper. ?gene sc:describes_gene_or_gene_product_mentioned_by ?article. } graph <http://purl.org/commons/hcls/goa> { ?protein rdfs:subClassOf ?res. ?res owl:onProperty ro:has_function. ?res owl:someValuesFrom ?res2. ?res2 owl:onProperty ro:realized_as. ?res2 owl:someValuesFrom ?process. graph <http://purl.org/commons/hcls/20070416/classrelations> {{?process <http://purl.org/obo/owl/obo#part_of> go:GO_0007166} union {?process rdfs:subClassOf go:GO_0007166 }} ?protein rdfs:subClassOf ?parent. ?parent owl:equivalentClass ?res3. ?res3 owl:hasValue ?gene. } graph <http://purl.org/commons/hcls/gene> { ?gene rdfs:label ?genename } graph <http://purl.org/commons/hcls/20070416> { ?process rdfs:label ?processname}}

Mesh: Pyramidal Neurons

Pubmed: Journal Articles

Entrez Gene: Genes

GO: Signal Transduction

Courtesy of Susie Stephens, Eli Lilly, Alan Ruttenberg, Science Commons, and the W3C HCLS IG

Copyright © 2008, W3C

C

(66)

Tout ceci produit des réponses…Tout ceci produit des réponses…

DRD1, 1812 adenylate cyclase activationADRB2, 154 adenylate cyclase activationADRB2, 154 arrestin mediated desensitization of G-protein coupled receptor protein signaling pathwayDRD1IP, 50632 dopamine receptor signaling pathwayDRD1, 1812 dopamine receptor, adenylate cyclase activating pathwayDRD2, 1813 dopamine receptor, adenylate cyclase inhibiting pathwayGRM7, 2917 G-protein coupled receptor protein signaling pathwayGNG3, 2785 G-protein coupled receptor protein signaling pathwayGNG12, 55970 G-protein coupled receptor protein signaling pathwayDRD2, 1813 G-protein coupled receptor protein signaling pathwayADRB2, 154 G-protein coupled receptor protein signaling pathwayCALM3, 808 G-protein coupled receptor protein signaling pathwayHTR2A, 3356 G-protein coupled receptor protein signaling pathwayDRD1, 1812 G-protein signaling, coupled to cyclic nucleotide second messengerSSTR5, 6755 G-protein signaling, coupled to cyclic nucleotide second messengerMTNR1A, 4543 G-protein signaling, coupled to cyclic nucleotide second messengerCNR2, 1269 G-protein signaling, coupled to cyclic nucleotide second messengerHTR6, 3362 G-protein signaling, coupled to cyclic nucleotide second messengerGRIK2, 2898 glutamate signaling pathwayGRIN1, 2902 glutamate signaling pathwayGRIN2A, 2903 glutamate signaling pathwayGRIN2B, 2904 glutamate signaling pathwayADAM10, 102 integrin-mediated signaling pathwayGRM7, 2917 negative regulation of adenylate cyclase activityLRP1, 4035 negative regulation of Wnt receptor signaling pathwayADAM10, 102 Notch receptor processingASCL1, 429 Notch signaling pathwayHTR2A, 3356 serotonin receptor signaling pathwayADRB2, 154 transmembrane receptor protein tyrosine kinase activation (dimerization)PTPRG, 5793 transmembrane receptor protein tyrosine kinase signaling pathwayEPHA4, 2043 transmembrane receptor protein tyrosine kinase signaling pathwayNRTN, 4902 transmembrane receptor protein tyrosine kinase signaling pathwayCTNND1, 1500 Wnt receptor signaling pathway

Many of the genes are indeed related to Alzheimer’s Disease through gamma secretase (presenilin) activity

Courtesy of Susie Stephens, Eli Lilly, Alan Ruttenberg, Science Commons, and the W3C HCLS IG

Copyright © 2008, W3C

C

(67)

L’essentiel…L’essentiel…L’essentiel de la démonstration était l’accès et l’intégration des données publiques par le biais du Web sémantique

top related