1 découverte de correspondances entre ontologies distribuées f.-e. calvier le 03/07/07

Post on 04-Apr-2015

111 Views

Category:

Documents

5 Downloads

Preview:

Click to see full reader

TRANSCRIPT

1

Découverte de correspondances entre ontologies distribuées

F.-E. Calvierle 03/07/07

2

Plan

1. Contexte de travail

2. Découverte de mappings : environnement centralisé vs. distribué

3. Exploitation du raisonnement• Découverte de raccourcis de mappings

• Identification d’éléments pertinents à mettre en correspondance

4. Conclusions et perspectives

3

1. Contexte de travail

• Les ontologies et les mappings sont représentés en RDF(S) et les données en RDF

• Les mêmes constructeurs sont utilisés pour représenter les ontologies et les mappings

• Ontologies :– Vocabulaire d’un pair = {noms de classes du pair} {noms de propriétés du pair}

• Mappings :– Inclusions entre classes ou propriétés de 2 pairs différents

– Typage d’une propriété d’un pair donné par une classe d’un autre pair

D

O M

4

Opérateurs RDF(S)

Inclusion de classes : X, C1(X) C2(X)

Inclusion de propriétés : X Y, P1(X,Y) P2(X,Y)

X, Painter(X) Artist(X) X Y, Paints(X, Y) Creates(X,Y)

5

Opérateurs RDF(S)

Typage de domaine et de co-domaine d'une propriété X Y , P1(X,Y) C1(X) X Y , P1(X,Y) C2(Y)

Langage restreint : coreRDFS

X Y , Paints(X,Y) Painter(X) X Y , Paints(X,Y) Painting(Y)

6

Mappings SomeRDF(S)

Des expressions construites à partir du vocabulaire de pairs différents qui établissent ainsi des correspondances sémantiques entre eux.

Notation : P : R, relation R de l’ontologie d’un pair P

Inclusion de classes : X, P1:C1(X) P

2:C2(X)

Inclusion de propriétés :

X Y , P1:P1(X,Y) P

2:P2(X,Y)

Typage de domaine et de co-domaine d'une propriété

X Y , P1:P1(X,Y) P

2:C1(X)

X Y , P1:P1(X,Y) P

2:C2(Y)

7

Q1(X) ≡ P1:Artifact(X)

R1(X) ≡ P1:Artifact(X)

R2(X) ≡ P1:Painting(X)

R3(X) ≡ Y, P1:Belongsto(X, Y )

R4(X) ≡ P2:Sculpture(X)

R5(X) ≡ Y, P1:Creates(Y,X)

R6(X) ≡ Y, P1:Paints(Y,X)

R7(X) ≡ Y, P2:Sculpts(Y,X)

Q1(X) ≡ P1:Artifact(X)

R1(X) ≡ Ø

R2(X) ≡ {la_joconde}

R3(X) ≡ Ø

R4(X) ≡ {statue_de_david}

R5(X) ≡ {les_demoiselles_d_avignon}

R6(X) ≡ Ø

R7(X) ≡ {le_penseur}

Exemple

Artifact

Painting

GlassSculptor Movement

Sculptor

Artist

SteelSculptor

Painter

WoodSculptor

Q1(X)

P2

Refersto

Belongsto

Sculpts

Creates

Paints

P1

Sculpture

8

2. Découverte de mappings : environnement centralisé vs. distribué

Spécificités du contexte distribué par rapport au contexte centralisé :

• Nombre de comparaisons

• Des connaissances locales

• Richesse du raisonnement

9

Nombre de comparaisons

Contexte distribué :– Multitude de pairs

– Nombre variable de pairs

Nombre important et variable de comparaisons

Contexte centralisé :– Nombre établi d’ontologies

Nombre limité de comparaisons

O O O

10

Nombre de comparaisons

Contexte centralisé :– Découverte de mappings

produit cartésien des éléments des ontologies

O O

A1 B1 … Z1

A2 1 0.5 … 0.8

B2 0.1 0.7 … 0

C2 0.4 0.2 … 0.6

… … … … …

Z2 0.7 0.5 … 0.3

?

O

11

Contexte distribué :

• Accès aux pairs voisins uniquement via les mappings

Aucune vision sur les autres relations des pairs voisins

• Communication entre certains pairs impossible

Des limitations fortes sur les mappings pouvant être découverts

Un processus à l’initiative d’un pair donné

Des connaissances locales

P1

D1 N1

H1

F1

D2 N2

H2P2

F2P1 P2

12

Richesse du raisonnement

Contexte distribué :

– Les réponses aux requêtes : indicateurs utiles à la découverte

de mappings

D1 N1

H1P1

F1

D2 N2

H2P2

F2

D2 N2D2 N2

P2P1

13

3. Exploitation du raisonnement

Exploitation des réponses aux requêtes

• Découverte de raccourcis de mappings

• Identification d’éléments pertinents à mettre en correspondance

14

3.1 Découverte de raccourcis de mappings

• Liens indirects remplacés par de liens directs

• Renforce le réseau– Intéressant en cas de

disparition de pairs

• Un processus automatisable

Pb : l’ajout ne doit pas être systématique

Processus de filtrage nécessaire

15

3.1 Découverte de raccourcis de mappings

Un processus en 2 temps :

• Exploiter les résultats des requêtes posées dans SomeRDFS

• Appliquer des techniques de sélection des raccourcis pertinents à représenter

16

B?{A}

{W, T, K, A, Z, G, …}{W, T, A1, M, A2, Z, …}

G

K

Scénario de découverte de raccourcis de mappings

R T

B

D

W

V

N

HP

F

B

A?

AA2

A1

Z M

P1

{A1, A2}

17

3.1 Découverte de raccourcis de mappings

Un processus en 2 temps :• Exploiter les résultats des requêtes posées dans SomeRDFS

– Dissociation des étapes de réécriture et d’évaluation

– L’utilisateur sélectionne les réécritures pour lesquelles il demande l’évaluation

• Appliquer des techniques de sélection des raccourcis pertinents à représenter

– Analyse de la trace des interactions entre les utilisateurs et les pairs

– Raccourcis de mapping ajoutés = liens directs avec les classes intéressantes pour les utilisateurs

• Apparues dans les réécritures

• Les utilisateurs ont, à plusieurs reprises, demandé leur évaluation

– Nombre de fois que l’évaluation de la classe distante est demandée détermine l’ajout de raccourcis de mappings seuil à fixer

18

3.2 Identification d’éléments pertinents à mettre en correspondance

Reformulation du problème :

A partir de quelles relations rechercher des

correspondances ? = relations cibles

exploitation du raisonnement

Parmi quelles relations distantes rechercher des

correspondances ? = contexte de mapping (CM)

19

Identification de relations cibles

A partir de quelles relations ?

Identifiables à partir des requêtes dont les réécritures sont toutes locales

Les relations pour lesquelles il n’existe pas de spécialisation au sein des réécritures

20

Parmi quelles relations rechercher des mappings?

Idée : recherche de mise en correspondance des classes qui ont des points communs

généralisant ou spécialisant

Pour chaque classe cible, déterminer un ensemble de classes entre lesquelles il serait pertinent de rechercher des mises en correspondance (CM)

CCIBLE = C1

Si ! Cg | CCIBLE Cg et Q(X) ≡ Cg(X)

Alors CM = {C | R réécriture de Q(X), C R}

CCIBLE = C2

Si G = {Cg | CCIBLE Cg} avec G = G1G2 |

G1 = {Cg PCIBLE}

et G2 = {Cg PCIBLE} Alors CM = G

21

• Scénarios combinables

• Permet de définir un ensemble CM sur lequel utiliser des techniques d’alignement

• CM permet aussi de trouver des mappings entre relations de pairs distants

Que faire de ces mappings particuliers ?

22

Conclusion et perspectives

• Des méthodes exploitant le raisonnement dans SomeRDFS– Orientant la découverte de mappings– Nécessitant d’autres outils :

• Analyse de la trace des interactions (outils statistiques)• Méthodes d’alignement particulières prenant en compte la

dissymétrie structurelle (Taxomap)

• D’autres méthodes possibles basées sur l’évolution des connaissances d’un pair

• Etude des requêtes sous forme de conjonctions de relations• Implémentation des méthodes proposées

top related