représentation et indexation d’objets mobiles dans un entrepôt de données
Post on 10-Jan-2016
35 Views
Preview:
DESCRIPTION
TRANSCRIPT
Représentation et Représentation et indexation d’objets indexation d’objets mobiles dans un mobiles dans un entrepôt de donnéesentrepôt de données Tao Wan, Karine Zeitouni
EDA 2006
Université de Versailles
EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données
2
Contexte
Objet Mobile (OM) Objet dont la localisation change continuellement dans le temps
Objet Mobile Contraint par le réseau (OMC) Objet se déplaçant dans un espace restreint (ex : couloirs, réseau) Ex: voiture, train, avion…
Recherche active en gestion de bases d'objets mobiles
Problème posé ici : Exploitation d’historiques d’objets mobiles dans un but décisionnel
EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données
3
Sommaire
Exemples et motivation
Conception et représentation de l’entrepôt
Implémentation optimisée des requêtes OLAP
Résultats d’expérimentation
Conclusion & Perspectives
EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données
4
Exemples et motivation Application réelle: étude sur l’exposition de la population
aux facteurs de risques
Requêtes typiques : “Combien de personnes sont exposées au cours du temps au champ
de pollution ?”
“Combien de personnes par catégorie d'âge sont exposées au cour du
temps au champ de pollution ?”
SELECT p.loc, p.temps, COUNT(DISTINCT m.id_personne) AS nb_personnesFROM mobilité m, pollution pWHERE m.trajectoire INTERSECT (p.loc, p.temps)GROUP BY p.loc, p.temps
SELECT p.loc, p.temps, COUNT(DISTINCT m.id_personne) AS nb_personnesFROM mobilité m, pollution pWHERE m.trajectoire INTERSECT (p.loc, p.temps)GROUP BY m.âge, p.loc, p.temps
Ces requêtes sont des agrégats multidimensionnels – type OLAP
EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données
5
Sommaire
Exemples et motivation
Conception et représentation de l’entrepôt
Implémentation optimisée des requêtes OLAP
Résultats d’expérimentation
Conclusion & Perspectives
EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données
6
Spécificités de la modélisation multidimensionnelle d’objets mobiles Spécificités
Trajectoires d’objets mobiles forment une variation
continue dans le temps et l’espace Or, les modèles multidimensionnels conventionnels sont basés sur
des faits discrets ou discrétisés
Les critères de regroupement ne sont pas forcément connus
à l’avance et implique une recherche spatio-temporelle.
Il faut intégrer les dimensions discrètes comme les attributs
de l’objet mobiles
EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données
7
Travaux liés Entrepôts de données spatiales ou spatiotemporelles
Entrepôts de données spatiales : [Stefanovic & Han 2000] Entrepôts de données spatiotemporelles : [Bédard & Marchand 2004]
Entrepôts d’objets mobiles aRB-tree, double comptage : [Papadias et al. 2002] Estimation probabiliste : [Tao et al. 2004]
Problèmes: Objets mobiles agrégés à l’origine; ne permet pas de représenter d’autres dimensions que l’espace et le temps; résultats basés sur des statistiques approximatives
Intégrer les propriétés d’OMs dans l’analyse : [Wan & Zeitouni 2005]
Problèmes:
Se basant sur des découpages de référence pour l’espace et le temps
=> Limite aux agrégations spatiotemporelles à cheval
Aucune véritable approche existe pour l’analyse en ligne d’objets mobiles !
EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données
8
Dimension continue Est une dimension variant dans un domaine continu sans limite
de granularité
Fait continu Comprend une mesure résultat d’une fonction continue qui
dépend d’une ou de plusieurs dimensions continues
Fait mobile Est un fait continu dépendant de l’objet OMC et défini par une
fonction FOMC(t) = s continue du temps dans l’espace
Modèle logique
EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données
9
Préliminaires - Modèle d’objets mobiles contraints par le réseau
Réseau routier Composé de : tronçon et nœuds
OMC (Objet Mobile Contraint par le réseau) OMC(id_obj, attributs, #trajectoires) Hypothèse : vitesse constante par tronçon Trajectoire T :
Représentée par une séquence de tronçons ri, traversés dans un sens donné pendant un intervalle de temps donné [ti ti+1].
r1r2
r3
r4r5
r7r9r10
r12r13 r14
r15
r16
EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données
10
Modèle multidimensionnel logique Réduction de dimensionnalité
[Pfoser 03] Avantages
simplification de la représentation de l’espace optimisation de l’espace de stockage optimisation des temps de réponses aux requêtes
TR
Tt2 t3 tend
TT’
p1
pend
t1
p2
p3Tr1
Tr2
Tr3
Temps
MO_ID
Jack
Tao
Fred
TR
Trid1
Trid2
Trid3
Marie
Trid4
0.2 1.1 2.2 3.0 4.8
1.1 2.0 3.1 3.5
Modèle multidimensionnel logique
FOMC(t) = s
r2
r1
r3
EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données
11
Sommaire
Exemples et motivation
Conception et représentation de l’entrepôt
Implémentation optimisée des requêtes OLAP
Résultats d’expérimentation
Conclusion & Perspectives
EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données
12
Index proposé – TTR-tree (Transformed Trajectories R-tree)
0101
1101
R1 R2 R3 R4
TR
TempsTrid1
QS
R1
Trid2
Trid3
Trid4 R2
R3
1001
Marie Fred Tao Jack
Avantages Recherche similaire au R-tree, plus efficace
Si QS contient x, on retourne directement le bitmap pointé par x
Bitmap évite le double comptage Permet la combinaison avec les attributs de l’objet
EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données
13
Optimisations
Problèmes : Coût de stockage pour les index bitmap Coût de la réduction de dimensionnalité
Transformation du réseau Transformation de requêtes spatiales
Solutions : Appliquer une technique de bitmap compressé sur les index
bitmap : WAH: Word-Aligned Hybrid Code Zhang et al. (2004) Appliquer l’ordre des tronçons dans un index spatial pour
numéroter par proximité ces tronçons et les intervalles de l’axe TR correspondant.
EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données
14
Sommaire
Exemples et motivation
Conception et représentation de l’entrepôt
Implémentation optimisée des requêtes OLAP
Résultats d’expérimentation
Conclusion & Perspectives
EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données
15
Résultats d’expérimentation (1) Méthodes comparées
Indexation Pfoser [Pfoser & Jensen 2003] 3DR-tree
Configuration d’expérimentation Réseaux routier: Oldenburg 7035 tronçons, San Joaquin 24123 tronçons Données d’entrée : générées par le générateur Brinkhoff Jeux de données
Jeux de données
Réseausous-jacent
Nombre d’objets
Taille des données
nombre de tronçons traversés
(=segments indexés)
DS1 Oldenburg 10 000 24.1 Mo 407 419
DS2 Oldenburg 20 000 49.4 Mo 829 103
DS3 San Joaquin 10 000 57.4 Mo 804 660
DS4 San Joaquin 20 000 114.1 Mo 1 640 815
EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données
16
Coût de stockage
Requêtes d’agrégation Facteur « espace » qs : 0.5 %, 2 %, 8 %, 16 % et 32% Facteur « temps » qt : 1 %, 5 %, 10 %, 30 % et 50 %
Résultats d’expérimentation (2)
Jeux de données Pfoser 3DR-tree TTR-tree TTR-treeavec compression de bitmaps
DS1 8 925 K 34 753 K 9 025 K 8 790 K
DS2 18 020 K 71 351 K 18 884 K 17 899 K
DS3 18 251 K 67 616 K 18 221 K 17 771 K
DS4 36 849 K 138 601 K 38 399 K 36 397 K
EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données
17
Résultats d’expérimentation (4)
DS2 qt=10%
0
10000
20000
30000
40000
50000
60000
0.5% 2% 8% 16% 32%qs
E/S
Index P foser
3D R-tree
TTR-tree
DS1 qt=10%
0
5000
10000
15000
20000
25000
30000
35000
0.5% 2% 8% 16% 32%qs
E/S
Index P foser
3D R-tree
TTR-tree
DS3 qt=10%
0
1000
2000
3000
4000
5000
6000
0.5% 2% 8% 16% 32%qs
E/S
Index P foser
3D R-tree
TTR-tree
DS4 qt=10%
0
2000
4000
6000
8000
10000
12000
0.5% 2% 8% 16% 32%qs
E/S
Index P foser
3D R-tree
TTR-tree
Coût en faisant varier l’extension de la requête selon l’espace
EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données
18
Résultats d’expérimentation (5)
DS1 qs=16%
0
10000
20000
30000
40000
50000
60000
70000
80000
1% 5% 10% 30% 50%qt
E/S
Index P foser
3D R-tree
TTR-tree
DS2 qs=16%
0
20000
40000
60000
80000
100000
120000
140000
160000
1% 5% 10% 30% 50%qt
E/S
Index P foser
3D R-tree
TTR-tree
DS3 qs=16%
0
1000
2000
3000
4000
5000
6000
7000
1% 5% 10% 30% 50%qt
E/S
Index P foser
3D R-tree
TTR-tree
DS4 qs=16%
0
2000
4000
6000
8000
10000
12000
1% 5% 10% 30% 50%qt
E/S
Index P foser
3D R-tree
TTR-tree
Coût en faisant varier l’extension de la requête selon le temps
EDA 2006, 19 Juin Représentation et indexation d’objets mobiles dans un entrepôt de données
19
Contributions et perspectives
Contributions Modèle multidimensionnel pour objets mobiles contraints par le
réseau Implémentation optimisée pour des requêtes OLAP Prototype développé et bons résultats expérimentaux
Travaux futurs Test de la combinaison avec des dimensions discrètes Extension aux agrégats complexes (spatiotemporels) Extension aux mesures continues (capteurs embarqués) Extension à d’autres types de « faits continus »
top related