bases de données spatiales

Download Bases de données spatiales

Post on 12-Apr-2017

396 views

Category:

Engineering

1 download

Embed Size (px)

TRANSCRIPT

  • Problme des donnes spatialesIndex spatialBibliographie

    Rfrences

    Bases de donnes spatialesIntrt et problmes dindexation

    Guillaume Matheronguillaume.matheron@ens.fr

    2015

    1 / 19

  • Problme des donnes spatialesIndex spatialBibliographie

    Rfrences

    I - Problme des donnes spatialesII - Index spatialIII - Efforts de standardisationIV - Exprimentation avec MySQLV - Ouverture - Bibliographie

    2 / 19

  • Problme des donnes spatialesIndex spatialBibliographie

    Rfrences

    Indexation

    Facile indexer :

    EntiersTexteDate

    Type de requtes vises :

    Recherche dun lmentnumration dun intervalleSimilarit / proximit

    3 / 19

  • Problme des donnes spatialesIndex spatialBibliographie

    Rfrences

    Requtes difficiles/spcifiques : filtrage

    lments dont lid est premierlments dont le nom comporte exactement 3 voyelles

    Difficile indexer :

    Images, sons (requtes de similarit - Shazam, reverse imagesearch)Fichiers binaires (requtes de similarit - Par exemplesynchronisation de fichiers dpacs et modifis)Gomtrie

    4 / 19

  • Problme des donnes spatialesIndex spatialBibliographie

    Rfrences

    Problme des donnes spatiales

    Donnes spatiales :

    Gographiques (cartes, localisation, ...)Tridimensionnelles (scan 3d, imagerie mdicale, ...)

    5 / 19

  • Problme des donnes spatialesIndex spatialBibliographie

    Rfrences

    Problme : trouver rapidement une donne partir de sa positionapproche mtrique

    Applications : trouver les clusters, les points proches, le voisinagepour des transformations locales dobjets 3D, ...

    Un index ne suffit pas ! Problme de base de la rastrisation

    Exemple : masque de convolution [4]6 / 19

  • Problme des donnes spatialesIndex spatialBibliographie

    Rfrences

    Index spatial

    En 1D : arbre binaire

    En 2D : arbre quad (quadtree)

    En 3D : arbre 8-aire (octree)

    Problme : en 1D, on aime bien faire des arbres n-aires (pourremplir un bloc) !

    7 / 19

  • Problme des donnes spatialesIndex spatialBibliographie

    Rfrences

    Arbre R [2]

    8 / 19

  • Problme des donnes spatialesIndex spatialBibliographie

    Rfrences

    Arbre R

    quilibrage complexe (heuristiques pour les dpassements)Faible remplissage minimal (environ 30% contre 50% pour lesarbres B)

    Arbre R* minimation du recouvrement (overlap) [1]

    9 / 19

  • Problme des donnes spatialesIndex spatialBibliographie

    Rfrences

    Autres index spatiaux - Z-curve

    Interlacement des bits decoordonnesGnralisable en ndimensionsConversion facile en arbreR quilibr

    10 / 19

  • Problme des donnes spatialesIndex spatialBibliographie

    Rfrences

    Arbre R de Hilbert [3]

    Courbe de Hilbert

    Donne un ordre total surRn

    11 / 19

  • Problme des donnes spatialesIndex spatialBibliographie

    Rfrences

    Arbre R de Hilbert

    Les sous-rectangles sont tris par abscisse de Hilbert du centrede leur MBR (=minimal bounding rectangle)Remplissage aussi important que souhait

    12 / 19

  • Problme des donnes spatialesIndex spatialBibliographie

    Rfrences

    Efforts de standardisation

    Open Geospatial Consortium, 94

    Simple Features standard, 04

    Dfinit les formats standard dchange de donnes spatialessimples (points, polygones, ...)

    13 / 19

  • Problme des donnes spatialesIndex spatialBibliographie

    Rfrences

    Exprimentation avec MySQLGnration dun grand nombre de donnes alatoires (106enregistrements crs en 5 minutes)

    CREATE PROCEDURE InsertRand(IN NumRows INT, IN MinVal INT, IN MaxVal INT)

    BEGINDECLARE i INT;SET i = 1;START TRANSACTION;WHILE i

  • Problme des donnes spatialesIndex spatialBibliographie

    Rfrences

    SELECT SQL_NO_CACHE AsText(location)FROM test IGNORE INDEX(loc)WHERE MBRContains(

    GeomFromText(LINESTRING(0.39 0.39,0.4 0.4)),location)

    119 total, Query took 0.4115 seconds

    15 / 19

  • Problme des donnes spatialesIndex spatialBibliographie

    Rfrences

    Exprimentation avec MySQL

    SELECT SQL_NO_CACHE AsText(location)FROM testWHERE MBRContains(

    GeomFromText(LINESTRING(0.39 0.39,0.4 0.4)),location)

    119 total, Query took 0.0012 seconds (300 fois moins !)

    16 / 19

  • Problme des donnes spatialesIndex spatialBibliographie

    Rfrences

    mysql> EXPLAIN (...IGNORE INDEX(loc)...)+----+-------------+-------+------+---------------+---------+| id | select_type | table | type | possible_keys | rows |+----+-------------+-------+------+---------------+---------+| 1 | SIMPLE | test | ALL | NULL | 1100008 |+----+-------------+-------+------+---------------+---------+1 row in set (0.01 sec)

    mysql> EXPLAIN (...)+----+-------------+-------+--------+---------------+---------+| id | select_type | table | type | possible_keys | rows |+----+-------------+-------+--------+---------------+---------+| 1 | SIMPLE | test | range | loc | 225 |+----+-------------+-------+--------+---------------+---------+1 row in set (0.01 sec)

    17 / 19

  • Problme des donnes spatialesIndex spatialBibliographie

    Rfrences

    Conclusion/ouverture

    Espaces de grande dimension reconnaissance dimages/desons, clusteringReprsentation de donnes liniques base de donnesoriente graphes

    18 / 19

  • Problme des donnes spatialesIndex spatialBibliographie

    Rfrences

    Bibliographie

    [1] H. P. ; Schneider R. ; Seeger B. Beckmann, N. ; Kriegel. Ther*-tree : an efficient and robust access method for points andrectangles.

    [2] A. Guttman. R-trees : A dynamic index structure for spatialsearching.

    [3] I. Kamel and C. Faloutsos. Hilbert r-tree : An improved r-treeusing fractals.

    [4] George Politis. Scan line rendering of convolutions.

    19 / 19

    Problme des donnes spatialesIndex spatialBibliographie

Recommended

View more >