caractérisation de parcellaires par méthode de fouille de ...€¦ · – hypothèse : ensemble...
TRANSCRIPT
Caractérisation de parcellaires par
méthode de fouille de données
Thomas Guyet
AGROCAMPUS-OUEST
IRISA – Équipe DREAM
21 juin 2010, Saint-Jacut
11/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Illustration du problème de la caractérisation et la simulation de paysages : GenExp
F. Le Ber, C. Lavigne, K. Adamczyk, F. Angevin, N. Colbach, J.-F. Mari and H. Monod, “Neutral modelling of agricultural landscapes by tessellation methods – Application for gene flow simulation”, Journal of Ecological Modelling, 2009
12/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Bases de parcellaires
● Caractériser un paysage par des règles de composition– Règle de composition = une « règle » d'organisation locale
entre éléments constitutifs d'un paysage– Hypothèse : Ensemble d'éléments + règles caractéristiques
d'un paysage● Simuler des paysages
– Combiner des motifs spatiaux satisfaisant au mieux les règles d'organisation
Caractériser et simuler des paysages à partir de règles de composition locales
Karine Zeitouni, HDR, Université de Versaille Saint-Quentin en Yvelines "Analyse et extraction de connaissances des bases de données spatiotemporelles".
Caractérisationpar des
règles locales
Bases de règles de
composition
Générationde paysages
13/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Generative landscape grammar (K. Mayall)
● Un paysage peut être vu comme une collection grammaticalement ordonnée d'objets physiques
● Generative landscape grammar– Vocabulaire : catégories d'objets physiques qui peuvent être
rencontrés dans le paysage● ex. building, trees, road,
– Règles grammaticales : relations (spatiales) entre catégories d'objets qui régissent la structure du paysage
● ex. si la pente d'un champ est supérieure à 0.2, alors il ne peut être exploité
● La grammaire d'un paysage le caractérise● Grammaire générative : permet de regénérer des
paysagesK. Mayall, G. Hall, Landscape grammar 1: spatial grammar theory and landscape planning, Environment and planning B: Planning and Design, vol. 32, p. 895-920, 2005
14/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Règles spatiales de l'organisation du paysage
● Automates cellulaires– Cas le plus simple d'une grille régulière fixe– Règles sur l'allocation d'une case en
fonction de l'allocation de ses voisines– Simulation jusqu'à stabilisation– Exemples : Slager 2008, + D. Moreau
● Trepos : règles décisionnelles simuler des arbres d'exutoires (bassin versant)
● F. Flouvat : colocalisation pour l'érosion en Nouvelle Calédonie
● Modèle L1 (Gaucherel) : règles de transformation géométrique (actions géométriques attributaires)
● ajout, disparition, réunion, division ...● Grammaires de formes (Stiny)
15/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Caractérisation du paysage par des ensembles de cultures colocalisées● Éléments constitutifs d'une grammaire de paysage
(parcellaire)– Vocabulaire : un élément géométrique avec attributs
● parcelle : 1 point (centre de la parcelle) + attribut d'assolement● haie : 1 point (centre) + attribut de type de haie● exemples :
– « Grande parcelle de maïs » : parcelle de maïs > 10ha
– Règles : ensemble cultures colocalisées « significatives » ● Cultures/haies colocalisées = ensemble de cultures et types de
haies « proches » dans l'espace● exemple :
– une parcelle de maïs est proche d'une route– une prairie est souvent à coté d'une prairie
16/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Caractérisation automatique du paysage
● On pourrait récupérer les règles auprès d'un expert : – difficile et couteux,– exprimable ?
● On cherche à extraire automatiquement – le vocabulaire : par catégorisation des types de parcelle– les règles de colocalisation de cultures
● « significatif » : présent de manière fréquente (>seuil) dans le paysage réel
● Utilisation de méthode de fouille de données spatiales– Recherche de motifs colocalisés
17/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Motifs de colocalisation (Huang et al., Shekhar et al.)
Y. Huang, , S. Shekhar, H. Xiong, « Discovering co-location patterns from spatial datasets: a general approach », IEEE Transaction on Knwoledge and data engineering, 2004
● Une colocalisation C est un sousensemble de caractéristiques (C in F).
● Une instance d’une colocalisation C, par rapport à une relation de voisinage R fixée, est un ensemble d’objets de O ayant pour caractéristiques celles de C, et respectant deux à deux la relation spatiale R.– Exemple C={A,B,C}
● Ensemble des instances de C parmi O : TI RO ,C
O={o1,o2, o3, ...o12}
F={A , B ,C , D , E }
f o1=A ,f o2=C ,
...
18/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Motifs de colocalisation (Flouvat et al., extension de Shekhar)● Méthode d'extraction de motifs colocalisés « intéressants »
– Cadre théorique de Mannila● « Intéressant » = mesure antimonotone supérieure à un seuil
– Utilisation des algorithmes de recherche de sousensembles d'objets spatiaux « intéressants »
● APriori● FPGrowth● ...
● Dans l'approche de Huang, la relation spatiale est directement intégrée dans la recherche de motifs fréquents
Selmaoui, Flouvat, Grison, Rouet et Gay, ”Découverte de colocations dans un SIG : extension et application à l'étude de l'érosion en nouvelle calédonie”, SAGEO; 2009
19/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Motifs de colocalisation
● Ratio de participation
● Index de participation– Mesures antimonotones pour l'inclusion ensembliste
piShekhar=∏∀ f ∈C
prRO,C , f
piHuang=min∀ f ∈C prR O,C , f
piFlouvat=∣TI RO ,C ∣
∣TI R O ,C ∣max∀ f ∈C∣{o∈TI RO ,C ;o∉I ,∀ I∈TI RO ,C }∣
20/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Motifs de colocalisation
Selmaoui, Flouvat, Grison, Rouet et Gay, ”Découverte de colocations dans un SIG : extension et application à l'étude de l'érosion en nouvelle calédonie”, SAGEO; 2009
prRO , {A , B }, A =1/2prRO , {A , B },B =1/2piShekhar O , {A ,B }=1/4piHuang O , {A , B }=1/2piFlouvat=2 /22=1/2
prR O ,{A ,B }, A =1 /3prR O ,{A ,B }, B =1/3piShekhar O ,{A ,B }=1/9piHuang O ,{A ,B }=1/3piFlouvat=1/12=1 /3
prR O ,{A ,B }, A =1 /3prR O ,{A ,B }, B =1piShekhar O ,{A ,B }=1/3piHuang O ,{A ,B }=1/3piFlouvat=3 /32=3 /5
21/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Recherche de colocalisation (Guyet T.)
● Méthode en deux étapes1) Recherche des colocalisations C
● Revient à une recherche de cliques dans le graphe des relations
3) Recherche des caractéristiques communes aux objets colocalisés
C={O=o1 , o2 , ... , on;∀oi , o j∈O , R oi , o jvraie}
CF={F i
= f 1i , f 2
i , ... f ni;∀ o j∈Oi , f j
i=f o j
i ,Oi
∈C}
Ensemble des motifs colocalisés
Ensemble des caractéristiques de motifs colocalisés
R
22/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Recherche de colocalisation (Guyet T.)
● Recherche des caractéristiques fréquentes dans les descripteurs colocalisés– Suppression de la dimension spatiale– Les exemples sont des ensembles de descripteurs
– Utilisation du cadre général de Manilla (pour des itemsets)● Motif intéressant = motif fréquent (antimonotone !)● Application de l'algorithme APriori
F i= f 1i , f 2
i , ... , f ni
23/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Comparaison Huang / Guyet
● Expressivité– a priori, les mêmes relations spatiales peuvent être utilisées– Biais Guyet
● un motif de caractéristiques colocalisées est fréquent par rapport aux colocalisés uniquement
– Utiliser plutôt un nombre minimum plutôt d'une fréquence !● on perd l'information sur la présence globale des descripteurs
● Complexité– Huang : travaille sur toute la base de données en même
temps● étape de calcul de fréquence des motifs calculatoire !
– Guyet : indépendance des deux processus de fouille● gain réel ? la recherche de cliques reste complexe !● possibilité de découpler les calculs (construction des cliques a
priori)
24/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Caractérisation du paysage par des ensembles fréquents de cultures colocalisées● Quelques expérimentations
– Données● parcellaire de la zone atelier de « Pleine
Fougères »– Possibilité de faire enregistrer ce travail
dans le cadre de cet zone atelier– Dirigée par J. Baudry
● bocage de 2000● données fournies par le CAREN, par
l'intermédiaire du SADPaysage Rennes– Implémentation
● données disposés dans un serveur PostGis
● implémentation expérimentale en Java
25/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Construction de parcelles colocalisées
● Recherche des groupements de parcelles/haies « proches »– Relation spatiale (R) : distance euclidienne entre centres de
parcelle inférieure à un seuil (70m)● 1 parcelle ou 1 haie = 1 point
– ICI, l'assolement ou le type de haie n'a pas d'importance
Seuil de distance faible Seuil de distance plus grand
26/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Construction des ensembles fréquents de cultures colocalisées● Extraction de cultures co
localisées– ensembles de points colocalisés =
ensemble d'items● 1 item = 1 catégorie de parcelle● 1 catégorie = 1type de culture● réduit l'information spatiale à la co
localisation– extraction de motifs fréquents à
partir d'itemsets● APriori
= { , }IS1 Prairie Mais = { , }III IIIIIII I IIIIIII = { , }III IIIIIII IIIIIII = { , }III IIIIIII IIIIIII = { , , }III IIIIIII I III IIIII = { , }III IIIIIII I III
...
IS1
IS2
IS3
IS4
IS5
IS6
27/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Caractérisation du paysage par des ensembles fréquents de cultures colocalisées● Résultats par une méthode par colocalisation
– Seuil de colocalisation 70m– Seuil de cultures
colocalisées : 1%
– Résultats● {Céréales,Prairie}● {Céréales, Céréales}● {Prairie,Prairie,Prairie,Prairie} :
1.9%
(307902 2396412,312211 2399013)
28/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Colocalisation de cultures à 1%, Plaine, 70m
29/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Colocalisation de cultures à 1%, plaine, 300m
● {Plairie, Plairie, Plairie, Plairie, Plairie}
30/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Caractérisation du paysage par des ensembles fréquents de cultures colocalisées● Résultats par une méthode par colocalisation
– Seuil de colocalisation 70m– Seuil de cultures
colocalisées : 1%
– Cultures colocalisées extraites● {Prairie, Prairie, Prairie} : 9.9%● {Mais, Prairie, Prairie} : 1,6%● {Cereales, Prairies, Prairies} : 1.1%● {Mais, Mais}, {Mais, Cereales}, {Cereales, Cereales} >1%
(305821 2392998,309419 2395157)
31/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Colocalisation de cultures à 1%, Bocage, 70m
32/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Stage Matthieu Oger (M1 IFSIC)
● Mise en place d'une première méthode permettant de générer des paysages, incluant la dimension géométrique, à partir de règles locales extraites de parcellaires réels– Première expérimentation de A à Z– Inclure les aspects géométriques des parcelles– Interfaçage avec APILand
● API Java de représentation d'un paysage● INRA SADPaysage
Parcellaire(s) réel(s)(shp, PostGIS)
Règlescaractéristiquesd'un parcellaire
Représentationd'un paysagedans APILand
Extraction derègles de proximité
entre parcelles Simulation
Parcellairesimulés (shp)
Exportationdes parcellaires
33/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Méthode utilisée
● Génération du modèle– Reproduire en mémoire un modèle simplifié du paysage réel
● Format propre● Facile à traiter pour générer des motifs
● Extraction de motifs– Approche simple dans un premier temps
● Prise en compte d'un nombre réduit de paramètres– Analyser les relations de voisinage de chaque parcelle
● Type de parcelles à proximité, distance, surface (+ profil angulaire)– Approche floue et principe de règles à base de fréquences
34/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Méthode utilisée
● Génération du paysage– Pavage d'une zone réduite
● Ces zones pourront être utilisées conjointement ensuite– Autour de routes par exemple
– Utilisation des règles (motifs) pour placer des parcelles● Tirage aléatoire, placement arbitraire, etc.
– Adaptation de la topologie● Surface, formes de parcelles réelles
– Problème d'incompatibilité● Probabilité de placer deux parcelles incompatibles pour satisfaire la
répartition● Estce vraiment un problème ? (cas ponctuel exceptionnel)
35/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Résultats attendus
● Génération effective de parcellaires simulés (simples)– sans routes, ni rivières– géométries nonnécessairement très « réalistes »– sur de petits territoires
● Réalisation d'une implémentation de la méthode sur laquelle s'appuyer pour des améliorations futures– implémentation de la méthode générique (avec interface APILand)– modularité du code– généricité dans la représentation des motifs
● Comparer les parcellaires réels avec les parcellaires simulés– mise en place des mesures de distance– comparaison bocage/plaine
36/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Conclusions ...
● On cherche à caractériser un paysage par une « grammaire de paysage »
● Nécessite d'identifier un formalisme prenant en compte les attributs significatifs– Pour le vocabulaire : les objets géométriques composables
● attributs des parcelles : assolement, pente, nature du sol, ...● haies
– Pour les règles de composition : relations locales entre parcelles
● quelles mesures de distances ?● quelles relations prendre en compte ?
37/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Conclusions ...
● On cherche à extraire automatiquement ces règles de composition de paysage– C'est une contrainte forte sur la nature des règles qui
peuvent être extraites
● Utilisation des méthodes de fouille de données
38/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Conclusions ...
● Utilisation de règles spatiales locales pour caractériser un paysage– Ce sont des descripteurs locaux, – Approche assez différentes des approches statistiques
utilisant des descripteurs globaux– Pourraton retrouver des caractéristiques globales
dans les nouveaux paysages simulés ?● Quel formalisme pour représenter des règles spatiales
locales ?– Expressif pour le problème de la simulation de paysage– Extractible automatiquement– Utilisable pour faire de la simulation de paysage
39/41Seminaire Tahiti 2122 juin 2010 SaintJacut
Perspectives
● Réalisation du stage pour commencer à répondre aux questions précédentes
● Exploration des méthodes de fouilles de données spatiales pour l'extraction de règles de composition– Raisonnement sur des graphes de voisinage de parcelles– Formalisation logique des relations spatiales + ILP
● Travailler sur les distances comme élément sémantique– Distance pour l'exploitant agricole– Corridors écologiques
● Approches hiérarchiques : extraire et combiner des « supermotifs »