topo 111
TRANSCRIPT
-
7/24/2019 topo 111
1/55E
NSG/
DP
TSInterpolation spatiale
Pierre Bosser
Ecole Nationale des Sciences Geographiques
Departement Positionnement Terrestre et Spatial
Annee Scolaire 2011-2012
-
7/24/2019 topo 111
2/55
EN
SG/DP
-
7/24/2019 topo 111
3/55E
NSG/
DP
TS
INTERPOLATION SPATIALE Table des matieres
Table des matieres
1 Introduction 3
1.1 Objectifs du cours. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3 Caracteristiques des methodes dinterpolation . . . . . . . . . . . . . 4
1.4 Representations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.5 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2 Linterpolation deterministe globale 10
2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2 Polygone de Thiessen . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.3 Methode des cellules . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.4 Conclusion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3 Linterpolation deterministe locale 15
3.1 Polygones de Thiessen . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.2 Interpolation a partir dune triangulation . . . . . . . . . . . . . . . . 16
3.2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.2.2 Interpolation lineaire . . . . . . . . . . . . . . . . . . . . . . . 17
3.2.3 Methode dAkima. . . . . . . . . . . . . . . . . . . . . . . . . 19
3.3 Methodes barycentriques . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.3.1 Inverse des distances . . . . . . . . . . . . . . . . . . . . . . . 22
3.3.2 Interpolation bilineaire . . . . . . . . . . . . . . . . . . . . . . 24
3.4 Les surfaces de tendances. . . . . . . . . . . . . . . . . . . . . . . . . 25
Pierre Bosser 1 2011-2012
-
7/24/2019 topo 111
4/55E
NSG/
DP
TS
INTERPOLATION SPATIALE Table des matieres
3.5 Les splines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.5.1 Generalites . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.5.2 Spline dinterpolation. . . . . . . . . . . . . . . . . . . . . . . 27
3.5.3 Les splines de lissage . . . . . . . . . . . . . . . . . . . . . . . 29
3.6 Conclusion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4 Linterpolation stochastique 34
4.1 Notion de fonction aleatoire . . . . . . . . . . . . . . . . . . . . . . . 34
4.1.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
4.1.2 Moments. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.2 Inference statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4.2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.2.2 Ergodicite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.2.3 Stationnarite . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.2.4 Combinaisons lineaires autorisees . . . . . . . . . . . . . . . . 39
4.2.5 Conclusion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.3 Analyse variographique . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.3.1 Proprietes du variogramme. . . . . . . . . . . . . . . . . . . . 41
4.3.2 Inference du variogramme . . . . . . . . . . . . . . . . . . . . 42
4.4 Le krigeage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.4.1 Origine de la methode . . . . . . . . . . . . . . . . . . . . . . 47
4.4.2 Principe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.4.3 Proprietes du krigeage . . . . . . . . . . . . . . . . . . . . . . 50
4.4.4 Impact du modele de variogramme . . . . . . . . . . . . . . . 51
4.5 Conclusion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
5 Conclusion 53
Pierre Bosser 2 2011-2012
-
7/24/2019 topo 111
5/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 1 Introduction
1 Introduction
1.1 Objectifs du cours
A partir dobservations georeferencees, pas necessairement reparties regulierement,
on cherche a estimer les valeurs prises par le parametre observe en dautres points
de lespace. On parle alors destimation spatiale : cest une procedure consistant
a estimer la valeur dune grandeur en un site a partir de dechantillons de cette
grandeur recoltes dans dautres sites.
Ce besoin sapplique a de nombreux domaines ou la connaissance de la distribu-
tion spatiale de phenomenes est importante : altimetrie, gravimetrie, meteorologie,
geologie, etc.
Lors de ce cours, nous allons donc etudier les methodes permettant lestimation
et linterpolation de donnees georeferencees. Ce cours sera une introduction aux
differentes methodes existantes, mais pas une etude exhaustive (base pour des etudes
plus approfondies). Les idees developpees ici sont largement inspirees des ouvrages
suivants :
Akima, H., A method of bivariate interpolation and smooth surface fitting for
values given at irregularly distributed points ,OT Report 75-70, U.S. Department
of Commerce.
Arnaud, M. & Emery, X., Estimation et interpolation spatiale : methodes
deterministes et geostatistiques , Hermes, 2000.
Baillargeon, S., Le krigeage : revue de la theorie et application a linter-
polation spatiale de donnees de precipitation , Memoire de M. Sc., Universite
LAVAL, 2005.
Verdun, J., Methodes destimation et dinterpolation spatiales ,Cours donne
aux IT2, ENSG, 2006.
Pierre Bosser 3 2011-2012
-
7/24/2019 topo 111
6/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 1 Introduction
1.2 Notations
On definit unevariable regionalisee comme etant une fonction numerique prenant
ses valeurs dans une region limitee, appelee champ.
Par la suite, on utilisera les notations suivantes :
z, la variable regionalisee.
D, le champ de la regionalisation, cest a dire le domaine dans lequel la variable
regionalisee est definie. En general, D R, R2 ou R3.
s D, le vecteur de coordonnees (x,y,z) qui indique la position dun site dans le
champ D.
z(s), la valeur prise par la variable regionalisee zau sites D.
z(V), la valeur moyenne de zsur le domaine V D. n, le nombre de sites ou la variable a ete mesuree.
z(s1),...,z(sn), les valeurs prises par zaux sites dobservation s1...sn.
z(s0), une estimation de z(s0) avecs0 D.
1.3 Caracteristiques des methodes dinterpolation
Dans le cas general, la variable regionalisee ne peut etre representee par une fonction
mathematique explicite. Cependant, elle presente une structuration spatiale biendefinie, avec une correlation des valeurs prises en deux sites proches. Ceci rend
possible la prevision dune valeur inconnue a partir dobservations. On parle ainsi
dinterpolation pour lestimation de cette valeur. On parle dextrapolation lorsque
le site inconnu est situe hors des limites du domaine geographique engendre par
lechantillonnage des sites dobservation.
On sinteresse dans de ce cours a ces methodes de prevision. Elles se divisent usuelle-
ment en deux groupes, selon les modeles mathematiques sur lesquels elles reposent :
Methodes deterministes : elles reposent sur des proprietes purement mathema-
tiques, generalement geometriques, sans tenir compte du phenomene physique qui
nous interesse.
Methodes stochastiques: elles font appel a des modeles probabilistes et decou-
lent de lanalyse statistique des donnees considerees. On parle alors de techniques
geostatistiques.
Pierre Bosser 4 2011-2012
-
7/24/2019 topo 111
7/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 1 Introduction
Ralit Physique Modle dterministe Modle probabiliste
f 2 Dgz s s( )/ f 2 DgZ s s( )/
Variable rgionalise Fonction alatoirePhnomne naturel
Valeurs rgionalises Variables alatoires
Interpolation spatialedterministe
Interpolation spatialestochastique
z s i n( ) = 1, ...,i pour Z s i n( ) = 1, ...,i pour
FIG 1 - Methodes deterministes et stochastiques : un
phenomene physique observe en certains sites peut etre es-time en des sites quelconques via lutilisation de methodes
deterministes (basees sur de simples constats geometriques)
ou de methodes stochastiques (basees sur des constats sta-
tistiques).
On differencie egalement ces methodes selon quelles soient globales ou locales. Une
methode globale consiste a calculer la moyenne de la variable generalisee sur le
champ a partir de lensemble des observations disponibles ; une methode locale
realise une estimation de cette moyenne sur une partie plus reduite du champ, voire
en un site ponctuel.
Une methode exacte conserve les valeurs des echantillons originaux, contrairement
a une methode approchee.
Enfin, on parle deffet decran lorsquune observation commande limpact dune
autre observation lors de linterpolation. Linfluence de lobservation ecrantee se-
ra alors :
nulle dans le cas dun ecran total,
peu elevee dans le cas dun ecran partiel,
moderee dans le cas dun ecran faible.
Pierre Bosser 5 2011-2012
-
7/24/2019 topo 111
8/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 1 Introduction
S3
S2
S1
S6
S5
S0S
7
FIG 2- Effet decran : le site S7 peut potentiellement mas-
quer le siteS6; linterpolateur va donner moins dimportance
au site masque, S6, par rapport au site masquant S7.
1.4 Representations
A partir dun champ dont on connait certaines valeurs prises par la variable regionali-
see, on veut deduire la representation densemble de cette variable sur le champ.
Cette representation peut se faire sous la forme :
de lignes de niveau,
de niveaux de couleur,
dune perspective 3D, etc.
On retrouve sur les figures suivantes differents modes de representation du champ
interpole.
140 160 180 200 220 240 260 280
120
140
160
180
200
220
240
X
Y
FIG 3 - Exemple de representation dune variable re-
gionalisee : sites dobservation.
Pierre Bosser 6 2011-2012
-
7/24/2019 topo 111
9/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 1 Introduction
140 160 180 200 220 240 260 280
120
140
160
180
200
220
240
X
Y
140 160 180 200 220 240 260 280
120
140
160
180
200
220
240
X
Y
500
550
600
650
700
FIG 4 - Exemple de representation dune variable re-
gionalisee : representations planes.
140160
180 200220
240260
280
120
140
160
180
200
220
240
400
500
600
700
800
Y
X
Z
140160
180 200220
240260
280
120
140
160
180
200
220
240
400
500
600
700
800
Y
X
Z
140160
180200
220240
260280
120
140
160
180
200
220
240
400
500
600
700
800
Y
X
Z
500
550
600
650
700
FIG 5 - Exemple de representation dune variable re-
gionalisee : perspectives.
Pierre Bosser 7 2011-2012
-
7/24/2019 topo 111
10/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 1 Introduction
1.5 Applications
Linterpolation spatiale est outil que lon retrouve dans differents domaines. Citons
par exemple :
En meteorologie : mesures sol du champ de pression, de temperature, dhumidite,
de pluviometrie.
En geodesie : mesures du champ de gravite, retards tropospheriques et iono-
spheriques, hauteur du geode.
En geologie : teneur du sol en elements mineraux.
Les figures suivantes presentent differentes visualisations dinterpolation spatiale
dun jeu dobservation (pression, temperature, pluviometrie, retards tropospherique
GPS, anomalie de gravite).
FIG 6 - Exemple dobservations interpolees spatialement :
mesures de pression, temperature, precipitation (
Meteo-
France).
Pierre Bosser 8 2011-2012
-
7/24/2019 topo 111
11/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 1 Introduction
FIG 7 - Exemple dobservations interpolees spatialement :retards tropospheriques GPS (
RGP / IGN), anomalies
de gravite (
LAREG / IGN) et temperature a 500 m de
profondeur (
BRGM).
Pierre Bosser 9 2011-2012
-
7/24/2019 topo 111
12/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 2 Linterpolation deterministe globale
2 Linterpolation deterministe globale
2.1 Definition
Lestimation globale vise a estimer la moyenne arithmetique dune ensemble dob-
servations (valeurs de la variable regionalisee) dans un domaine geographique (le
champ). Cette estimation nest pas triviale puisque les observations ne sont pas
forcement representatives et peuvent presenter une densite differentes en fonction
de la zone du champ, donnant alors une influence trop importante a certaines parties
de la zone etudiee.
Deux solutions sont alors envisageables. La premiere consiste en une selection des
donnees observees. Le probleme reside alors dans le choix des observations a prendre
en compte. Aucun critere objectif ne peut permettre detre certain ni de la qua-
lite ni de la pertinence des observations choisies. Une seconde solution consiste a
ponderer lensemble des observations lors du calcul de la moyenne. Nous allons ici
nous interesser a des methodes globales basees sur cette solution.
2.2 Polygone de Thiessen
Pour tous les points dobservation du champs, on definit un polygone dinfluence tel
que chaque point du polygone est plus proche du point dobservation que de tout
autre site :
s Pi, sj D Pi, si s sj s
D est alors partitionne en une famille de polygone convexes, nommes polygone de
Thiessen(aussi appeles polygones de Voronoi ou cellules de Dirichlet).
Pierre Bosser 10 2011-2012
-
7/24/2019 topo 111
13/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 2 Linterpolation deterministe globale
S3
S2
S1
S6
S5
S0
FIG 8 - Construction des polygones de Thiessen.
Les observations groupees vont ainsi se voir affecter un polygone dinfluence de petite
surface, les donnees isolee un polygone de grande surface. Notons que le decoupagede Thiessen depend uniquement de la configuration geometrique et non pas des
valeurs observees. Les polygones ne sont pas necessairement fermes dans certaines
directions de lespace : il faut ainsi limiter la partition aux frontieres de D, ou fixer
une distance dinfluence limite.
S3
S2
S1
S6
S5
S0
FIG 9 - Decoupage en polygones de Thiessen.
Les surfaces des polygones de Thiessen ainsi obtenus vont alors permettre la ponde-
ration des observations pour le calcul de la moyenne de la variable regionalisee sur
le champ detude :
z(D) =ni=1
|Pi|
|D|zsi (1)
Ou |Pi| est laire du polygone Pi associee au sitesi et |D|laire du champ :
|D| =ni=1
|Pi| (2)
Par construction, les zones a observations denses sont les zones a polygones de
Thiessen de surface moindre : linfluence de ces zones est donc limitee.
Pierre Bosser 11 2011-2012
-
7/24/2019 topo 111
14/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 2 Linterpolation deterministe globale
140 160 180 200 220 240 260 280100
150
200
250
X
Y
FIG 10 - Exemple de decoupage en polygones de Thiessen.
2.3 Methode des cellules
La methode des cellules consiste a diviser le champ en cellules rectangulaires de
meme taille, contenant chacune un nombre variable de sites dobservation. La pon-
deration des observations lors de lestimation globale est realisee a laide du nombre
de sites contenus dans chaque cellule.
La procedure destimation est la suivante :
1. On calcule la moyenne des sites dobservations contenus dans chaque cellule.
2. On calcule ensuite la moyenne des moyennes de toutes les cellules, sans pon-
deration.
Lestimation globale du champ etudie est donc donne par la formule :
z(D) = 1
N
N=1
ni=1
s(i)
(3)
OuNest le nombre de cellules de decoupage du domaineD contenant au moins un
site dobservation,s(i) les sites dobservation localises dans la cellule.
En pratique, on repete lalgorithme plusieurs fois (5 a 10) avec differents decoupages
dans le but dobtenir une estimation globale independante du reseau.
Pierre Bosser 12 2011-2012
-
7/24/2019 topo 111
15/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 2 Linterpolation deterministe globale
Notons que si la taille des cellules est trop petite, chacune contiendra au plus un
site dobservation et les donnees auront toutes le meme poids. Si la taille est trop
grande, toutes les observations appartiendront a la meme cellule et auront doncle meme poids. Dans ces 2 cas, lestimation globale reviendra alors a calculer la
moyenne arithmetique de toutes les observations.
140 160 180 200 220 240 260 280100
150
200
250
X
Y
FIG 11 - Exemple de decoupage en cellules.
2.4 Conclusion
Les methodes destimation globale presentees ici reposent uniquement sur la confi-
guration geometrique des donnees. Elles permettent donc de quantifier la quantite
totale ou moyenne dun ensemble dobservations de repartition variable dans les-
pace.
Les methodes abordees sont appliquees sur un jeu de donnees test (tableau suivant).
Mis a part un cas (decoupage en cellules de taille minimale), on observe que les
resultats obtenus sont dans lensemble relativement homogene.
Pierre Bosser 13 2011-2012
-
7/24/2019 topo 111
16/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 2 Linterpolation deterministe globale
Interpolation z(D)
Polygones de Thiessen 620.6693
Cellules, pas de 1 m 609.9030Cellules, pas de 10 m 615.4803
Cellules, pas de 20 m 618.9132
Cellules, pas de 50 m 619.6649
Cellules, pas de 100 m 614.0666
TAB 1- Estimation globale par differentes methodes : esti-
mation de laltitude moyenne.
Il est cependant plus important de pouvoir localiser / cartographier les zones defortes valeurs et celles de valeurs moindres : cest le but de lestimation locale que
nous allons voir par la suite.
Pierre Bosser 14 2011-2012
-
7/24/2019 topo 111
17/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 3 Linterpolation deterministe locale
3 Linterpolation deterministe locale
Nous nous interessons ici aux methodes deterministes pour lestimation locale et
ponctuelle dune valeur de la variable regionalisee. Cette estimation sera realisee apartir de combinaisons lineaires des observations en tenant compte de leur dispo-
sition les unes par rapport aux autres mais aussi de la distance entre le secteur a
estimer et les points de donnees.
3.1 Polygones de Thiessen
Nous avons aborde precedemment lutilisation des polygones de Thiessen dans le cas
de lestimation globale. Linterpolation par la methode de Thiessen consiste a affec-
ter a lensemble des points dun polygone donne la valeur de la variable regionalisee
correspondante (on parle aussi de plus proche voisin). On obtient alors une sur-
face discontinue; ces discontinuites nont rien a voir avec de possibles discontinuites
reelles, mais sont simplement liees a la configuration geometrique des observations.
On trouve dans la litterature differentes methodes pour palier ce probleme de discon-
tinuites (methode de Sibson par exemple basee sur linterpolation par combinaison
lineaire des valeurs aux sommets voisins).
S?
S3
S2
S1
S6
S5
S0
FIG 12 - Interpolation par la methode de Thiessen (plus
proche voisin).
Pierre Bosser 15 2011-2012
-
7/24/2019 topo 111
18/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 3 Linterpolation deterministe locale
Sur la figure suivante, on represente un exemple dinterpolation par plus proche voi-
sin. On remarque que le resultat obtenu est peu esthetique en raison des nombreuses
discontinuites.
140160
180200
220240
260280
120
140
160
180
200
220
240
400
500
600
700
800
Y
X
Z
FIG 13 - Interpolation par plus proche voisin : application
sur un champ dobservations - vue en perspective.
3.2 Interpolation a partir dune triangulation
3.2.1 Definition
La triangulation consiste a diviser le champ en triangles disjoints dont les sommets
sont les sites dobservation. On calcule alors la valeur en un point donne a partir
des valeurs des sommets du triangle auquel il appartient.
Il existe plusieurs methode de triangulation, la plus utilisee etant la triangulation
de Delaunay : les sommets de chaque triangle sont les sites du champ D tels que
les polygones de Thiessen associes ont un cote en commun. Notons les proprietes
dune telle triangulation :
La triangulation est independante de lordre de traitement.
Lensemble du domaine nest pas recouvert : on opere uniquement dans lenveloppe
convexe des sites.
Les cercles circonscrits a chacun des triangles ne contiennent pas dautre site
dobservation.
Pierre Bosser 16 2011-2012
-
7/24/2019 topo 111
19/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 3 Linterpolation deterministe locale
Tous les points sont relies a leur plus proche voisin.
S?
S3
S2
S1
S6
S5
S0
FIG 14 - Triangulation de Delaunay.
Il existe plusieurs methodes pour linterpolation de donnees a partir dune triangu-lation. Ici, deux dentres elles seront exposees.
3.2.2 Interpolation lineaire
On considere le triangle (s1, s2, s3) contenant le point dinteret s. La valeur re-
cherchee de la variable regionalisee secrit sous la forme :
z(s) = z(x, y) = x+ y+
S2S1
S3
S?
FIG 15 - Interpolation lineaire : Geometrie du probleme.
La solution est determinee a partir dune combinaison lineaire des valeur observees
au sommet du triangle en resolvant le systeme :
x1+ y1+ = z1
x2+ y2+ = z2
x3+ y3+ = z3
Ou zi=z(si).
Pierre Bosser 17 2011-2012
-
7/24/2019 topo 111
20/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 3 Linterpolation deterministe locale
Lequation matricielle secrit sous la forme :
x1 y1 1x2 y2 1
x3 y3 1
= z1
z2
z3
On peut alors montrer que cette solution secrit sous la forme :
z(s) = |s1, s, s2| z3+ |s1, s, s3| z2+ |s2, s, s3| z1
|s1, s2, s3|
Ou |s1, s2, s3| represente laire du triangle forme par les vecteurs (s1, s2, s3) : la
solution devient donc la somme ponderee des aires des triangles formes par les 3sommets et le point dinteret.
S2 S1
S3
j jS SS2 3, ,
j jS S S1 2, ,
jS S S1 3, , j
S2 S1
S3
j 2 3, ,S S Sj
j jS S S1 2, ,
j jS SS1 3, ,
FIG 16- Interpolation lineaire : interpretation geometrique
de la solution : plus le point auquel on souhaite estimer la
valeur de la variable regionalisee est proche dun site dob-
servation, plus la proportion de surface occupee par le tri-
angle oppose a ce sommet est importante ; le poids associe
est donc plus important et la valeur estimee proche de celle
du sommet.
Chaque site dobservation recoit donc un poids egal a la proportion de surface oc-
cupee par le triangle qui lui est oppose : plus le point recherche est proche dun
site dobservation plus la valeur de la variable regionalisee est proche de la valeurobservee en ce site.
Un exemple de cette methode dinterpolation est represente ci-dessous.
Pierre Bosser 18 2011-2012
-
7/24/2019 topo 111
21/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 3 Linterpolation deterministe locale
140160
180 200220
240260
280
120
140
160
180
200
220
240
400
500
600
700
800
Y
X
Z
FIG 17 - Interpolation lineaire : application sur un champ
dobservations - vue en perspective. On observe laspect py-
ramidal de la surface obtenue.
Linterpolation lineaire presente les proprietes suivantes :
Lestimation est unique pour une triangulation donnee. Cette methode est exacte.
La surface obtenue est continue ; elle est composee de pyramides juxtaposees.
Lextrapolation nest pas possible au dela de lenveloppe convexe des sites dob-
servation.
3.2.3 Methode dAkima
La methode dAkima est une autre methode dinterpolation a partir dune triangu-
lation. On ajuste cette fois-ci a chaque triangle une surface dont lequation est un
polynome de degre 5 :
z(s) = z(x, y) =5
j=0
5jk=0
jkxjyk
Il faut donc 21 conditions pour determiner les 21 coefficients jk :
les 3 premieres conditions sont obtenues a partir des valeurs prises par la variable
Pierre Bosser 19 2011-2012
-
7/24/2019 topo 111
22/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 3 Linterpolation deterministe locale
regionalisee aux 3 sommets de chaque triangle :
z(s1), z(s2), z(s3)
6 autres conditions sont obtenues a partir des derivees premieres aux sommets de
chaque triangle :
z
x(s1),
z
y(s1)
z
x(s2),
z
y(s2)
z
x
(s3), z
y
(s3)
9 autres conditions sont obtenues a partir des derivees secondes aux sommets de
chaque triangle :
2z
x2(s1),
2z
y2(s1) ,
2z
xy(s1)
2z
x2(s2),
2z
y2(s2) ,
2z
xy(s2)
2z
x2(s3),
2z
y2(s3) ,
2z
xy(s3)
Les 3 dernieres conditions sont obtenues a laide de considerations de continuite
et de derivabilite aux limites de chaque triangle. La derivee partielle de la fonc-
tion dinterpolation dans la direction normale a chaque cote du triangle est un
polynome de degre 3, au plus, de la variable mesuree selon ce cote.
5z
nt4(s1) = 0,
5z
nt4(s2) = 0,
5z
nt4(s3) = 0
S2 S1
S3
S?
n1 t1n2
t2
n3
t3
FIG 18 - Interpolation dAkima : Geometrie de la solution.
Pierre Bosser 20 2011-2012
-
7/24/2019 topo 111
23/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 3 Linterpolation deterministe locale
La derniere condition assure donc la continuite et la derivabilite de la surface ob-
tenue. Le passage (x, y) (n, t) est lineaire : les valeurs de la fonction et de ses
derivees partielles premieres et secondes selonxet y suffisent donc a determiner lesvaleurs de la fonction et de ses derivees selon net taux sommets.
Ainsi, En limite de 2 triangles, la section de la surface est un polyn ome de degre
5 en t ; ses coefficients sont donnes par les valeurs de la fonction et de ses derivees
aux sommets : on a donc continuite de la surface. Sur chaque cote dun triangle, les
derivees premiere selonn et seconde selonn puist aux sommets permettent decrire
la derivee premiere selon n sous forme dun unique polynome de degre 3, en t : on
a donc egalement la derivabilite.
Pour calculer les derivees partielles en chaque sommet du triangle, Akima proposelutilisation des sites (entre 3 et 5) les plus proches de chaque sommet du triangle.
Les derivees premieres sont obtenues en estimant le plan moyen (par rapport aux
differents sites voisins choisis) passant par le sommet dinteret. Les derivees se-
condes sont calculees en repetant cette operation, mais cette fois-ci en considerant
les derivees premieres au lieu des valeurs de la variable regionalisee.
Bien quen apparence complexe, limplementation de cette methode est relativement
directe (un formulaire complet existe).
Cette methode est assez efficace puisque robuste et rapide. Elle est exacte et permetlestimation dune surface continue et derivable. Il existe des variantes permettant
une extrapolation au dela de lenveloppe convexe formee par lensemble des triangles.
Pierre Bosser 21 2011-2012
-
7/24/2019 topo 111
24/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 3 Linterpolation deterministe locale
140160
180 200220
240260
280
120
140
160
180
200
220
240
400
500
600
700
800
Y
X
Z
FIG 19 - Interpolation par la methode dAkima : applica-
tion sur un champ dobservations - vue en perspective. On
observe que la surface obtenue est beaucoup plus esthetique
que celle issus dune interpolation lineaire.
3.3 Methodes barycentriques
Netant pas limitees au voisinage direct du point dinteret, les methodes barycen-
triques presentent lavantage de prendre en compte plus de donnees du champ dob-
servation. Un poids plus important est affecte aux sites les plus proches, un poids
moindre aux sites plus eloignes.
3.3.1 Inverse des distances
Cest la methode barycentrique la plus employee. elle consiste a attribuer un poids
inversement proportionnel a la distance entre les sites et le point a estimer :
z(s) =
ni=1
z(si)
si sni=1
1
si s
On peut generaliser cette formule en prenant comme ponderation une puissance p
Pierre Bosser 22 2011-2012
-
7/24/2019 topo 111
25/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 3 Linterpolation deterministe locale
de la distance entre sites et point a estimer
p 0 : moyenne arithmetique
p + : methode de Thiessen
140160
180200
220240
260280
120
140
160
180
200
220
240
400
500
600
700
800
Y
X
Z
FIG 20 - Interpolation barycentrique par inverse des dis-
tances : application sur un champ dobservations - vue en
perspective.
Cette methode dinterpolation est exacte et fournit une surface continue. Les valeurs
interpolees sont limitees par les valeurs minimale et maximale du champ dobserva-
tion, la ponderation etant positive.
Elle presente cependant quelques inconvenients. Elle est indifferente a la configu-
ration geometrique des observations, seule la distance compte. Elle tend a sur-
ponderer les donnees groupees alors quelles sont redondantes. Les cartes disovaleur
presentent des structures en forme dil de bufautour des sites dobservationen raison de linfluence du site le plus proche. Plus la puissance de la distance est
elevee, plus cet est important.
Pierre Bosser 23 2011-2012
-
7/24/2019 topo 111
26/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 3 Linterpolation deterministe locale
140 160 180 200 220 240 260 280
120
140
160
180
200
220
240
X
Y
FIG 21 - Interpolation barycentrique par inverse des dis-
tances : application sur un champ dobservations - repre-
sentation par courbes de niveau, vue de dessus. On distingue
nettement leffet doil de buf lie a lutilisation de cette
methode.
3.3.2 Interpolation bilineaire
Linterpolation bilineaire necessite un echantillonnage regulierdes sites dobser-
vation. On cherche les quatre points entourant le point dinteret. On effectue alors
une interpolation a laide de linverse des distances. Linterpolation est exacte et
restitue une surface continue. Les calculs sont rapides.
Si j, Si j+1,
Si j+1, +1Si j, +1
S
a1
b2
b1
a2
z2z1
FIG 22
- Interpolation bilineaire : geometrie de la solution.
Pierre Bosser 24 2011-2012
-
7/24/2019 topo 111
27/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 3 Linterpolation deterministe locale
Le valeur de la variable regionalisees au points est donnee par :
z(s) =a1z1+a2z2
a1+a2
Avec :
z1 = b1zi+1,j+1+b2zi,j+1
b1+b2
z2 = b1zi+1,j+ b2zi,j
b1+b2
Comme nous lavons dit, cette methode necessite un echantillonnage regulier des
sites dobservation, ce qui la rend inutilisable dans la majorite des cas.
3.4 Les surfaces de tendances
On cherche a ajuster par moindre-carre une surface polynomiale aux valeurs ob-
servees. Cette surface se presente sous la forme :
z(s) = z(x, y) =pi=0
pij=0
ijxiyj
Ou p est le degre du polynome ou ordre de la surface. Les ij sont obtenus par
minimisation de la quantiten
i=1[z(si) z(si)]2 par moindre-carre par exemple. Il
faut alors que le degre du polynome verifie 12
(p+ 1)(p+ 2) n. Linversion peut
secrire sous la forme matricielle suivante :
x01y
01 . . . x
01y
p1 . . . x
p1y
01
... . . . ... . . .
...
x0ny0n . . . x0nypn . . . xpny0n
0,0...
0,p
...p,0
= z1
...
zn
On represente sur les figures suivantes, linterpolation par des surfaces de tendance
dordre respectif 2, 3 et 5.
Pierre Bosser 25 2011-2012
-
7/24/2019 topo 111
28/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 3 Linterpolation deterministe locale
140160
180 200220
240260
280
120
140
160
180
200
220
240
400
500
600
700
800
Y
X
Z
FIG 23 - Interpolation par une surface de tendance dordre
2 : application sur un champ dobservations - vue en pers-
pective.
140160
180200
220240
260280
120
140
160
180
200
220
240
400
500
600
700
800
Y
X
Z
FIG 24 - Interpolation par une surface de tendance dordre
3 : application sur un champ dobservations - vue en pers-
pective.
Pierre Bosser 26 2011-2012
-
7/24/2019 topo 111
29/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 3 Linterpolation deterministe locale
140160
180 200220
240260
280
120
140
160
180
200
220
240
400
500
600
700
800
Y
X
Z
FIG 25 - Interpolation par une surface de tendance dordre
5 : application sur un champ dobservations - vue en pers-
pective.
La solution est unique. Linterpolateur est approche. La duree du calcul depend de
lordre de la surface.
Les test statistiques concernant la significativite des resultats sont a utiliser avec
prudence car ils reposent sur une hypothese dindependance des valeurs, ce qui est
rarement verifie dans le contexte spatial.
3.5 Les splines
3.5.1 Generalites
Les splines sont une famille de fonctions qui minimisent lenergie de flexion sous
certaines contraintes dajustement. Dans notre contexte, il existe deux categories
de fonctions de splines : les splines dinterpolation qui passent exactement par les
points dobservation et les splines de lissage qui passent a proximite.
3.5.2 Spline dinterpolation
On desire obtenir une fonction qui soit la plus lisse possible tout en restituant
les valeurs mesurees aux differents sites dobservation. Cette fonction (notee z(s))
Pierre Bosser 27 2011-2012
-
7/24/2019 topo 111
30/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 3 Linterpolation deterministe locale
represente la surface par une plaque mince et flexible que lon contraint a passer par
chaque site. Elle doit ainsi minimiser lenergie de flexion :
2z
x2+ 2
2z
xy+
2z
y2dxdy
Avec comme contrainte z(si) =z(si).
On peut montrer que la fonction spline solution secrit alors sous la forme :
z(s) = z(x, y) =a0+a1x+a2y+ni=1
biK(s si)
Avec :
K(h) =h2 ln(h)
Les inconnues a0, a0, a0, b1, ..., bn sont solutions du systeme suivant :
a0+a1xi+a2yi+n
j=1,j=ibjK(si sj) =z(si)
nj=1
bj = 0,n
j=1bjxj = 0,
nj=1
bjyj = 0
On traduit ce systeme sous forme matricielle :
1 x1 y1 0 . . . K 1,n...
... ...
... . . . ...
1 xn yn Kn,1 . . . 0
0 0 0 1 . . . 1
0 0 0 x1 . . . xn
0 0 0 y1 . . . yn
a0
a1
a2
b1...
bn
=
z1...
zn
0
0
0
Lestimation en un point donne necessite la resolution den+3 equations. Lexistence
et lunicite de la solution sont garanties lorsque les points ne sont pas alignes. Lessplines dinterpolation sont des interpolateurs exacts.
Pierre Bosser 28 2011-2012
-
7/24/2019 topo 111
31/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 3 Linterpolation deterministe locale
140160
180 200220
240260
280
120
140
160
180
200
220
240
400
500
600
700
800
Y
X
Z
FIG 26 - Interpolation par spline dinterpolation : applica-
tion sur un champ dobservations - vue en perspective.
3.5.3 Les splines de lissage
Il peut etre judicieux dans certaines situations (mesures presentant une incertitude
importante) de chercher une surface qui sapproche au mieux des observations tout
en restant la plus lisse possible. Dans R2, on traduit ces conditions en cherchant a
minimiser la fonction qui minimise :
ni=1
[z(si) z(si)]2 +
2z
x2+ 2
2z
xy+
2z
y2dxdy
Ou est un parametre strictement positif et fixe a priori.
On peut montrer que la solution se presente alors sous la forme de la solution obtenue
dans le cas des splines dinterpolation :
z(s) = z(x, y) =a0+a1x+a2y+ni=1
biK(s si)
Avec :
K(h) =h2 ln(h)
Pierre Bosser 29 2011-2012
-
7/24/2019 topo 111
32/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 3 Linterpolation deterministe locale
Les inconnues a0, a0, a0, b1, ..., bn sont solutions du systeme suivant :
a0+a1xi+a2yi+bi+
nj=1,j=i
bjK(si sj) =z(si)
nj=1
bj = 0,n
j=1bjxj = 0,
nj=1
bjyj = 0
On traduit ce systeme sous forme matricielle :
1 x1 y1 . . . K 1,n...
... ...
... . . .
...
1 xn yn Kn,1 . . .
0 0 0 1 . . . 1
0 0 0 x1 . . . xn
0 0 0 y1 . . . yn
a0
a1
a2
b1...
bn
=
z1...
zn
0
0
0
140160
180200
220240
260280
120
140
160
180
200
220
240
400
500
600
700
800
Y
X
Z
FIG 27 - Interpolation par spline de lissage - = 103 : ap-
plication sur un champ dobservations - vue en perspective.
Pierre Bosser 30 2011-2012
-
7/24/2019 topo 111
33/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 3 Linterpolation deterministe locale
140160
180 200220
240260
280
120
140
160
180
200
220
240
400
500
600
700
800
Y
X
Z
FIG 28 - Interpolation par spline de lissage - = 106 : ap-
plication sur un champ dobservations - vue en perspective.
La surface obtenue tend vers un plan.
Le terme permet de faire un compromis entre la contrainte dajustement et cont-
rainte de lissage : Si = 0, linterpolation est exacte : on est dans le cas des splines dinterpolation.
Plus augmente, plus les valeurs calculees aux sites dobservation seloignent des
valeurs observees.
Lorsque +, la surface estimee tend vers un plan dequation z(x, y) =
a0+a1x+a2y : les termes bi tendent vers 0 pour compenser la forte valeur de .
3.6 Conclusion
Nous avons maintenant un apercu de differentes techniques deterministes permettant
lestimation locale de variables regionalisees en des sites non echantillonnes. Dans le
tableau suivant, on represente une synthese de ces methodes.
Pierre Bosser 31 2011-2012
-
7/24/2019 topo 111
34/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 3 Linterpolation deterministe locale
Interpolation Interpolation Exacte Effet decran Limite(s)
Polygones de Thiessen oui total Discontinuites
Lineaire oui total Aspectpyramidal
Akima oui total Implementation
Inverse des distances oui faible Effet
il-de-buf
Surface de tendance non faible Peu robuste
Spline dinterpolation oui partiel
Spline de lissage non faible
FIG 29 - Quelques caracteristiques des methodes dinter-
polation. Si une observation est masquee par une autre
observation par rapport au site a estimer, elle peut rece-
voir un poids nul (ecran total), peu eleve (ecran partiel) ou
modere (ecran faible).
Ces differentes methodes peuvent etre evaluees en suivant la technique de lechantil-
lon test (ou Jackknife ou bootstrap). Cette technique consiste a partager les ob-
servations en deux ensembles : un ensemble permettant la determination du modele,
un second permettant le test de ce modele. On effectue ainsi une sorte de validationcroisee.
On est cependant incapable de dire laquelle de ces methodes est la plus proche de
la verite, leur reussite etant largement dependante du contexte : une methode peut
fournir de bons resultats dans un cas, mais moins efficace dans un autre. Il est en
fait impossible de dire quelle methode fournit globalement les meilleurs resultats.
Aucune methode deterministe ne parait universellement meilleure.
A titre indicatif, on presente dans le tableau suivant, les valeurs daltitude interpolees
pour les differentes methodes presentees en un point quelconque de lespace. Si unemajorite des methodes fournissent des valeurs coherentes (de lordre de 670), on ne
peut pas vraiment conclure quant a la valeur exacte de laltitude du point estimee.
Pierre Bosser 32 2011-2012
-
7/24/2019 topo 111
35/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 3 Linterpolation deterministe locale
Interpolation z(s)
Thiessen 680.0000
Lineaire 674.3876Methode dAkima 675.8825
Inverse des distances (d2) 660.6881
Surface de tendance dordre 2 647.6674
Surface de tendance dordre 3 654.2670
Surface de tendance dordre 5 672.3207
Spline dinterpolation 674.7240
Spline de lissage (= 103) 668.2837
Spline de lissage (= 106) 630.6910
TAB 2 - Valeur de la variable regionalisee estimee en un
meme point par les differentes methodes : estimation de lal-
titude.
Notons enfin une limite importante des methodes ici presentees : celles-ci sap-
pliquent aveuglement sans tenir compte dune eventuelle structure spatiale de la
variable regionalisee etudiee. La surface obtenue peut certes etre esthetique, mais
pas necessairement precise. Nous allons voir par la suite des methodes permettant
la prise en compte dune eventuelle structuration spatiale en faisant appel a desmodeles probabilistes : les methodes stochastiques.
Pierre Bosser 33 2011-2012
-
7/24/2019 topo 111
36/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 4 Linterpolation stochastique
4 Linterpolation stochastique
On sinteresse desormais a lutilisation de modeles probabilistes pour la description
du comportement de la variable regionalisee. Lutilisation de telles methodes doitnous permettre egalement devaluer la precision dune estimation. On parle alors de
geostatistique: on utilise a la fois les valeurs observees et linformation de position
pour ameliorer lestimation dans le contexte spatial.
On utilise donc un modele probabiliste pour decrire le phenomene naturel a laide
dun processus aleatoire. On est cependant limite par la statistique classique qui
necessitent que les valeurs mesurees soient :
Independantes.
Identiquement distribuees.
Ces hypotheses ne sont pas verifiees dans notre contexte (dependance spatiale, condi-
tions dobservation differentes). Un nouvelle approche doit etre envisagee.
Dans ce chapitre, on suppose la notion de variable aleatoire connue. On rap-
pelle quune variable aleatoire est une fonction renvoyant une valeur resultante
dune experience aleatoire. Dans notre cas elle permet dassurer la relation entre
un phenomene et les resultats chiffres dune experience portant sur ce phenomene.
On appelle ce resultat realisation de la variable aleatoire.
4.1 Notion de fonction aleatoire
4.1.1 Definition
Le concept de fonction aleatoire fournit des outils permettant danalyser le ca-
ractere a la fois incertain et structure dun phenomene, permettant ulterieurement
destimer les valeurs en des sites inconnus (non echantillonnes). La fonction aleatoire
permet de prendre en compte le fait que la variable regionalisee peut prendre des
valeurs tres erratiques (inconstantes, ne suivent pas de modele, difficiles a predire) etque ces valeurs ne sont par vraiment independantes mais structurees dans lespace.
Pierre Bosser 34 2011-2012
-
7/24/2019 topo 111
37/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 4 Linterpolation stochastique
On rappelle que z(s) represente la valeur prise par la variable regionalisee zau site
s D. On linterprete comme une realisation dune variable aleatoire Z(s) definie
en s. On appelle alors fonction aleatoire (aussi appelee processus aleatoire ouprocessus stochastique) la famille des variables aleatoires {Z(s) /s D}.
Chaque valeur z(s) de la variable regionalisee z est donc interpretee comme un
realisation de la variable aleatoireZ(s) definie en s. La fonction aleatoire represente
lensemble des variables aleatoires qui interprete la variable regionalisee. Les differen-
tes variables aleatoires ne sont pas independantes : une correlation existe et permet
de decrire la structure de la variable regionalisee.
La variable regionalisee constitue donc une realisation de la fonction aleatoire.
4.1.2 Moments
Du point de vue mathematique, une fonction aleatoire est caracterisee par sa loi
spatiale qui correspond a la donnee de toutes les lois de probabilite de tous les
vecteurs aleatoires {Z(s1), ...Z(sn)} que lon peut extraire de la fonction aleatoire
Z(s). Pratiquement, en raison de la complexite de la determination de loi spatiale
entiere, on limite la description de la loi spatiale a ses deux premiers moments. Le but
est alors de retrouver les caracteristiques de la loi a partir de la seule connaissance
de ces 2 moments.
Moments du premier ordre : Lemoment du premier ordre dune fonction
aleatoire se situe dans le cas de letude de sa loi monovariable (soit la loi en un
site) : on sinteresse a lesperance mathematiquequi est dependante du points:
E [Z(s)] =mZ(s)
Cest la moyenne autour de laquelle les realisations en un point s de la variable
aleatoire Z(s) se distribuent. Cest une moyenne sur les realisations et non une
moyenne spatiale.
Moments du second ordre : Lesmoments du second ordrefournissent une
description de la loi spatiale bivariable de la fonction aleatoire Z(s), cest a dire
la loi de probabilite entre les valeurs prises en deux sitess1 ets2 quelconques.
Pierre Bosser 35 2011-2012
-
7/24/2019 topo 111
38/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 4 Linterpolation stochastique
La covariance centree entre Z(s1) et Z(s2) est donnee par :
cov [Z(s1) , Z(s2)] = E {[Z(s1) mZ(s1)] [Z(s2) mZ(s2)]}
= E [Z(s1) Z(s2)] mZ(s1) mZ(s2)
= C (s1, s2)
Elle caracterise le degre de ressemblance (ou correlation) entre les valeurs prises en
s1 ets2.
On appelle variance(ou variance a priori), la covariance entre la variable aleatoire
Z(s1) et elle-meme :
var [Z(s1)] = cov [Z(s1) , Z(s1)]
= E
[Z(s1) mZ(s1)]2
Elle mesure la dispersion de la variable aleatoire Z(s1) autour de sa moyenne.
Enfin, le (semi-)variogramme entre Z(s1) et Z(s2) est donne par
(s1, s2) =1
2var [Z(s1) Z(s2)]
Il caracterise la dissemblance entre les valeurs prises par la variable aleatoire entre
les sitess1 ets2. On verra par la suite que cette quantite est un outil essentiel de la
geostatistique, en particulier du krigeage.
Ces moments sont les principaux parametres de la fonction aleatoire : ils contiennent
linformation la plus pertinente et la plus utile. Ils seront largement utilises par la
suite.
4.2 Inference statistique
Nous venons dintroduire le concept de fonction aleatoire qui est loutil necessaire
a letude geostatistique dune variable regionalisee. Nous allons voir maintenant
comment rattacher la mesure dune variable regionalisee au concept de fonction
aleatoire pour pouvoir exploiter ses proprietes.
Pierre Bosser 36 2011-2012
-
7/24/2019 topo 111
39/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 4 Linterpolation stochastique
4.2.1 Definition
Linference statistique consiste a reconstituer les caracteristiques de la fonction
aleatoire (en loccurrence ses deux premiers moments) a partir dune realisation de
la variable regionalisee (soit un ensemble de donnees experimentales).
La variable regionalisee constitue une unique realisation de la fonction aleatoire : il
nexiste pas de bijection entre cette fonction et une realisation. La fonction aleatoire
ne peut donc etre definie sans ambiguite a partir de la seule variable regionalisee.
Pour permettre linference, deux hypotheses limitatives supplementaires doivent etre
realisees :
lergodicite de la fonction
la stationnarite du processusSignalons enfin quen fonction des hypotheses realisees, nous serons limites sur les
possibilites doperations a effectuer sur la fonction aleatoire.
4.2.2 Ergodicite
Lhypothese dergodicite suppose que linformation statistique peut etre obtenue
a partir dune seule realisation quelconque de la fonction aleatoire definie sur un
domaine spatial infiniment grand. Autrement dit, une realisation de la fonction
aleatoire sur un grand domaine (cest a dire pour un grand nombre de variables
aleatoires) apporte la meme information quun grand nombre de realisations de la
fonction aleatoire.
En particulier, dans notre cas, la connaissance dun grand nombre de valeurs de la
variable regionalisee (une realisation de la fonction aleatoire) est suffisant pour la
description de la fonction aleatoire (cest-a-dire la restitution de ces moments).
En particulier, la moyenne spatiale realisee sur la variable regionalisee est alors
supposee egale a lesperance mathematique de la fonction aleatoire :
mZ = E [Z(s)]
= limD+
1
D
D
z(s) ds
Letude des moments de la fonction aleatoire a partir dune realisation est alors
possible.
Pierre Bosser 37 2011-2012
-
7/24/2019 topo 111
40/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 4 Linterpolation stochastique
4.2.3 Stationnarite
Nous allons detailler de la plus exigeante a la plus flexible les differentes hypotheses
de stationnarite qui peuvent etre formulees.
Hypothese de stationnarite du second ordre : Une fonction aleatoire {Z(s)}
est ditestationnaire dordre 2quand son esperance mathematique existe et nest
pas dependante du point et que la covariance entre chaque paire
Z(s+ h), Z(s)
existe et ne depend que deh (et pas du point de lespace s) :
(1) s D, E [Z(s)] =m
(2) s D, (s+ h) D,covZ(s+ h), Z(s)
= C
h
Formule autrement, cette hypothese signifie donc que la variable regionalisee zfluc-
tue autour dune meme valeur dans lespace et que la covariance entre deux sites ne
depend pas de leur position mais du vecteur qui les separe.
Deux proprietes en decoulent :
La variance est la meme en chacun des sitess.
Le variogramme entre deux sites depend uniquement de la distance qui les separe.
(3) s D, var [Z(s)] = cov [Z(s), Z(s)] = C(0)
(4) s D, (s+ h) D,varZ(s+ h) Z(s)
/2 =(h) = C(0) C(h)
La relation (3) souligne quen chaque site, la dispersion autour de la valeur moyenne
est la meme. La relation (4) montre que la dissemblance entre deux sites est seule-
ment fonction du vecteur qui les separe. Elle souligne egalement que, sous cette
hypothese, lutilisation du variogramme ou de la covariance est equivalente pour
quantifier la dependance entre deux mesures separees par h.
Lhypothese de stationnarite dordre 2 ne peut etre validee de maniere rigoureuse
et infaillible a partir de mesures experimentales : cest une decision plus ou moins
judicieuse prise par lutilisateur.
Hypothese intrinseque : Lhypothese intrinseque est une version affaiblie de
lhypothese de stationnarite du second ordre. Elle est basee uniquement sur les
accroissements de la fonction aleatoire.
Une fonction aleatoire est dite intrinseque quand ses accroissements sont station-
Pierre Bosser 38 2011-2012
-
7/24/2019 topo 111
41/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 4 Linterpolation stochastique
naires au second ordre :
s D, (s+ h) D,
(1) EZ(s+ h) Z(s)
= 0
(2) varZ(s+ h) Z(s)
= E
Z(s+ h) Z(s)
2= 2(h)
Selon cette hypothese, lesperance des accroissements est donc nulle et sa variance
ne depend que du vecteur separant les deux points. Notons que les variance et
covariance de la fonction aleatoire ne sont pas forcement definies.
On remarque que lhypothese de stationnarite du second ordre implique lhypothese
intrinseque. La reciproque est fausse.
Hypotheses quasi-stationnaire et quasi-intrinseque : En pratique on sup-
pose que la fonction aleatoire est intrinseque mais egalement quasi-stationnaire
dordre 2 sur un domaine borne :
(1) s D,E [Z(s)] =m
(2) s D,(s+ h) D/h < b,covZ
s+ h
, Z(s)
= C
h
Il faut alors concilier deux facteurs :
La zone choisie ne doit pas etre trop etendue par rapport a la taille du champs
considere.
Le nombre de sites selectionnes ne doit pas etre trop faible.
4.2.4 Combinaisons lineaires autorisees
On a choisi dutiliser uniquement les deux premiers moments de la loi spatiale, ce
qui entraine des limites quand a la manipulation de la fonction aleatoire : on ne peututiliser que des combinaisons lineaires ponderees de Z(s), seules expressions pour
lesquelles ont peut calculer esperance et covariance.
Lhypothese de stationnarite choisie impose de plus des contraintes supplementaires
car elle ne garantit pas necessairement lexistence de lesperance et de la variance
de toutes les combinaisons lineaires ponderees. On appelle combinaison lineaire
autorisee une combinaison lineaire qui possede une esperance et une variance.
Pierre Bosser 39 2011-2012
-
7/24/2019 topo 111
42/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 4 Linterpolation stochastique
Hypothese stationnaire dordre 2 : Dans ce cas, toutes les combinaisons lin-
eaires ponderees sont autorisees :
E
i
wiZ(si)
= m
i
wi
var
i
wiZ(si)
=
i
j
wiwjC (si sj)
Hypothese intrinseque : Si la fonction aleatoire est intrinseque, seules les com-
binaisons lineaires de poids total nul sont autorisees car elles peuvent secrire sous
la forme daccroissements :
i
wi= 0
Ei
wiZ(si)
= 0
vari
wiZ(si)
= i
j
wiwj(si sj)
4.2.5 Conclusion
Le modele probabiliste constitue une meilleure alternative lorsque les donnees etu-
diees saverent complexes. Pour rendre le modele operationnel a partir dune mesure
de la variable regionalisee, il est necessaire de se ramener a des hypotheses. Les
hypotheses de stationnarite (second ordre ou intrinseque) sont choisies en fonction
de lhomogeneite des donnees.
Maintenant que nous avons detaille le choix du modele probabiliste, nous allons nous
focaliser sur un outil indispensable pour la modelisation spatiale des donnees : le
variogramme.
4.3 Analyse variographique
Nous avons vu que le variogramme refletait la structure de la regionalisation. On
appelle analyse variographique linference du variogramme a partir de donnees
experimentales. Elle permet de restituer des informations quant a la distribution spa-
tiale de la variable regionalisee, cest-a-dire de la realisation de la fonction aleatoire
dinteret. A titre de precision, on sattache usuellement a letude du variogramme
plutot que de la covariance, celle-ci netant pas necessairement definie dans le cadre
intrinseque.
Lanalyse variographique constitue une etape cruciale dans un etude geostatistique :
Pierre Bosser 40 2011-2012
-
7/24/2019 topo 111
43/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 4 Linterpolation stochastique
elle permet posterieurement destimer les valeurs inconnues de la variable regiona-
lisee et dassortir leur estimation dune precision.
4.3.1 Proprietes du variogramme
Proprietes mathematiques :
Cas stationnaire dordre 2 : dans le cas stationnaire dordre 2 le variogramme est
une fonction paire, nulle pour h = 0, positive et bornee. On dit que cest une
fonction de type negatif conditionnelle puisque elle obeit a la relation :
k N, w1,...,wk Rk/
k
i=1
wi= 0,s1, ..., sk Dk,
n
i=1
n
j=1
wiwj(si sj) 0
De plus,
limh+
(h) = C(0)
Ce palier, C(0) est atteint au niveau de la portee (distance a partir de laquelle
2 valeurs ne sont plus correlees) et correspond donc a la dissemblance maximale.
Cas intrinseque : Dans le cas intrinseque, la covariance nexiste pas forcement. Le
variogramme nest pas borne et augmente indefiniment avech. On a de plus :
(h) =o+(h2)
Anisotropie Le variogramme depend a la fois du module h deh mais aussi de
sa direction.
Comportement a lorigine Le comportement a lorigine reflete de degre de
regularite spatiale de la variable regionalisee. On distingue usuellement trois types
de comportements :
Parabolique : cas dune grande regularite spatiale avec une variable regionalisee
derivable et daspect lisse.
Lineaire : comportement moins regulier de la variable regionalisee ; regionalisation
continue mais plus derivable
Discontinu : saut abrupt a lorigine en raison de labsence (totale ou partielle) de
correlation entre les valeurs prises par deux sites proches. La variable regionalisee
est discontinue. On parle alors deffet de pepitedu fait de lexemple des teneurs
en or des gisements auriferes qui varient a tres courte echelle.
Ces differents types de comportement sont representes sur cette figure :
Pierre Bosser 41 2011-2012
-
7/24/2019 topo 111
44/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 4 Linterpolation stochastique
(a) (b) (c)
h h h
h( ) h( ) h( )
FIG 30 - Differents comportement a lorigine du vario-
gramme : (a) : comportement parabolique ; (b) : compor-
tement lineaire ; (c) : comportement discontinu.
4.3.2 Inference du variogramme
On cherche maintenant a estimer le variogramme a partie dun ensemble de donnees
experimentales {z(si)}/si D}.
Variogramme experimental : Le variogramme experimentale est calcule empi-
riquement a partir des observations de la variable regionalise. Il est donne par la
formule :(h) =
1
2|N(h)|
(i,j)N(h)
[z(si) z(sj)[2
Ou N(h) ={(i, j)/si sj =h/i=j } est lensemble des paires distinctes et |N(h)|
est le cardinal deN(h). En pratique, les donnees netant pas regulierement espacees,
on definira lensemble N(h) par N(h) ={(i, j)/si sj h /i=j }.
Le variogramme experimental est un nuage de point. Le calcul sans pas induit la
restitution dun variogramme tres bruite a partir duquel il est difficile de deduire
tout information ; Le choix dun calcul moyen par pas permet lobtention dun va-riogramme plus lisse dont les valeurs seront plus fiables.
Pierre Bosser 42 2011-2012
-
7/24/2019 topo 111
45/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 4 Linterpolation stochastique
(a) 0 50 100 150 200 250
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2x 10
4
h [m]
(h)
(b) 0 50 100 150 200 250
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2x 10
4
h [m]
(h)
(c) 0 50 100 150 200 250
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2x 10
4
h [m]
(h)
FIG 31 - Exemple de variogramme experimental calcule :
(a) sans pas, (b) pour un pas de 5 m, (c) pour un pas de 10
m.
La variogramme experimental est non biaise (E(h)
= (h)), mais sa dispersion
augmente fortement quandh devient grand. Cest un estimateur peu robuste car
sensible aux valeurs extremes ou aberrantes en particulier pour des pas faibles en
comparaison des distances entre sites dobservation.
Modelisations : Le variogramme experimental permet lestimation du variogram-
me theorique pour un nombre defini de distances, cest-a-dire uniquement des valeurs
ponctuelles. De plus, il ne respecte pas necessairement les proprietes theoriques
du variogramme (en particulier la propriete negative conditionnelle, complexe a
etablir). Lidee est donc dajuster un modele variographique classique presentant les
caracteristiques necessaires et defini pour un ensemble de vecteursr.
Pierre Bosser 43 2011-2012
-
7/24/2019 topo 111
46/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 4 Linterpolation stochastique
Lajustement se fait alors par moindre-carre en minimisant la quantite :
k
[(rk) (rk)]2
On trouve dans la litterature differents types de modele. En fonction du variogramme
experimental, on choisira le modele variographique qui sen rapproche le plus.
Modeles isotropes avec palier :
Modele pepitique de palierC : comportement discontinu a lorigine. Il est ca-
racteristique des gisements miniers, en particulier auriferes.
(r) =
0 pour r= 0
C pour r >0
C
r
(r)
(a)
FIG 32 - Modele pepitique.
Modele spherique de porteea et de palierC: lineaire a lorigine.
(r) =
C
32ra
12r3
a3
pour 0 r a
C pour r > a
Pierre Bosser 44 2011-2012
-
7/24/2019 topo 111
47/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 4 Linterpolation stochastique
a
C
r
(r)
(b)
FIG 33 - Modele spherique.
Modele cubique de porteea et de palierC : parabolique a lorigine.
(r) =
C
7 r2
a2 35
4r3
a3+ 7
2r5
a5 3
4r7
a7
pour 0 r a
C pour r > a
a
C
r
(r)
(c)
FIG 34 - Modele cubique.
Modele exponentiel de parametrea et de palierC: lineaire a lorigine.
(r) =C1 e ra
a 3a
0.95CC
r
(r)
(d)
FIG 35 - Modele exponentiel.
Pierre Bosser 45 2011-2012
-
7/24/2019 topo 111
48/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 4 Linterpolation stochastique
Modele gaussien de parametrea et de palierC :parabolique a lorigine.
(r) =C1 e r2a2
a 1.7a
0.95CC
r
(r)
(e)
FIG 36 - Modele gaussien.
Modele a effet de trou : parabolique a lorigine ; il permet de modeliser un
variogramme moins stable, presentant des fluctuations autour du palier : il est
caracteristique de donnees plus heterogenes.
(r) =C
1
sin
rara
4.49a
C
1.21C
r
(r)
(f)
FIG 37 - Modele a effet de trou.
Modeles isotropes sans palier : ils sont utilises dans le cadre non stationnaire
dordre 2 :
Modele puissance dexposant et de facteur dechel le : [0; 2]. Plus est
proche de 2, plus la variable regionalisee est reguliere. Plus est proche de 0,
plus son comportement est erratique.
(r) =r
Pierre Bosser 46 2011-2012
-
7/24/2019 topo 111
49/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 4 Linterpolation stochastique
r
(r)
(a)
FIG 38 - Modele puissance dexposant (= 0, 5)
Modele lineaire de pente : lineaire a lorigine.
(r) =r
r
(r)
(b)
FIG 39 - Modele lineaire.
Les methodes utilisees pour des modeles non-isotropes existent mais sont plus com-
plexes a mettre en uvre. On cherchera en general a se ramener a un ou plusieurs
variogramme isotrope en fonction des directions privilegiees.
4.4 Le krigeage
4.4.1 Origine de la methode
Le krigeage est une methode dinterpolation applicable a des donnees spatiales.
Elle sappuie sur la geostatistique lineaire, notamment le variogramme. La theorie
du krigeage a ete developpee par un mathematicien francais (G. Matheron) a partir
des travaux de lingenieur minier sud-africain D. G. Krige. Dans les annees 50,
Krige a developpe une serie de methodes statistiques empiriques afin de determiner
la distribution de minerais a partir dun ensemble de forages.
Pierre Bosser 47 2011-2012
-
7/24/2019 topo 111
50/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 4 Linterpolation stochastique
4.4.2 Principe
Voisinage : On appelle voisinage du krigeage le domaine du champ qui contient
le site a estimer et les donnees utilisees pour linterpolation : dans la plupart des cas,
il nest pas necessaire de prendre toutes les donnees disponibles (trop nombreuses
ou trop eloignees : le calcul en serait plus long et pas necessairement plus precis).
Les sites dinteret sont selectionnes par un critere de nombre (les n plus proches)
ou de distances (les n sites situes a une distance inferieure a rmax). En general, 15
sites sont necessaires pour une estimation optimale (trop peu de sites peut rendre
la solution moins precise : un bon compromis est donc necessaire).
Contraintes : Lobjectif est destimer le plus precisement possible la grandeurrecherchee par une combinaison lineaire ponderee des observations. Ce critere de
precision se traduit par une minimisation de lerreur quadratique moyenne. Ces
conditions se traduisent mathematiquement en 4 contraintes.
Contrainte de linearite : Lestimee doit etre une combinaison lineaire des donnees :
z(s0) =ni=1
i(s0)z(si)
Contrainte dautorisation : Lesperance et la variance de lerreur de previsionz(s0) z(s0) doivent obligatoirement exister (cette contrainte intervient dans le
cas stationnaire intrinseque puisquelles existent obligatoirement dans le cas de la
stationnarite dordre 2).
Contrainte de non biais : Lesperance de lerreur de prevision est nulle :
E [z(s0) z(s0)] = 0
Contrainte doptimalite : les poids i doivent etre estimes de maniere a minimiser
la variance de lerreur de prevision var [z(s0) z(s0)]
Estimation : On sinteresse au cas le plus commun avec letude dune seule va-
riable regionalisee, sous lhypothese de stationnarite intrinseque : on parle de kri-
geage ordinaire. Cest le type de krigeage le plus communement utilise.
Le krigeage doit donc repondre aux 4 contraintes enoncees precedemment.
Contrainte de linearite : Lestimee est donc une combinaison lineaire des observa-
tions :
Z(s0) =
ni=1 i(s0)Z(si)
Pierre Bosser 48 2011-2012
-
7/24/2019 topo 111
51/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 4 Linterpolation stochastique
Contrainte dautorisation : On doit assurer lexistence de lesperance et de la va-
riance de lerreur de prevision.
Z(s0) Z(s0) =
ni=1
i(s0)Z(si)
Z(s0)
=
ni=1
i(s0)Z(si)
ni=1
i(s0)Z(s0)
+
ni=1
i(s0)Z(s0)
Z(s0)
=
ni=1
i(s0) [Z(si) Z(s0)]
+Z(s0)
ni=1
i(s0) 1
Lerreur de prevision prend donc la forme dune combinaison lineaire daccroisse-
ments si et seulement si
ii(s0) = 1. Dans ce cas, on a bien lexistence de la
variance et de lesperance sous lhypothese de stationnarite intrinseque.
Contrainte de non biais : On doit sassurer que lestimateur de lerreur de prevision
est non biaise :
EZ(s0) Z(s0)
=
ni=1
i(s0) E [Z(si) Z(s0)]
cf. equations precedentes
Lesperance des accroissements etant nulle sous lhypothese intrinseque, on a bien
un estimateur de lerreur de prevision non biaise. Contrainte doptimalite : On cherche a minimiser lerreur de prevision Z(s0)
Z(s0). Cette minimisation sous la contrainte
ii(s0) = 1 se ramene a la recherche
des extrema du lagrangien suivant :
L(1(s0),...,n(s0), ) = E
nj=1
j(s0)Z(sj) Z(s0)
2 + 21 ni=1
i(s0)
Ourepresente un multiplicateur de Lagrange.
Apres developpement, on peut reecrire le lagrangien sous la forme :
L =ni=1
nj=1
i(s0)j(s0)ij+ 2n
j=1
j(s0)j0+ 2
1
ni=1
i(s0)
Ouij =(si, sj)
Le calcul des derivees partielles premieres de Lpar rapport aux i(s0) donne les
Pierre Bosser 49 2011-2012
-
7/24/2019 topo 111
52/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 4 Linterpolation stochastique
equations constituant le systeme krigeage :
L
i(s0) = 2
ni=1 i(s0)ij+ 2i0 2
= 0
Soit, pour tout i [1; n[,n
j=1
j(s0)ij+ = i0
Au final, le systeme a resoudre secrit donc :
n
j=1 j(s0)ij+ = i0n
j=1j(s0) = 1
Ce que lon peut reecrire sous forme matricielle :
0 12 13 . . . 1n 1
21 0 23 . . . 2n 1...
... ... . . .
... ...
n1 n2 n3 . . . 0 1
1 1 1 . . . 1 0
1(s0)
2(s0)...
n(s0)
=
10
20...
n0
1
(4)
Notons que la mise en place du systeme de krigeage necessite une unique inversion
de la matrice carree de lequation de krigeage (modele du krigeage), celle-ci etant
valide pour le domaine entier. Seul le vecteur du membre de droite doit etre calcule
en chaque point. Le vecteur estime est lui aussi valable en un point.
4.4.3 Proprietes du krigeage
La variance de lerreur destimation au point s0 est donnee par :
2(s0) = var [z(s0) z(s0)[
=ni=1
i(s0)i0+
La variance depend donc des parametres du krigeage (termes i) ainsi que de la
structure spatiale de la fonction aleatoire (variogramme).
Pierre Bosser 50 2011-2012
-
7/24/2019 topo 111
53/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 4 Linterpolation stochastique
4.4.4 Impact du modele de variogramme
On evalue en un point quelconque limpact de differents modeles de variogrammes
sur lestimation de la variable regionalisee.
Les variogrammes modelises estimes a partir du variogramme experimental sont
representes sur la figure suivante. Dapres la structure de ce dernier, on choisit de
sinteresser uniquement aux variogrammes exponentiel, gaussien et a effet de trou.
Le modele a effet de trou semble etre le plus adequat pour representer le vario-
gramme determine experimentalement : comportement plus conforme a lorigine,
meilleure restitution egalement de la dispersion. Cette dispersion nest cependant
pas representative dun phenomene physique reel, sa representation nest donc pas
forcement la plus judicieuse. Elle est vraisemblablement plutot liee au manque derobustesse de lestimateur du variogramme.
0 50 100 150 200 2500
1000
2000
3000
4000
5000
6000
7000
8000
h [m]
(h)
FIG 40 - Variogramme experimental et differents modeles
variographiques associes : modeles exponentiel (magenta),
gaussien (vert) et a effet de trou (rouge).
Les valeurs estimees a laide du krigeage pour ces differents modeles de vario-
grammes, ainsi que leur precision, sont presentees dans le tableau suivant. On
constate que la variance de lestimateur est minimale pour un modele de vario-
gramme de type exponentiel.
Pierre Bosser 51 2011-2012
-
7/24/2019 topo 111
54/55E
NSG/
DP
TS
INTERPOLATION SPATIALE 4 Linterpolation stochastique
Modele Valeur estimee Incertitude formelle
Exponentiel 653.2109 0.2729
Gaussien 660.6695 0.1796Effet de trou 671.9119 0.4602
TAB 3 - Interpolation par krigeage en un point quelconque
pour differents modeles de variogramme.
La surface obtenue par krigeage a partir du jeu dobservation dont on dispose est
alors :
140160
180200
220240
260280
120
140
160
180
200
220
240
400
500
600
700
800
Y
X
Z
FIG 41 - Krigeage : application sur un champ dobservations
- vue en perspective.
4.5 Conclusion
La geostatistique permet de modeliser la structure du phenomene regionalise etudie
a laide doutils simples (covariance et/ou variogramme) et de resoudre efficacement
les problemes dinterpolation.
Letude geostatistique debute avec lanalyse variographique qui consiste a estimer
le variogramme experimental et a le modeliser a laide dune fonction standard.
Le modele variographique peut alors etre utilise pour construire un systeme de
krigeage qui permettre dobtenir des estimations locales et les variances destimation
Pierre Bosser 52 2011-2012
-
7/24/2019 topo 111
55/55
NSG/
DP
TS
INTERPOLATION SPATIALE 5 Conclusion
associees.
5 Conclusion
Nous avons aborde deux types de methodes pour la resolution des problemes din-
terpolation spatiale :
Les methodes deterministes globales : elles permettent lestimation de la moyenne
sur un domaine donne dune grandeur mesuree en differents points dobservation.
Elles sont basees sur des proprietes purement geometriques de lechantillon dob-
servation.
Les methodes deterministes locales : elles sont aussi basees sur des proprietespurement geometriques de lechantillon dobservation et ne permettent pas une
evaluation de leur precision. Il est de plus generalement difficile de conlcure quant
a la fiabilite globale dune technique deterministe.
Les methodes stochastiques : elles font appel a un modele cense mieux sadapter
aux donnees observees. Ce modele permet lestimation de la variable en des sites
non echantillonnes apres letude de la distribution spatiale (variogramme) de la
variable.
Lutilisation de techniques de validation croisee (bootstrap) permet de controler la
conformite du modele choisi a la realite.