topo 111

7/24/2019 topo 111

1/55E

NSG/

DP

TSInterpolation spatiale

Pierre Bosser

([email protected])

Ecole Nationale des Sciences Geographiques

Departement Positionnement Terrestre et Spatial

Annee Scolaire 2011-2012

7/24/2019 topo 111

2/55

EN

SG/DP

7/24/2019 topo 111

3/55E

NSG/

DP

TS

INTERPOLATION SPATIALE Table des matieres

Table des matieres

1 Introduction 3

1.1 Objectifs du cours. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.2 Notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.3 Caracteristiques des methodes dinterpolation . . . . . . . . . . . . . 4

1.4 Representations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.5 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2 Linterpolation deterministe globale 10

2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.2 Polygone de Thiessen . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.3 Methode des cellules . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.4 Conclusion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

3 Linterpolation deterministe locale 15

3.1 Polygones de Thiessen . . . . . . . . . . . . . . . . . . . . . . . . . . 15

3.2 Interpolation a partir dune triangulation . . . . . . . . . . . . . . . . 16

3.2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

3.2.2 Interpolation lineaire . . . . . . . . . . . . . . . . . . . . . . . 17

3.2.3 Methode dAkima. . . . . . . . . . . . . . . . . . . . . . . . . 19

3.3 Methodes barycentriques . . . . . . . . . . . . . . . . . . . . . . . . . 22

3.3.1 Inverse des distances . . . . . . . . . . . . . . . . . . . . . . . 22

3.3.2 Interpolation bilineaire . . . . . . . . . . . . . . . . . . . . . . 24

3.4 Les surfaces de tendances. . . . . . . . . . . . . . . . . . . . . . . . . 25

Pierre Bosser 1 2011-2012

7/24/2019 topo 111

4/55E

NSG/

DP

TS

INTERPOLATION SPATIALE Table des matieres

3.5 Les splines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3.5.1 Generalites . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3.5.2 Spline dinterpolation. . . . . . . . . . . . . . . . . . . . . . . 27

3.5.3 Les splines de lissage . . . . . . . . . . . . . . . . . . . . . . . 29

3.6 Conclusion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

4 Linterpolation stochastique 34

4.1 Notion de fonction aleatoire . . . . . . . . . . . . . . . . . . . . . . . 34

4.1.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

4.1.2 Moments. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4.2 Inference statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

4.2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

4.2.2 Ergodicite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

4.2.3 Stationnarite . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

4.2.4 Combinaisons lineaires autorisees . . . . . . . . . . . . . . . . 39

4.2.5 Conclusion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

4.3 Analyse variographique . . . . . . . . . . . . . . . . . . . . . . . . . . 40

4.3.1 Proprietes du variogramme. . . . . . . . . . . . . . . . . . . . 41

4.3.2 Inference du variogramme . . . . . . . . . . . . . . . . . . . . 42

4.4 Le krigeage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

4.4.1 Origine de la methode . . . . . . . . . . . . . . . . . . . . . . 47

4.4.2 Principe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

4.4.3 Proprietes du krigeage . . . . . . . . . . . . . . . . . . . . . . 50

4.4.4 Impact du modele de variogramme . . . . . . . . . . . . . . . 51

4.5 Conclusion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

5 Conclusion 53


7/24/2019 topo 111

5/55E

NSG/

DP

TS

INTERPOLATION SPATIALE 1 Introduction

1 Introduction

1.1 Objectifs du cours

A partir dobservations georeferencees, pas necessairement reparties regulierement,

on cherche a estimer les valeurs prises par le parametre observe en dautres points

de lespace. On parle alors destimation spatiale : cest une procedure consistant

a estimer la valeur dune grandeur en un site a partir de dechantillons de cette

grandeur recoltes dans dautres sites.

Ce besoin sapplique a de nombreux domaines ou la connaissance de la distribu-

tion spatiale de phenomenes est importante : altimetrie, gravimetrie, meteorologie,

geologie, etc.

Lors de ce cours, nous allons donc etudier les methodes permettant lestimation

et linterpolation de donnees georeferencees. Ce cours sera une introduction aux

differentes methodes existantes, mais pas une etude exhaustive (base pour des etudes

plus approfondies). Les idees developpees ici sont largement inspirees des ouvrages

suivants :

Akima, H., A method of bivariate interpolation and smooth surface fitting for

values given at irregularly distributed points ,OT Report 75-70, U.S. Department

of Commerce.

Arnaud, M. & Emery, X., Estimation et interpolation spatiale : methodes

deterministes et geostatistiques , Hermes, 2000.

Baillargeon, S., Le krigeage : revue de la theorie et application a linter-

polation spatiale de donnees de precipitation , Memoire de M. Sc., Universite

LAVAL, 2005.

Verdun, J., Methodes destimation et dinterpolation spatiales ,Cours donne

aux IT2, ENSG, 2006.


7/24/2019 topo 111

6/55E

NSG/

DP

TS


1.2 Notations

On definit unevariable regionalisee comme etant une fonction numerique prenant

ses valeurs dans une region limitee, appelee champ.

Par la suite, on utilisera les notations suivantes :

z, la variable regionalisee.

D, le champ de la regionalisation, cest a dire le domaine dans lequel la variable

regionalisee est definie. En general, D R, R2 ou R3.

s D, le vecteur de coordonnees (x,y,z) qui indique la position dun site dans le

champ D.

z(s), la valeur prise par la variable regionalisee zau sites D.

z(V), la valeur moyenne de zsur le domaine V D. n, le nombre de sites ou la variable a ete mesuree.

z(s1),...,z(sn), les valeurs prises par zaux sites dobservation s1...sn.

z(s0), une estimation de z(s0) avecs0 D.

1.3 Caracteristiques des methodes dinterpolation

Dans le cas general, la variable regionalisee ne peut etre representee par une fonction

mathematique explicite. Cependant, elle presente une structuration spatiale biendefinie, avec une correlation des valeurs prises en deux sites proches. Ceci rend

possible la prevision dune valeur inconnue a partir dobservations. On parle ainsi

dinterpolation pour lestimation de cette valeur. On parle dextrapolation lorsque

le site inconnu est situe hors des limites du domaine geographique engendre par

lechantillonnage des sites dobservation.

On sinteresse dans de ce cours a ces methodes de prevision. Elles se divisent usuelle-

ment en deux groupes, selon les modeles mathematiques sur lesquels elles reposent :

Methodes deterministes : elles reposent sur des proprietes purement mathema-

tiques, generalement geometriques, sans tenir compte du phenomene physique qui

nous interesse.

Methodes stochastiques: elles font appel a des modeles probabilistes et decou-

lent de lanalyse statistique des donnees considerees. On parle alors de techniques

geostatistiques.


7/24/2019 topo 111

7/55E

NSG/

DP

TS


Ralit Physique Modle dterministe Modle probabiliste

f 2 Dgz s s( )/ f 2 DgZ s s( )/

Variable rgionalise Fonction alatoirePhnomne naturel

Valeurs rgionalises Variables alatoires

Interpolation spatialedterministe

Interpolation spatialestochastique

z s i n( ) = 1, ...,i pour Z s i n( ) = 1, ...,i pour

FIG 1 - Methodes deterministes et stochastiques : un

phenomene physique observe en certains sites peut etre es-time en des sites quelconques via lutilisation de methodes

deterministes (basees sur de simples constats geometriques)

ou de methodes stochastiques (basees sur des constats sta-

tistiques).

On differencie egalement ces methodes selon quelles soient globales ou locales. Une

methode globale consiste a calculer la moyenne de la variable generalisee sur le

champ a partir de lensemble des observations disponibles ; une methode locale

realise une estimation de cette moyenne sur une partie plus reduite du champ, voire

en un site ponctuel.

Une methode exacte conserve les valeurs des echantillons originaux, contrairement

a une methode approchee.

Enfin, on parle deffet decran lorsquune observation commande limpact dune

autre observation lors de linterpolation. Linfluence de lobservation ecrantee se-

ra alors :

nulle dans le cas dun ecran total,

peu elevee dans le cas dun ecran partiel,

moderee dans le cas dun ecran faible.


7/24/2019 topo 111

8/55E

NSG/

DP

TS


S3

S2

S1

S6

S5

S0S

7

FIG 2- Effet decran : le site S7 peut potentiellement mas-

quer le siteS6; linterpolateur va donner moins dimportance

au site masque, S6, par rapport au site masquant S7.

1.4 Representations

A partir dun champ dont on connait certaines valeurs prises par la variable regionali-

see, on veut deduire la representation densemble de cette variable sur le champ.

Cette representation peut se faire sous la forme :

de lignes de niveau,

de niveaux de couleur,

dune perspective 3D, etc.

On retrouve sur les figures suivantes differents modes de representation du champ

interpole.

140 160 180 200 220 240 260 280

120

140

160

180

200

220

240

X

Y

FIG 3 - Exemple de representation dune variable re-

gionalisee : sites dobservation.


7/24/2019 topo 111

9/55E

NSG/

DP

TS


140 160 180 200 220 240 260 280

120

140

160

180

200

220

240

X

Y

140 160 180 200 220 240 260 280

120

140

160

180

200

220

240

X

Y

500

550

600

650

700


gionalisee : representations planes.

140160

180 200220

240260

280

120

140

160

180

200

220

240

400

500

600

700

800

Y

X

Z

140160

180 200220

240260

280

120

140

160

180

200

220

240

400

500

600

700

800

Y

X

Z

140160

180200

220240

260280

120

140

160

180

200

220

240

400

500

600

700

800

Y

X

Z

500

550

600

650

700


gionalisee : perspectives.


7/24/2019 topo 111

10/55E

NSG/

DP

TS


1.5 Applications

Linterpolation spatiale est outil que lon retrouve dans differents domaines. Citons

par exemple :

En meteorologie : mesures sol du champ de pression, de temperature, dhumidite,

de pluviometrie.

En geodesie : mesures du champ de gravite, retards tropospheriques et iono-

spheriques, hauteur du geode.

En geologie : teneur du sol en elements mineraux.

Les figures suivantes presentent differentes visualisations dinterpolation spatiale

dun jeu dobservation (pression, temperature, pluviometrie, retards tropospherique

GPS, anomalie de gravite).

FIG 6 - Exemple dobservations interpolees spatialement :

mesures de pression, temperature, precipitation (

Meteo-

France).


7/24/2019 topo 111

11/55E

NSG/

DP

TS


FIG 7 - Exemple dobservations interpolees spatialement :retards tropospheriques GPS (

RGP / IGN), anomalies

de gravite (

LAREG / IGN) et temperature a 500 m de

profondeur (

BRGM).


7/24/2019 topo 111

12/55E

NSG/

DP

TS

INTERPOLATION SPATIALE 2 Linterpolation deterministe globale

2 Linterpolation deterministe globale

2.1 Definition

Lestimation globale vise a estimer la moyenne arithmetique dune ensemble dob-

servations (valeurs de la variable regionalisee) dans un domaine geographique (le

champ). Cette estimation nest pas triviale puisque les observations ne sont pas

forcement representatives et peuvent presenter une densite differentes en fonction

de la zone du champ, donnant alors une influence trop importante a certaines parties

de la zone etudiee.

Deux solutions sont alors envisageables. La premiere consiste en une selection des

donnees observees. Le probleme reside alors dans le choix des observations a prendre

en compte. Aucun critere objectif ne peut permettre detre certain ni de la qua-

lite ni de la pertinence des observations choisies. Une seconde solution consiste a

ponderer lensemble des observations lors du calcul de la moyenne. Nous allons ici

nous interesser a des methodes globales basees sur cette solution.

2.2 Polygone de Thiessen

Pour tous les points dobservation du champs, on definit un polygone dinfluence tel

que chaque point du polygone est plus proche du point dobservation que de tout

autre site :

s Pi, sj D Pi, si s sj s

D est alors partitionne en une famille de polygone convexes, nommes polygone de

Thiessen(aussi appeles polygones de Voronoi ou cellules de Dirichlet).


7/24/2019 topo 111

13/55E

NSG/

DP

TS


S3

S2

S1

S6

S5

S0

FIG 8 - Construction des polygones de Thiessen.

Les observations groupees vont ainsi se voir affecter un polygone dinfluence de petite

surface, les donnees isolee un polygone de grande surface. Notons que le decoupagede Thiessen depend uniquement de la configuration geometrique et non pas des

valeurs observees. Les polygones ne sont pas necessairement fermes dans certaines

directions de lespace : il faut ainsi limiter la partition aux frontieres de D, ou fixer

une distance dinfluence limite.

S3

S2

S1

S6

S5

S0

FIG 9 - Decoupage en polygones de Thiessen.

Les surfaces des polygones de Thiessen ainsi obtenus vont alors permettre la ponde-

ration des observations pour le calcul de la moyenne de la variable regionalisee sur

le champ detude :

z(D) =ni=1

|Pi|

|D|zsi (1)

Ou |Pi| est laire du polygone Pi associee au sitesi et |D|laire du champ :

|D| =ni=1

|Pi| (2)

Par construction, les zones a observations denses sont les zones a polygones de

Thiessen de surface moindre : linfluence de ces zones est donc limitee.


7/24/2019 topo 111

14/55E

NSG/

DP

TS


140 160 180 200 220 240 260 280100

150

200

250

X

Y

FIG 10 - Exemple de decoupage en polygones de Thiessen.

2.3 Methode des cellules

La methode des cellules consiste a diviser le champ en cellules rectangulaires de

meme taille, contenant chacune un nombre variable de sites dobservation. La pon-

deration des observations lors de lestimation globale est realisee a laide du nombre

de sites contenus dans chaque cellule.

La procedure destimation est la suivante :

1. On calcule la moyenne des sites dobservations contenus dans chaque cellule.

2. On calcule ensuite la moyenne des moyennes de toutes les cellules, sans pon-

deration.

Lestimation globale du champ etudie est donc donne par la formule :

z(D) = 1

N

N=1

ni=1

s(i)

(3)

OuNest le nombre de cellules de decoupage du domaineD contenant au moins un

site dobservation,s(i) les sites dobservation localises dans la cellule.

En pratique, on repete lalgorithme plusieurs fois (5 a 10) avec differents decoupages

dans le but dobtenir une estimation globale independante du reseau.


7/24/2019 topo 111

15/55E

NSG/

DP

TS


Notons que si la taille des cellules est trop petite, chacune contiendra au plus un

site dobservation et les donnees auront toutes le meme poids. Si la taille est trop

grande, toutes les observations appartiendront a la meme cellule et auront doncle meme poids. Dans ces 2 cas, lestimation globale reviendra alors a calculer la

moyenne arithmetique de toutes les observations.

140 160 180 200 220 240 260 280100

150

200

250

X

Y

FIG 11 - Exemple de decoupage en cellules.

2.4 Conclusion

Les methodes destimation globale presentees ici reposent uniquement sur la confi-

guration geometrique des donnees. Elles permettent donc de quantifier la quantite

totale ou moyenne dun ensemble dobservations de repartition variable dans les-

pace.

Les methodes abordees sont appliquees sur un jeu de donnees test (tableau suivant).

Mis a part un cas (decoupage en cellules de taille minimale), on observe que les

resultats obtenus sont dans lensemble relativement homogene.


7/24/2019 topo 111

16/55E

NSG/

DP

TS


Interpolation z(D)

Polygones de Thiessen 620.6693

Cellules, pas de 1 m 609.9030Cellules, pas de 10 m 615.4803

Cellules, pas de 20 m 618.9132



TAB 1- Estimation globale par differentes methodes : esti-

mation de laltitude moyenne.

Il est cependant plus important de pouvoir localiser / cartographier les zones defortes valeurs et celles de valeurs moindres : cest le but de lestimation locale que

nous allons voir par la suite.


7/24/2019 topo 111

17/55E

NSG/

DP

TS

INTERPOLATION SPATIALE 3 Linterpolation deterministe locale

3 Linterpolation deterministe locale

Nous nous interessons ici aux methodes deterministes pour lestimation locale et

ponctuelle dune valeur de la variable regionalisee. Cette estimation sera realisee apartir de combinaisons lineaires des observations en tenant compte de leur dispo-

sition les unes par rapport aux autres mais aussi de la distance entre le secteur a

estimer et les points de donnees.

3.1 Polygones de Thiessen

Nous avons aborde precedemment lutilisation des polygones de Thiessen dans le cas

de lestimation globale. Linterpolation par la methode de Thiessen consiste a affec-

ter a lensemble des points dun polygone donne la valeur de la variable regionalisee

correspondante (on parle aussi de plus proche voisin). On obtient alors une sur-

face discontinue; ces discontinuites nont rien a voir avec de possibles discontinuites

reelles, mais sont simplement liees a la configuration geometrique des observations.

On trouve dans la litterature differentes methodes pour palier ce probleme de discon-

tinuites (methode de Sibson par exemple basee sur linterpolation par combinaison

lineaire des valeurs aux sommets voisins).

S?

S3

S2

S1

S6

S5

S0

FIG 12 - Interpolation par la methode de Thiessen (plus

proche voisin).


7/24/2019 topo 111

18/55E

NSG/

DP

TS


Sur la figure suivante, on represente un exemple dinterpolation par plus proche voi-

sin. On remarque que le resultat obtenu est peu esthetique en raison des nombreuses

discontinuites.

140160

180200

220240

260280

120

140

160

180

200

220

240

400

500

600

700

800

Y

X

Z

FIG 13 - Interpolation par plus proche voisin : application

sur un champ dobservations - vue en perspective.

3.2 Interpolation a partir dune triangulation

3.2.1 Definition

La triangulation consiste a diviser le champ en triangles disjoints dont les sommets

sont les sites dobservation. On calcule alors la valeur en un point donne a partir

des valeurs des sommets du triangle auquel il appartient.

Il existe plusieurs methode de triangulation, la plus utilisee etant la triangulation

de Delaunay : les sommets de chaque triangle sont les sites du champ D tels que

les polygones de Thiessen associes ont un cote en commun. Notons les proprietes

dune telle triangulation :

La triangulation est independante de lordre de traitement.

Lensemble du domaine nest pas recouvert : on opere uniquement dans lenveloppe

convexe des sites.

Les cercles circonscrits a chacun des triangles ne contiennent pas dautre site

dobservation.


7/24/2019 topo 111

19/55E

NSG/

DP

TS


Tous les points sont relies a leur plus proche voisin.

S?

S3

S2

S1

S6

S5

S0

FIG 14 - Triangulation de Delaunay.

Il existe plusieurs methodes pour linterpolation de donnees a partir dune triangu-lation. Ici, deux dentres elles seront exposees.

3.2.2 Interpolation lineaire

On considere le triangle (s1, s2, s3) contenant le point dinteret s. La valeur re-

cherchee de la variable regionalisee secrit sous la forme :

z(s) = z(x, y) = x+ y+

S2S1

S3

S?

FIG 15 - Interpolation lineaire : Geometrie du probleme.

La solution est determinee a partir dune combinaison lineaire des valeur observees

au sommet du triangle en resolvant le systeme :

x1+ y1+ = z1

x2+ y2+ = z2

x3+ y3+ = z3

Ou zi=z(si).


7/24/2019 topo 111

20/55E

NSG/

DP

TS


Lequation matricielle secrit sous la forme :

x1 y1 1x2 y2 1

x3 y3 1

= z1

z2

z3

On peut alors montrer que cette solution secrit sous la forme :

z(s) = |s1, s, s2| z3+ |s1, s, s3| z2+ |s2, s, s3| z1

|s1, s2, s3|

Ou |s1, s2, s3| represente laire du triangle forme par les vecteurs (s1, s2, s3) : la

solution devient donc la somme ponderee des aires des triangles formes par les 3sommets et le point dinteret.

S2 S1

S3

j jS SS2 3, ,

j jS S S1 2, ,

jS S S1 3, , j

S2 S1

S3

j 2 3, ,S S Sj

j jS S S1 2, ,

j jS SS1 3, ,

FIG 16- Interpolation lineaire : interpretation geometrique

de la solution : plus le point auquel on souhaite estimer la

valeur de la variable regionalisee est proche dun site dob-

servation, plus la proportion de surface occupee par le tri-

angle oppose a ce sommet est importante ; le poids associe

est donc plus important et la valeur estimee proche de celle

du sommet.

Chaque site dobservation recoit donc un poids egal a la proportion de surface oc-

cupee par le triangle qui lui est oppose : plus le point recherche est proche dun

site dobservation plus la valeur de la variable regionalisee est proche de la valeurobservee en ce site.

Un exemple de cette methode dinterpolation est represente ci-dessous.


7/24/2019 topo 111

21/55E

NSG/

DP

TS


140160

180 200220

240260

280

120

140

160

180

200

220

240

400

500

600

700

800

Y

X

Z

FIG 17 - Interpolation lineaire : application sur un champ

dobservations - vue en perspective. On observe laspect py-

ramidal de la surface obtenue.

Linterpolation lineaire presente les proprietes suivantes :

Lestimation est unique pour une triangulation donnee. Cette methode est exacte.

La surface obtenue est continue ; elle est composee de pyramides juxtaposees.

Lextrapolation nest pas possible au dela de lenveloppe convexe des sites dob-

servation.

3.2.3 Methode dAkima

La methode dAkima est une autre methode dinterpolation a partir dune triangu-

lation. On ajuste cette fois-ci a chaque triangle une surface dont lequation est un

polynome de degre 5 :

z(s) = z(x, y) =5

j=0

5jk=0

jkxjyk

Il faut donc 21 conditions pour determiner les 21 coefficients jk :

les 3 premieres conditions sont obtenues a partir des valeurs prises par la variable


7/24/2019 topo 111

22/55E

NSG/

DP

TS


regionalisee aux 3 sommets de chaque triangle :

z(s1), z(s2), z(s3)

6 autres conditions sont obtenues a partir des derivees premieres aux sommets de

chaque triangle :

z

x(s1),

z

y(s1)

z

x(s2),

z

y(s2)

z

x

(s3), z

y

(s3)

9 autres conditions sont obtenues a partir des derivees secondes aux sommets de

chaque triangle :

2z

x2(s1),

2z

y2(s1) ,

2z

xy(s1)

2z

x2(s2),

2z

y2(s2) ,

2z

xy(s2)

2z

x2(s3),

2z

y2(s3) ,

2z

xy(s3)

Les 3 dernieres conditions sont obtenues a laide de considerations de continuite

et de derivabilite aux limites de chaque triangle. La derivee partielle de la fonc-

tion dinterpolation dans la direction normale a chaque cote du triangle est un

polynome de degre 3, au plus, de la variable mesuree selon ce cote.

5z

nt4(s1) = 0,

5z

nt4(s2) = 0,

5z

nt4(s3) = 0

S2 S1

S3

S?

n1 t1n2

t2

n3

t3

FIG 18 - Interpolation dAkima : Geometrie de la solution.


7/24/2019 topo 111

23/55E

NSG/

DP

TS


La derniere condition assure donc la continuite et la derivabilite de la surface ob-

tenue. Le passage (x, y) (n, t) est lineaire : les valeurs de la fonction et de ses

derivees partielles premieres et secondes selonxet y suffisent donc a determiner lesvaleurs de la fonction et de ses derivees selon net taux sommets.

Ainsi, En limite de 2 triangles, la section de la surface est un polyn ome de degre

5 en t ; ses coefficients sont donnes par les valeurs de la fonction et de ses derivees

aux sommets : on a donc continuite de la surface. Sur chaque cote dun triangle, les

derivees premiere selonn et seconde selonn puist aux sommets permettent decrire

la derivee premiere selon n sous forme dun unique polynome de degre 3, en t : on

a donc egalement la derivabilite.

Pour calculer les derivees partielles en chaque sommet du triangle, Akima proposelutilisation des sites (entre 3 et 5) les plus proches de chaque sommet du triangle.

Les derivees premieres sont obtenues en estimant le plan moyen (par rapport aux

differents sites voisins choisis) passant par le sommet dinteret. Les derivees se-

condes sont calculees en repetant cette operation, mais cette fois-ci en considerant

les derivees premieres au lieu des valeurs de la variable regionalisee.

Bien quen apparence complexe, limplementation de cette methode est relativement

directe (un formulaire complet existe).

Cette methode est assez efficace puisque robuste et rapide. Elle est exacte et permetlestimation dune surface continue et derivable. Il existe des variantes permettant

une extrapolation au dela de lenveloppe convexe formee par lensemble des triangles.


7/24/2019 topo 111

24/55E

NSG/

DP

TS


140160

180 200220

240260

280

120

140

160

180

200

220

240

400

500

600

700

800

Y

X

Z

FIG 19 - Interpolation par la methode dAkima : applica-

tion sur un champ dobservations - vue en perspective. On

observe que la surface obtenue est beaucoup plus esthetique

que celle issus dune interpolation lineaire.

3.3 Methodes barycentriques

Netant pas limitees au voisinage direct du point dinteret, les methodes barycen-

triques presentent lavantage de prendre en compte plus de donnees du champ dob-

servation. Un poids plus important est affecte aux sites les plus proches, un poids

moindre aux sites plus eloignes.

3.3.1 Inverse des distances

Cest la methode barycentrique la plus employee. elle consiste a attribuer un poids

inversement proportionnel a la distance entre les sites et le point a estimer :

z(s) =

ni=1

z(si)

si sni=1

1

si s

On peut generaliser cette formule en prenant comme ponderation une puissance p


7/24/2019 topo 111

25/55E

NSG/

DP

TS


de la distance entre sites et point a estimer

p 0 : moyenne arithmetique

p + : methode de Thiessen

140160

180200

220240

260280

120

140

160

180

200

220

240

400

500

600

700

800

Y

X

Z

FIG 20 - Interpolation barycentrique par inverse des dis-

tances : application sur un champ dobservations - vue en

perspective.

Cette methode dinterpolation est exacte et fournit une surface continue. Les valeurs

interpolees sont limitees par les valeurs minimale et maximale du champ dobserva-

tion, la ponderation etant positive.

Elle presente cependant quelques inconvenients. Elle est indifferente a la configu-

ration geometrique des observations, seule la distance compte. Elle tend a sur-

ponderer les donnees groupees alors quelles sont redondantes. Les cartes disovaleur

presentent des structures en forme dil de bufautour des sites dobservationen raison de linfluence du site le plus proche. Plus la puissance de la distance est

elevee, plus cet est important.


7/24/2019 topo 111

26/55E

NSG/

DP

TS


140 160 180 200 220 240 260 280

120

140

160

180

200

220

240

X

Y

FIG 21 - Interpolation barycentrique par inverse des dis-

tances : application sur un champ dobservations - repre-

sentation par courbes de niveau, vue de dessus. On distingue

nettement leffet doil de buf lie a lutilisation de cette

methode.

3.3.2 Interpolation bilineaire

Linterpolation bilineaire necessite un echantillonnage regulierdes sites dobser-

vation. On cherche les quatre points entourant le point dinteret. On effectue alors

une interpolation a laide de linverse des distances. Linterpolation est exacte et

restitue une surface continue. Les calculs sont rapides.

Si j, Si j+1,

Si j+1, +1Si j, +1

S

a1

b2

b1

a2

z2z1

FIG 22

- Interpolation bilineaire : geometrie de la solution.


7/24/2019 topo 111

27/55E

NSG/

DP

TS


Le valeur de la variable regionalisees au points est donnee par :

z(s) =a1z1+a2z2

a1+a2

Avec :

z1 = b1zi+1,j+1+b2zi,j+1

b1+b2

z2 = b1zi+1,j+ b2zi,j

b1+b2

Comme nous lavons dit, cette methode necessite un echantillonnage regulier des

sites dobservation, ce qui la rend inutilisable dans la majorite des cas.

3.4 Les surfaces de tendances

On cherche a ajuster par moindre-carre une surface polynomiale aux valeurs ob-

servees. Cette surface se presente sous la forme :

z(s) = z(x, y) =pi=0

pij=0

ijxiyj

Ou p est le degre du polynome ou ordre de la surface. Les ij sont obtenus par

minimisation de la quantiten

i=1[z(si) z(si)]2 par moindre-carre par exemple. Il

faut alors que le degre du polynome verifie 12

(p+ 1)(p+ 2) n. Linversion peut

secrire sous la forme matricielle suivante :

x01y

01 . . . x

01y

p1 . . . x

p1y

01

... . . . ... . . .

...

x0ny0n . . . x0nypn . . . xpny0n

0,0...

0,p

...p,0

= z1

...

zn

On represente sur les figures suivantes, linterpolation par des surfaces de tendance

dordre respectif 2, 3 et 5.


7/24/2019 topo 111

28/55E

NSG/

DP

TS


140160

180 200220

240260

280

120

140

160

180

200

220

240

400

500

600

700

800

Y

X

Z

FIG 23 - Interpolation par une surface de tendance dordre

2 : application sur un champ dobservations - vue en pers-

pective.

140160

180200

220240

260280

120

140

160

180

200

220

240

400

500

600

700

800

Y

X

Z



pective.


7/24/2019 topo 111

29/55E

NSG/

DP

TS


140160

180 200220

240260

280

120

140

160

180

200

220

240

400

500

600

700

800

Y

X

Z



pective.

La solution est unique. Linterpolateur est approche. La duree du calcul depend de

lordre de la surface.

Les test statistiques concernant la significativite des resultats sont a utiliser avec

prudence car ils reposent sur une hypothese dindependance des valeurs, ce qui est

rarement verifie dans le contexte spatial.

3.5 Les splines

3.5.1 Generalites

Les splines sont une famille de fonctions qui minimisent lenergie de flexion sous

certaines contraintes dajustement. Dans notre contexte, il existe deux categories

de fonctions de splines : les splines dinterpolation qui passent exactement par les

points dobservation et les splines de lissage qui passent a proximite.

3.5.2 Spline dinterpolation

On desire obtenir une fonction qui soit la plus lisse possible tout en restituant

les valeurs mesurees aux differents sites dobservation. Cette fonction (notee z(s))


7/24/2019 topo 111

30/55E

NSG/

DP

TS


represente la surface par une plaque mince et flexible que lon contraint a passer par

chaque site. Elle doit ainsi minimiser lenergie de flexion :

2z

x2+ 2

2z

xy+

2z

y2dxdy

Avec comme contrainte z(si) =z(si).

On peut montrer que la fonction spline solution secrit alors sous la forme :

z(s) = z(x, y) =a0+a1x+a2y+ni=1

biK(s si)

Avec :

K(h) =h2 ln(h)

Les inconnues a0, a0, a0, b1, ..., bn sont solutions du systeme suivant :

a0+a1xi+a2yi+n

j=1,j=ibjK(si sj) =z(si)

nj=1

bj = 0,n

j=1bjxj = 0,

nj=1

bjyj = 0

On traduit ce systeme sous forme matricielle :

1 x1 y1 0 . . . K 1,n...

... ...

... . . . ...

1 xn yn Kn,1 . . . 0

0 0 0 1 . . . 1

0 0 0 x1 . . . xn

0 0 0 y1 . . . yn

a0

a1

a2

b1...

bn

=

z1...

zn

0

0

0

Lestimation en un point donne necessite la resolution den+3 equations. Lexistence

et lunicite de la solution sont garanties lorsque les points ne sont pas alignes. Lessplines dinterpolation sont des interpolateurs exacts.


7/24/2019 topo 111

31/55E

NSG/

DP

TS


140160

180 200220

240260

280

120

140

160

180

200

220

240

400

500

600

700

800

Y

X

Z

FIG 26 - Interpolation par spline dinterpolation : applica-

tion sur un champ dobservations - vue en perspective.

3.5.3 Les splines de lissage

Il peut etre judicieux dans certaines situations (mesures presentant une incertitude

importante) de chercher une surface qui sapproche au mieux des observations tout

en restant la plus lisse possible. Dans R2, on traduit ces conditions en cherchant a

minimiser la fonction qui minimise :

ni=1

[z(si) z(si)]2 +

2z

x2+ 2

2z

xy+

2z

y2dxdy

Ou est un parametre strictement positif et fixe a priori.

On peut montrer que la solution se presente alors sous la forme de la solution obtenue

dans le cas des splines dinterpolation :

z(s) = z(x, y) =a0+a1x+a2y+ni=1

biK(s si)

Avec :

K(h) =h2 ln(h)


7/24/2019 topo 111

32/55E

NSG/

DP

TS


Les inconnues a0, a0, a0, b1, ..., bn sont solutions du systeme suivant :

a0+a1xi+a2yi+bi+

nj=1,j=i

bjK(si sj) =z(si)

nj=1

bj = 0,n

j=1bjxj = 0,

nj=1

bjyj = 0

On traduit ce systeme sous forme matricielle :

1 x1 y1 . . . K 1,n...

... ...

... . . .

...

1 xn yn Kn,1 . . .

0 0 0 1 . . . 1

0 0 0 x1 . . . xn

0 0 0 y1 . . . yn

a0

a1

a2

b1...

bn

=

z1...

zn

0

0

0

140160

180200

220240

260280

120

140

160

180

200

220

240

400

500

600

700

800

Y

X

Z

FIG 27 - Interpolation par spline de lissage - = 103 : ap-

plication sur un champ dobservations - vue en perspective.


7/24/2019 topo 111

33/55E

NSG/

DP

TS


140160

180 200220

240260

280

120

140

160

180

200

220

240

400

500

600

700

800

Y

X

Z

FIG 28 - Interpolation par spline de lissage - = 106 : ap-

plication sur un champ dobservations - vue en perspective.

La surface obtenue tend vers un plan.

Le terme permet de faire un compromis entre la contrainte dajustement et cont-

rainte de lissage : Si = 0, linterpolation est exacte : on est dans le cas des splines dinterpolation.

Plus augmente, plus les valeurs calculees aux sites dobservation seloignent des

valeurs observees.

Lorsque +, la surface estimee tend vers un plan dequation z(x, y) =

a0+a1x+a2y : les termes bi tendent vers 0 pour compenser la forte valeur de .

3.6 Conclusion

Nous avons maintenant un apercu de differentes techniques deterministes permettant

lestimation locale de variables regionalisees en des sites non echantillonnes. Dans le

tableau suivant, on represente une synthese de ces methodes.


7/24/2019 topo 111

34/55E

NSG/

DP

TS


Interpolation Interpolation Exacte Effet decran Limite(s)

Polygones de Thiessen oui total Discontinuites

Lineaire oui total Aspectpyramidal

Akima oui total Implementation

Inverse des distances oui faible Effet

il-de-buf

Surface de tendance non faible Peu robuste

Spline dinterpolation oui partiel

Spline de lissage non faible

FIG 29 - Quelques caracteristiques des methodes dinter-

polation. Si une observation est masquee par une autre

observation par rapport au site a estimer, elle peut rece-

voir un poids nul (ecran total), peu eleve (ecran partiel) ou

modere (ecran faible).

Ces differentes methodes peuvent etre evaluees en suivant la technique de lechantil-

lon test (ou Jackknife ou bootstrap). Cette technique consiste a partager les ob-

servations en deux ensembles : un ensemble permettant la determination du modele,

un second permettant le test de ce modele. On effectue ainsi une sorte de validationcroisee.

On est cependant incapable de dire laquelle de ces methodes est la plus proche de

la verite, leur reussite etant largement dependante du contexte : une methode peut

fournir de bons resultats dans un cas, mais moins efficace dans un autre. Il est en

fait impossible de dire quelle methode fournit globalement les meilleurs resultats.

Aucune methode deterministe ne parait universellement meilleure.

A titre indicatif, on presente dans le tableau suivant, les valeurs daltitude interpolees

pour les differentes methodes presentees en un point quelconque de lespace. Si unemajorite des methodes fournissent des valeurs coherentes (de lordre de 670), on ne

peut pas vraiment conclure quant a la valeur exacte de laltitude du point estimee.


7/24/2019 topo 111

35/55E

NSG/

DP

TS


Interpolation z(s)

Thiessen 680.0000

Lineaire 674.3876Methode dAkima 675.8825

Inverse des distances (d2) 660.6881

Surface de tendance dordre 2 647.6674



Spline dinterpolation 674.7240

Spline de lissage (= 103) 668.2837

Spline de lissage (= 106) 630.6910

TAB 2 - Valeur de la variable regionalisee estimee en un

meme point par les differentes methodes : estimation de lal-

titude.

Notons enfin une limite importante des methodes ici presentees : celles-ci sap-

pliquent aveuglement sans tenir compte dune eventuelle structure spatiale de la

variable regionalisee etudiee. La surface obtenue peut certes etre esthetique, mais

pas necessairement precise. Nous allons voir par la suite des methodes permettant

la prise en compte dune eventuelle structuration spatiale en faisant appel a desmodeles probabilistes : les methodes stochastiques.


7/24/2019 topo 111

36/55E

NSG/

DP

TS

INTERPOLATION SPATIALE 4 Linterpolation stochastique

4 Linterpolation stochastique

On sinteresse desormais a lutilisation de modeles probabilistes pour la description

du comportement de la variable regionalisee. Lutilisation de telles methodes doitnous permettre egalement devaluer la precision dune estimation. On parle alors de

geostatistique: on utilise a la fois les valeurs observees et linformation de position

pour ameliorer lestimation dans le contexte spatial.

On utilise donc un modele probabiliste pour decrire le phenomene naturel a laide

dun processus aleatoire. On est cependant limite par la statistique classique qui

necessitent que les valeurs mesurees soient :

Independantes.

Identiquement distribuees.

Ces hypotheses ne sont pas verifiees dans notre contexte (dependance spatiale, condi-

tions dobservation differentes). Un nouvelle approche doit etre envisagee.

Dans ce chapitre, on suppose la notion de variable aleatoire connue. On rap-

pelle quune variable aleatoire est une fonction renvoyant une valeur resultante

dune experience aleatoire. Dans notre cas elle permet dassurer la relation entre

un phenomene et les resultats chiffres dune experience portant sur ce phenomene.

On appelle ce resultat realisation de la variable aleatoire.

4.1 Notion de fonction aleatoire

4.1.1 Definition

Le concept de fonction aleatoire fournit des outils permettant danalyser le ca-

ractere a la fois incertain et structure dun phenomene, permettant ulterieurement

destimer les valeurs en des sites inconnus (non echantillonnes). La fonction aleatoire

permet de prendre en compte le fait que la variable regionalisee peut prendre des

valeurs tres erratiques (inconstantes, ne suivent pas de modele, difficiles a predire) etque ces valeurs ne sont par vraiment independantes mais structurees dans lespace.


7/24/2019 topo 111

37/55E

NSG/

DP

TS


On rappelle que z(s) represente la valeur prise par la variable regionalisee zau site

s D. On linterprete comme une realisation dune variable aleatoire Z(s) definie

en s. On appelle alors fonction aleatoire (aussi appelee processus aleatoire ouprocessus stochastique) la famille des variables aleatoires {Z(s) /s D}.

Chaque valeur z(s) de la variable regionalisee z est donc interpretee comme un

realisation de la variable aleatoireZ(s) definie en s. La fonction aleatoire represente

lensemble des variables aleatoires qui interprete la variable regionalisee. Les differen-

tes variables aleatoires ne sont pas independantes : une correlation existe et permet

de decrire la structure de la variable regionalisee.

La variable regionalisee constitue donc une realisation de la fonction aleatoire.

4.1.2 Moments

Du point de vue mathematique, une fonction aleatoire est caracterisee par sa loi

spatiale qui correspond a la donnee de toutes les lois de probabilite de tous les

vecteurs aleatoires {Z(s1), ...Z(sn)} que lon peut extraire de la fonction aleatoire

Z(s). Pratiquement, en raison de la complexite de la determination de loi spatiale

entiere, on limite la description de la loi spatiale a ses deux premiers moments. Le but

est alors de retrouver les caracteristiques de la loi a partir de la seule connaissance

de ces 2 moments.

Moments du premier ordre : Lemoment du premier ordre dune fonction

aleatoire se situe dans le cas de letude de sa loi monovariable (soit la loi en un

site) : on sinteresse a lesperance mathematiquequi est dependante du points:

E [Z(s)] =mZ(s)

Cest la moyenne autour de laquelle les realisations en un point s de la variable

aleatoire Z(s) se distribuent. Cest une moyenne sur les realisations et non une

moyenne spatiale.

Moments du second ordre : Lesmoments du second ordrefournissent une

description de la loi spatiale bivariable de la fonction aleatoire Z(s), cest a dire

la loi de probabilite entre les valeurs prises en deux sitess1 ets2 quelconques.


7/24/2019 topo 111

38/55E

NSG/

DP

TS


La covariance centree entre Z(s1) et Z(s2) est donnee par :

cov [Z(s1) , Z(s2)] = E {[Z(s1) mZ(s1)] [Z(s2) mZ(s2)]}

= E [Z(s1) Z(s2)] mZ(s1) mZ(s2)

= C (s1, s2)

Elle caracterise le degre de ressemblance (ou correlation) entre les valeurs prises en

s1 ets2.

On appelle variance(ou variance a priori), la covariance entre la variable aleatoire

Z(s1) et elle-meme :

var [Z(s1)] = cov [Z(s1) , Z(s1)]

= E

[Z(s1) mZ(s1)]2

Elle mesure la dispersion de la variable aleatoire Z(s1) autour de sa moyenne.

Enfin, le (semi-)variogramme entre Z(s1) et Z(s2) est donne par

(s1, s2) =1

2var [Z(s1) Z(s2)]

Il caracterise la dissemblance entre les valeurs prises par la variable aleatoire entre

les sitess1 ets2. On verra par la suite que cette quantite est un outil essentiel de la

geostatistique, en particulier du krigeage.

Ces moments sont les principaux parametres de la fonction aleatoire : ils contiennent

linformation la plus pertinente et la plus utile. Ils seront largement utilises par la

suite.

4.2 Inference statistique

Nous venons dintroduire le concept de fonction aleatoire qui est loutil necessaire

a letude geostatistique dune variable regionalisee. Nous allons voir maintenant

comment rattacher la mesure dune variable regionalisee au concept de fonction

aleatoire pour pouvoir exploiter ses proprietes.


7/24/2019 topo 111

39/55E

NSG/

DP

TS


4.2.1 Definition

Linference statistique consiste a reconstituer les caracteristiques de la fonction

aleatoire (en loccurrence ses deux premiers moments) a partir dune realisation de

la variable regionalisee (soit un ensemble de donnees experimentales).

La variable regionalisee constitue une unique realisation de la fonction aleatoire : il

nexiste pas de bijection entre cette fonction et une realisation. La fonction aleatoire

ne peut donc etre definie sans ambiguite a partir de la seule variable regionalisee.

Pour permettre linference, deux hypotheses limitatives supplementaires doivent etre

realisees :

lergodicite de la fonction

la stationnarite du processusSignalons enfin quen fonction des hypotheses realisees, nous serons limites sur les

possibilites doperations a effectuer sur la fonction aleatoire.

4.2.2 Ergodicite

Lhypothese dergodicite suppose que linformation statistique peut etre obtenue

a partir dune seule realisation quelconque de la fonction aleatoire definie sur un

domaine spatial infiniment grand. Autrement dit, une realisation de la fonction

aleatoire sur un grand domaine (cest a dire pour un grand nombre de variables

aleatoires) apporte la meme information quun grand nombre de realisations de la

fonction aleatoire.

En particulier, dans notre cas, la connaissance dun grand nombre de valeurs de la

variable regionalisee (une realisation de la fonction aleatoire) est suffisant pour la

description de la fonction aleatoire (cest-a-dire la restitution de ces moments).

En particulier, la moyenne spatiale realisee sur la variable regionalisee est alors

supposee egale a lesperance mathematique de la fonction aleatoire :

mZ = E [Z(s)]

= limD+

1

D

D

z(s) ds

Letude des moments de la fonction aleatoire a partir dune realisation est alors

possible.


7/24/2019 topo 111

40/55E

NSG/

DP

TS


4.2.3 Stationnarite

Nous allons detailler de la plus exigeante a la plus flexible les differentes hypotheses

de stationnarite qui peuvent etre formulees.

Hypothese de stationnarite du second ordre : Une fonction aleatoire {Z(s)}

est ditestationnaire dordre 2quand son esperance mathematique existe et nest

pas dependante du point et que la covariance entre chaque paire

Z(s+ h), Z(s)

existe et ne depend que deh (et pas du point de lespace s) :

(1) s D, E [Z(s)] =m

(2) s D, (s+ h) D,covZ(s+ h), Z(s)

= C

h

Formule autrement, cette hypothese signifie donc que la variable regionalisee zfluc-

tue autour dune meme valeur dans lespace et que la covariance entre deux sites ne

depend pas de leur position mais du vecteur qui les separe.

Deux proprietes en decoulent :

La variance est la meme en chacun des sitess.

Le variogramme entre deux sites depend uniquement de la distance qui les separe.

(3) s D, var [Z(s)] = cov [Z(s), Z(s)] = C(0)

(4) s D, (s+ h) D,varZ(s+ h) Z(s)

/2 =(h) = C(0) C(h)

La relation (3) souligne quen chaque site, la dispersion autour de la valeur moyenne

est la meme. La relation (4) montre que la dissemblance entre deux sites est seule-

ment fonction du vecteur qui les separe. Elle souligne egalement que, sous cette

hypothese, lutilisation du variogramme ou de la covariance est equivalente pour

quantifier la dependance entre deux mesures separees par h.

Lhypothese de stationnarite dordre 2 ne peut etre validee de maniere rigoureuse

et infaillible a partir de mesures experimentales : cest une decision plus ou moins

judicieuse prise par lutilisateur.

Hypothese intrinseque : Lhypothese intrinseque est une version affaiblie de

lhypothese de stationnarite du second ordre. Elle est basee uniquement sur les

accroissements de la fonction aleatoire.

Une fonction aleatoire est dite intrinseque quand ses accroissements sont station-


7/24/2019 topo 111

41/55E

NSG/

DP

TS


naires au second ordre :

s D, (s+ h) D,

(1) EZ(s+ h) Z(s)

= 0

(2) varZ(s+ h) Z(s)

= E

Z(s+ h) Z(s)

2= 2(h)

Selon cette hypothese, lesperance des accroissements est donc nulle et sa variance

ne depend que du vecteur separant les deux points. Notons que les variance et

covariance de la fonction aleatoire ne sont pas forcement definies.

On remarque que lhypothese de stationnarite du second ordre implique lhypothese

intrinseque. La reciproque est fausse.

Hypotheses quasi-stationnaire et quasi-intrinseque : En pratique on sup-

pose que la fonction aleatoire est intrinseque mais egalement quasi-stationnaire

dordre 2 sur un domaine borne :

(1) s D,E [Z(s)] =m

(2) s D,(s+ h) D/h < b,covZ

s+ h

, Z(s)

= C

h

Il faut alors concilier deux facteurs :

La zone choisie ne doit pas etre trop etendue par rapport a la taille du champs

considere.

Le nombre de sites selectionnes ne doit pas etre trop faible.

4.2.4 Combinaisons lineaires autorisees

On a choisi dutiliser uniquement les deux premiers moments de la loi spatiale, ce

qui entraine des limites quand a la manipulation de la fonction aleatoire : on ne peututiliser que des combinaisons lineaires ponderees de Z(s), seules expressions pour

lesquelles ont peut calculer esperance et covariance.

Lhypothese de stationnarite choisie impose de plus des contraintes supplementaires

car elle ne garantit pas necessairement lexistence de lesperance et de la variance

de toutes les combinaisons lineaires ponderees. On appelle combinaison lineaire

autorisee une combinaison lineaire qui possede une esperance et une variance.


7/24/2019 topo 111

42/55E

NSG/

DP

TS


Hypothese stationnaire dordre 2 : Dans ce cas, toutes les combinaisons lin-

eaires ponderees sont autorisees :

E

i

wiZ(si)

= m

i

wi

var

i

wiZ(si)

=

i

j

wiwjC (si sj)

Hypothese intrinseque : Si la fonction aleatoire est intrinseque, seules les com-

binaisons lineaires de poids total nul sont autorisees car elles peuvent secrire sous

la forme daccroissements :

i

wi= 0

Ei

wiZ(si)

= 0

vari

wiZ(si)

= i

j

wiwj(si sj)

4.2.5 Conclusion

Le modele probabiliste constitue une meilleure alternative lorsque les donnees etu-

diees saverent complexes. Pour rendre le modele operationnel a partir dune mesure

de la variable regionalisee, il est necessaire de se ramener a des hypotheses. Les

hypotheses de stationnarite (second ordre ou intrinseque) sont choisies en fonction

de lhomogeneite des donnees.

Maintenant que nous avons detaille le choix du modele probabiliste, nous allons nous

focaliser sur un outil indispensable pour la modelisation spatiale des donnees : le

variogramme.

4.3 Analyse variographique

Nous avons vu que le variogramme refletait la structure de la regionalisation. On

appelle analyse variographique linference du variogramme a partir de donnees

experimentales. Elle permet de restituer des informations quant a la distribution spa-

tiale de la variable regionalisee, cest-a-dire de la realisation de la fonction aleatoire

dinteret. A titre de precision, on sattache usuellement a letude du variogramme

plutot que de la covariance, celle-ci netant pas necessairement definie dans le cadre

intrinseque.

Lanalyse variographique constitue une etape cruciale dans un etude geostatistique :


7/24/2019 topo 111

43/55E

NSG/

DP

TS


elle permet posterieurement destimer les valeurs inconnues de la variable regiona-

lisee et dassortir leur estimation dune precision.

4.3.1 Proprietes du variogramme

Proprietes mathematiques :

Cas stationnaire dordre 2 : dans le cas stationnaire dordre 2 le variogramme est

une fonction paire, nulle pour h = 0, positive et bornee. On dit que cest une

fonction de type negatif conditionnelle puisque elle obeit a la relation :

k N, w1,...,wk Rk/

k

i=1

wi= 0,s1, ..., sk Dk,

n

i=1

n

j=1

wiwj(si sj) 0

De plus,

limh+

(h) = C(0)

Ce palier, C(0) est atteint au niveau de la portee (distance a partir de laquelle

2 valeurs ne sont plus correlees) et correspond donc a la dissemblance maximale.

Cas intrinseque : Dans le cas intrinseque, la covariance nexiste pas forcement. Le

variogramme nest pas borne et augmente indefiniment avech. On a de plus :

(h) =o+(h2)

Anisotropie Le variogramme depend a la fois du module h deh mais aussi de

sa direction.

Comportement a lorigine Le comportement a lorigine reflete de degre de

regularite spatiale de la variable regionalisee. On distingue usuellement trois types

de comportements :

Parabolique : cas dune grande regularite spatiale avec une variable regionalisee

derivable et daspect lisse.

Lineaire : comportement moins regulier de la variable regionalisee ; regionalisation

continue mais plus derivable

Discontinu : saut abrupt a lorigine en raison de labsence (totale ou partielle) de

correlation entre les valeurs prises par deux sites proches. La variable regionalisee

est discontinue. On parle alors deffet de pepitedu fait de lexemple des teneurs

en or des gisements auriferes qui varient a tres courte echelle.

Ces differents types de comportement sont representes sur cette figure :


7/24/2019 topo 111

44/55E

NSG/

DP

TS


(a) (b) (c)

h h h

h( ) h( ) h( )

FIG 30 - Differents comportement a lorigine du vario-

gramme : (a) : comportement parabolique ; (b) : compor-

tement lineaire ; (c) : comportement discontinu.

4.3.2 Inference du variogramme

On cherche maintenant a estimer le variogramme a partie dun ensemble de donnees

experimentales {z(si)}/si D}.

Variogramme experimental : Le variogramme experimentale est calcule empi-

riquement a partir des observations de la variable regionalise. Il est donne par la

formule :(h) =

1

2|N(h)|

(i,j)N(h)

[z(si) z(sj)[2

Ou N(h) ={(i, j)/si sj =h/i=j } est lensemble des paires distinctes et |N(h)|

est le cardinal deN(h). En pratique, les donnees netant pas regulierement espacees,

on definira lensemble N(h) par N(h) ={(i, j)/si sj h /i=j }.

Le variogramme experimental est un nuage de point. Le calcul sans pas induit la

restitution dun variogramme tres bruite a partir duquel il est difficile de deduire

tout information ; Le choix dun calcul moyen par pas permet lobtention dun va-riogramme plus lisse dont les valeurs seront plus fiables.


7/24/2019 topo 111

45/55E

NSG/

DP

TS


(a) 0 50 100 150 200 250

0

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

2x 10

4

h [m]

(h)

(b) 0 50 100 150 200 250

0

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

2x 10

4

h [m]

(h)

(c) 0 50 100 150 200 250

0

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

2x 10

4

h [m]

(h)

FIG 31 - Exemple de variogramme experimental calcule :

(a) sans pas, (b) pour un pas de 5 m, (c) pour un pas de 10

m.

La variogramme experimental est non biaise (E(h)

= (h)), mais sa dispersion

augmente fortement quandh devient grand. Cest un estimateur peu robuste car

sensible aux valeurs extremes ou aberrantes en particulier pour des pas faibles en

comparaison des distances entre sites dobservation.

Modelisations : Le variogramme experimental permet lestimation du variogram-

me theorique pour un nombre defini de distances, cest-a-dire uniquement des valeurs

ponctuelles. De plus, il ne respecte pas necessairement les proprietes theoriques

du variogramme (en particulier la propriete negative conditionnelle, complexe a

etablir). Lidee est donc dajuster un modele variographique classique presentant les

caracteristiques necessaires et defini pour un ensemble de vecteursr.


7/24/2019 topo 111

46/55E

NSG/

DP

TS


Lajustement se fait alors par moindre-carre en minimisant la quantite :

k

[(rk) (rk)]2

On trouve dans la litterature differents types de modele. En fonction du variogramme

experimental, on choisira le modele variographique qui sen rapproche le plus.

Modeles isotropes avec palier :

Modele pepitique de palierC : comportement discontinu a lorigine. Il est ca-

racteristique des gisements miniers, en particulier auriferes.

(r) =

0 pour r= 0

C pour r >0

C

r

(r)

(a)

FIG 32 - Modele pepitique.

Modele spherique de porteea et de palierC: lineaire a lorigine.

(r) =

C

32ra

12r3

a3

pour 0 r a

C pour r > a


7/24/2019 topo 111

47/55E

NSG/

DP

TS


a

C

r

(r)

(b)

FIG 33 - Modele spherique.

Modele cubique de porteea et de palierC : parabolique a lorigine.

(r) =

C

7 r2

a2 35

4r3

a3+ 7

2r5

a5 3

4r7

a7

pour 0 r a

C pour r > a

a

C

r

(r)

(c)

FIG 34 - Modele cubique.

Modele exponentiel de parametrea et de palierC: lineaire a lorigine.

(r) =C1 e ra

a 3a

0.95CC

r

(r)

(d)

FIG 35 - Modele exponentiel.


7/24/2019 topo 111

48/55E

NSG/

DP

TS


Modele gaussien de parametrea et de palierC :parabolique a lorigine.

(r) =C1 e r2a2

a 1.7a

0.95CC

r

(r)

(e)

FIG 36 - Modele gaussien.

Modele a effet de trou : parabolique a lorigine ; il permet de modeliser un

variogramme moins stable, presentant des fluctuations autour du palier : il est

caracteristique de donnees plus heterogenes.

(r) =C

1

sin

rara

4.49a

C

1.21C

r

(r)

(f)

FIG 37 - Modele a effet de trou.

Modeles isotropes sans palier : ils sont utilises dans le cadre non stationnaire

dordre 2 :

Modele puissance dexposant et de facteur dechel le : [0; 2]. Plus est

proche de 2, plus la variable regionalisee est reguliere. Plus est proche de 0,

plus son comportement est erratique.

(r) =r


7/24/2019 topo 111

49/55E

NSG/

DP

TS


r

(r)

(a)

FIG 38 - Modele puissance dexposant (= 0, 5)

Modele lineaire de pente : lineaire a lorigine.

(r) =r

r

(r)

(b)

FIG 39 - Modele lineaire.

Les methodes utilisees pour des modeles non-isotropes existent mais sont plus com-

plexes a mettre en uvre. On cherchera en general a se ramener a un ou plusieurs

variogramme isotrope en fonction des directions privilegiees.

4.4 Le krigeage

4.4.1 Origine de la methode

Le krigeage est une methode dinterpolation applicable a des donnees spatiales.

Elle sappuie sur la geostatistique lineaire, notamment le variogramme. La theorie

du krigeage a ete developpee par un mathematicien francais (G. Matheron) a partir

des travaux de lingenieur minier sud-africain D. G. Krige. Dans les annees 50,

Krige a developpe une serie de methodes statistiques empiriques afin de determiner

la distribution de minerais a partir dun ensemble de forages.


7/24/2019 topo 111

50/55E

NSG/

DP

TS


4.4.2 Principe

Voisinage : On appelle voisinage du krigeage le domaine du champ qui contient

le site a estimer et les donnees utilisees pour linterpolation : dans la plupart des cas,

il nest pas necessaire de prendre toutes les donnees disponibles (trop nombreuses

ou trop eloignees : le calcul en serait plus long et pas necessairement plus precis).

Les sites dinteret sont selectionnes par un critere de nombre (les n plus proches)

ou de distances (les n sites situes a une distance inferieure a rmax). En general, 15

sites sont necessaires pour une estimation optimale (trop peu de sites peut rendre

la solution moins precise : un bon compromis est donc necessaire).

Contraintes : Lobjectif est destimer le plus precisement possible la grandeurrecherchee par une combinaison lineaire ponderee des observations. Ce critere de

precision se traduit par une minimisation de lerreur quadratique moyenne. Ces

conditions se traduisent mathematiquement en 4 contraintes.

Contrainte de linearite : Lestimee doit etre une combinaison lineaire des donnees :

z(s0) =ni=1

i(s0)z(si)

Contrainte dautorisation : Lesperance et la variance de lerreur de previsionz(s0) z(s0) doivent obligatoirement exister (cette contrainte intervient dans le

cas stationnaire intrinseque puisquelles existent obligatoirement dans le cas de la

stationnarite dordre 2).

Contrainte de non biais : Lesperance de lerreur de prevision est nulle :

E [z(s0) z(s0)] = 0

Contrainte doptimalite : les poids i doivent etre estimes de maniere a minimiser

la variance de lerreur de prevision var [z(s0) z(s0)]

Estimation : On sinteresse au cas le plus commun avec letude dune seule va-

riable regionalisee, sous lhypothese de stationnarite intrinseque : on parle de kri-

geage ordinaire. Cest le type de krigeage le plus communement utilise.

Le krigeage doit donc repondre aux 4 contraintes enoncees precedemment.

Contrainte de linearite : Lestimee est donc une combinaison lineaire des observa-

tions :

Z(s0) =

ni=1 i(s0)Z(si)


7/24/2019 topo 111

51/55E

NSG/

DP

TS


Contrainte dautorisation : On doit assurer lexistence de lesperance et de la va-

riance de lerreur de prevision.

Z(s0) Z(s0) =

ni=1

i(s0)Z(si)

Z(s0)

=

ni=1

i(s0)Z(si)

ni=1

i(s0)Z(s0)

+

ni=1

i(s0)Z(s0)

Z(s0)

=

ni=1

i(s0) [Z(si) Z(s0)]

+Z(s0)

ni=1

i(s0) 1

Lerreur de prevision prend donc la forme dune combinaison lineaire daccroisse-

ments si et seulement si

ii(s0) = 1. Dans ce cas, on a bien lexistence de la

variance et de lesperance sous lhypothese de stationnarite intrinseque.

Contrainte de non biais : On doit sassurer que lestimateur de lerreur de prevision

est non biaise :

EZ(s0) Z(s0)

=

ni=1

i(s0) E [Z(si) Z(s0)]

cf. equations precedentes

Lesperance des accroissements etant nulle sous lhypothese intrinseque, on a bien

un estimateur de lerreur de prevision non biaise. Contrainte doptimalite : On cherche a minimiser lerreur de prevision Z(s0)

Z(s0). Cette minimisation sous la contrainte

ii(s0) = 1 se ramene a la recherche

des extrema du lagrangien suivant :

L(1(s0),...,n(s0), ) = E

nj=1

j(s0)Z(sj) Z(s0)

2 + 21 ni=1

i(s0)

Ourepresente un multiplicateur de Lagrange.

Apres developpement, on peut reecrire le lagrangien sous la forme :

L =ni=1

nj=1

i(s0)j(s0)ij+ 2n

j=1

j(s0)j0+ 2

1

ni=1

i(s0)

Ouij =(si, sj)

Le calcul des derivees partielles premieres de Lpar rapport aux i(s0) donne les


7/24/2019 topo 111

52/55E

NSG/

DP

TS


equations constituant le systeme krigeage :

L

i(s0) = 2

ni=1 i(s0)ij+ 2i0 2

= 0

Soit, pour tout i [1; n[,n

j=1

j(s0)ij+ = i0

Au final, le systeme a resoudre secrit donc :

n

j=1 j(s0)ij+ = i0n

j=1j(s0) = 1

Ce que lon peut reecrire sous forme matricielle :

0 12 13 . . . 1n 1

21 0 23 . . . 2n 1...

... ... . . .

... ...

n1 n2 n3 . . . 0 1

1 1 1 . . . 1 0

1(s0)

2(s0)...

n(s0)

=

10

20...

n0

1

(4)

Notons que la mise en place du systeme de krigeage necessite une unique inversion

de la matrice carree de lequation de krigeage (modele du krigeage), celle-ci etant

valide pour le domaine entier. Seul le vecteur du membre de droite doit etre calcule

en chaque point. Le vecteur estime est lui aussi valable en un point.

4.4.3 Proprietes du krigeage

La variance de lerreur destimation au point s0 est donnee par :

2(s0) = var [z(s0) z(s0)[

=ni=1

i(s0)i0+

La variance depend donc des parametres du krigeage (termes i) ainsi que de la

structure spatiale de la fonction aleatoire (variogramme).


7/24/2019 topo 111

53/55E

NSG/

DP

TS


4.4.4 Impact du modele de variogramme

On evalue en un point quelconque limpact de differents modeles de variogrammes

sur lestimation de la variable regionalisee.

Les variogrammes modelises estimes a partir du variogramme experimental sont

representes sur la figure suivante. Dapres la structure de ce dernier, on choisit de

sinteresser uniquement aux variogrammes exponentiel, gaussien et a effet de trou.

Le modele a effet de trou semble etre le plus adequat pour representer le vario-

gramme determine experimentalement : comportement plus conforme a lorigine,

meilleure restitution egalement de la dispersion. Cette dispersion nest cependant

pas representative dun phenomene physique reel, sa representation nest donc pas

forcement la plus judicieuse. Elle est vraisemblablement plutot liee au manque derobustesse de lestimateur du variogramme.

0 50 100 150 200 2500

1000

2000

3000

4000

5000

6000

7000

8000

h [m]

(h)

FIG 40 - Variogramme experimental et differents modeles

variographiques associes : modeles exponentiel (magenta),

gaussien (vert) et a effet de trou (rouge).

Les valeurs estimees a laide du krigeage pour ces differents modeles de vario-

grammes, ainsi que leur precision, sont presentees dans le tableau suivant. On

constate que la variance de lestimateur est minimale pour un modele de vario-

gramme de type exponentiel.


7/24/2019 topo 111

54/55E

NSG/

DP

TS


Modele Valeur estimee Incertitude formelle

Exponentiel 653.2109 0.2729

Gaussien 660.6695 0.1796Effet de trou 671.9119 0.4602

TAB 3 - Interpolation par krigeage en un point quelconque

pour differents modeles de variogramme.

La surface obtenue par krigeage a partir du jeu dobservation dont on dispose est

alors :

140160

180200

220240

260280

120

140

160

180

200

220

240

400

500

600

700

800

Y

X

Z

FIG 41 - Krigeage : application sur un champ dobservations

- vue en perspective.

4.5 Conclusion

La geostatistique permet de modeliser la structure du phenomene regionalise etudie

a laide doutils simples (covariance et/ou variogramme) et de resoudre efficacement

les problemes dinterpolation.

Letude geostatistique debute avec lanalyse variographique qui consiste a estimer

le variogramme experimental et a le modeliser a laide dune fonction standard.

Le modele variographique peut alors etre utilise pour construire un systeme de

krigeage qui permettre dobtenir des estimations locales et les variances destimation


7/24/2019 topo 111

55/55

NSG/

DP

TS

INTERPOLATION SPATIALE 5 Conclusion

associees.

5 Conclusion

Nous avons aborde deux types de methodes pour la resolution des problemes din-

terpolation spatiale :

Les methodes deterministes globales : elles permettent lestimation de la moyenne

sur un domaine donne dune grandeur mesuree en differents points dobservation.

Elles sont basees sur des proprietes purement geometriques de lechantillon dob-

servation.

Les methodes deterministes locales : elles sont aussi basees sur des proprietespurement geometriques de lechantillon dobservation et ne permettent pas une

evaluation de leur precision. Il est de plus generalement difficile de conlcure quant

a la fiabilite globale dune technique deterministe.

Les methodes stochastiques : elles font appel a un modele cense mieux sadapter

aux donnees observees. Ce modele permet lestimation de la variable en des sites

non echantillonnes apres letude de la distribution spatiale (variogramme) de la

variable.

Lutilisation de techniques de validation croisee (bootstrap) permet de controler la

conformite du modele choisi a la realite.

topo 111

Documents