g é o statistique

288
Aide-M´ emoire de eostatistique Lin´ eaire Les Presses de l’ ´ Ecole des mines de Paris [email protected]

Upload: nacho-bustos-villalobos

Post on 20-Feb-2016

39 views

Category:

Documents


5 download

DESCRIPTION

dd

TRANSCRIPT

Page 1: g é o Statistique

Aide-Memoire de

Geostatistique Lineaire

Les Presses de l’Ecole des mines de Paris [email protected]

Page 2: g é o Statistique
Page 3: g é o Statistique

Avertissement

A l’origine, ce texte est la redaction d’une partie d’un cours donnea Fontainebleau en septembre 1989 et qui avait pour titre : LaGeostatistique Lineaire et ses developpements. Plus que surles details de calculs, on a voulu y insister sur les idees directrices quipeuvent aider le Geostatisticien a mener a bien une etude concrete. Cesont donc les methodes, et non les techniques mathematiques, qui sontau cœur de cet expose.

Il ne faut pas voir la un souci de simplification, bien au contraire noussemble-t-il. Car ce ne sont pas les mathematiques mises en jeu ici qui fontla difficulte du sujet : ces mathematiques sont d’un niveau en generalassez elementaire, et sont de toute facon tout-a-fait classiques.

De la a conclure que la Geostatistique ne presente aucun caractered’originalite et ne fait qu’appliquer son vocabulaire particulier a desresultats par ailleurs bien connus, il n’y a qu’un pas, qu’un lecteurpresse pourrait franchir aisement. Mais une telle vision reductrice, enapparence inattaquable, est en fait absurde. Car ce qui fait la richesse decette Geostatistique que nous cherchons a promouvoir, ce n’est pas unetheorie pure ; ce n’est pas davantage une pratique seule. Cette richesseprocede tres exactement de l’equilibre raisonnable qu’il faut assurer enpermanence entre les deux poles : theorie et pratique.

Aussi la Geostatistique doit-elle plutot etre decrite comme un ensemblede modeles, methodes et tours de main, souvent peu orthodoxes, elabores E & C, p2.

au fil des ans. Ni science nouvelle, ni non plus technique nouvelle,la Geostatistique a par contre surement merite le nom de disciplinenouvelle, avec toutes les acceptions que ce mot autorise en francais.

Plus que l’erudition mathematique donc, ce sont tout a la fois l’honneteteintellectuelle et l’humilite face aux donnees qui doivent guider lademarche du Geostatisticien. Et la se trouve la principale difficulte dutexte propose ici. Car il n’est pas possible, par un document fige etforcement limite, de communiquer une experience acquise depuis pres dequarante ans. Cet Aide-memoire de Geostatistique Lineaire

ne doit donc en aucun cas etre considere comme un tout, acheve etimmuable : il ne s’agit au sens litteral que d’une initiation. Tout le cheminreste a faire. Le lecteur pourra bien sur solliciter toute aide qu’il jugerautile, mais nul ne pourra faire la route a sa place.

Pour aider a ce cheminement personnel du lecteur, nous avons veille amentionner un maximum de references bibliographiques. Ces references,qui figureront en marge1 , sont pour la plupart des notes issues duCentre de Geostatistique de Fontainebleau. Il ne s’agit pas la deflatter un quelconque esprit de chapelle, mais seulement de satisfaire aquelques contraintes de bon sens : proposer une documentation aisementaccessible, tenir compte des documents qui ont effectivement eu la faveurdes participants de l’Ecole d’Ete 1989, et surtout bien sur assurer unminimum d’homogeneite dans les notations et le vocabulaire des textesdonnes en references.

1Sans signe de renvoi dans le texte, afin de ne pas en perturber la lecture.

Page 4: g é o Statistique

2 Aide-Memoire de geostatistique lineaire :

*

*

*

Quelques conventions permanentes dans cet Aide-Memoire :

• lorsque nous proposerons dans le texte des citations verbatim

extraites de documents cites en reference, nous conviendrons de lesimprimer entre guillemets et en italique ;Citations

• de meme, lorsque nous definirons des mots ou expressionsgeostatistiques en usage dans ces references et destines a etresouvent reutilises, nous les noterons en cararacteres gras. CesDefinitions

definitions seront reunies dans un Index a la fin de cet ouvrage. Parailleurs, les expressions geostatistiques qui auront ainsi trouve leurdefinition dans le present document ou dans les references citeesseront ulterieurement ecrites avec des majuscules (Variographie,Expressions geostatistiques

precedemment definiesKrigeage Intrinseque, etc. ) ;

• les points qui semblent meriter une attention particuliere serontsignales en marge par un signe qui devrait immediatement attirer leregard lors de la lecture d’une nouvelle page.I I I

• quant aux renvois internes au document, il peuvent soit etreune simple mention de paragraphe (cf. ci-contre) lorsque le texteParagraphe 6.3.

reference se trouve dans le meme chapitre, soit une indication pluscomplete (cf. ci-contre) dans le cas contraire : il s’agit alors toujoursChapitre 7,

paragraphe 1.2.de l’un des neuf chapitres de la premiere partie de l’aide-memoire.

Pour en revenir aux autres textes cites, la plupart seront designes par unrenvoi a la bibliographie, qui est classee par auteurs, puis par dates depublication. Mais un petit nombre d’entre eux, de reference permanente,seront designes par une abreviation particuliere. Ces documents, aunombre de trois, constituent une base incontournable pour maıtriser lestechniques fondamentales utilisees en Geostatistique Lineaire. Ce sont :

• le premier document de cours (et d’exercices) propose engeostatistique, La theorie des variables regionalisees etses applications, Matheron, 1971 (c). Ce fascicule, edite parl’Ecole des Mines de Paris (EMP), existe egalement en anglais. Ilsera designe en marge par l’abreviation Fasc. 5, la reference deFasc. 5

pagination etant toujours celle de la version francaise ;

• Les Fonctions Aleatoires Intrinseques d’ordre k,Delfiner et Matheron, 1980 (EMP), designe par FAI-k ;FAI-k

• Estimer et Choisir, Matheron, 1978. Ce fascicule, editeE & C

initialement par l’EMP, a ete traduit en anglais et publie en 1988chez Springer Verlag, sous le titre Estimating and Choosing.

Le texte propose dans les chapitres suivants, simple compte-rendu ecritd’une Ecole d’Ete, n’a pour but que de servir d’introduction et de guidede lecture a ces references fondamentales.

*

*

*

La version de 1993 n’introduit pas de matiere nouvelle. Nous avons1993

Seul ajout substantiel :une demonstration, sousune forme nouvelle, dutheoreme d’additivite.

surtout cherche a integrer les observations des lecteurs sur le materiaudeja existant. C’est pourquoi l’accent a ete d’abord mis sur une recherchede plus grande lisibilite du document. Toutefois, la convergence de

Page 5: g é o Statistique

Avertissement 3

certaines observations — au sujet du besoin d’exemples pratiques, del’interet d’introduire des notions de multivariable, de la place qu’ilfaudrait reserver a la Variographie. . . — est la preuve evidente s’il enetait besoin que ce texte ne devra pas rester en l’etat, et devra etresubstantiellement etoffe ou complete par d’autres documents. Tant il estvrai que la Geostatistique est une discipline vivante qui ne peut quebeneficier de l’apport de chacun.2

A titre d’exemple de collaboration, merci a S. Seguret dont lesremarques m’ont permis d’ameliorer — du moins je l’espere — et decompleter la presentation des chapitres 7 et 8.

Pour la version de 1994, nous avons surtout souhaiter separer 1994

materiellement les chapitres qui constituent l’ossature du cours, et desajouts plus particuliers ou plus techniques : ceux-ci font desormaisl’objet d’annexes, en general referencees a un chapitre. C’est pourquoile document distingue deux parties : l’Aide-Memoire proprementdit, dont le contenu ne devrait pas etre change substantiellement dansle futur, et des Annexes sans doute appelees a des developpementsulterieurs, et qui peuvent sans inconvenient etre omises en premierelecture. La troisieme partie (bibliographie et notations) a ete completeepar un index des termes definis dans l’ensemble du document.

La version de 1998 n’a fait que completer les rectifications du tirage 1998

precedent. Merci a tous ceux qui ont bien voulu contribuer a debusquerles incorrections subsistantes. Quant a la version 1999, elle n’a pasvu de modification de contenu, mais a vecu la difficile reconversion 1999

de TEX en LaTeX2ε ; tache peut-etre necessaire donc, mais surementingrate, allegee grace a l’aide compatissante de D. Fargue, pionnier enla matiere au sein de l’EMP : qu’il en soit remercie.

Le principal travail sur la version de 2006 a consiste, au-dela des 2006

inevitables corrections, en une remise en forme pour preparer la miseen ligne du document. Celui-ci a en effet desormais vocation a figurerdans le catalogue des ressources pedagogiques de ParisTech, accessiblesa l’adresse http://graduateschool.paristech.org. Ce cours, sous uneforme desormais peu destinee a changer, sera donc present en paralleleavec un recueil de cas d’etudes reels et d’exemples academiques qui estactuellement propose a l’adresse

http://cg.ensmp.fr/˜chauvet/Tome2/ParisTech/AccueilCoursGeostat.htm

et facetieusement designe sous le nom Tome 2. Les evolutions futures Etant clairemententendu que lepresent Aide-Memoireconstitue le Tome 1 !

seront plutot ciblees sur ce recueil, dans le but d’etoffer au maximum lesexemples d’utilisation des methodes exposees ici.

2Toutes remarques, critiques ou suggestions quant aux contenu, style ou realisation

materielle du present document, seront accueillies et examinees avec la plus

grande attention. Le moyen le plus sur et le plus rapide de communiquer demeure

le courrier electronique : [email protected]

Page 6: g é o Statistique

4 Aide-Memoire de geostatistique lineaire :

Page 7: g é o Statistique

Premiere partie

Elements de

Geostatistique Lineaire

Page 8: g é o Statistique

6 Aide-Memoire de geostatistique lineaire :

Page 9: g é o Statistique

Introduction

1. Bref rappel historiqueLe mot de Geostatistique fait son apparition en 1962. Ce mot, qui Matheron, 1962 (a).

connaıtra d’ailleurs bien des avatars au gre des traductions, ne doit pascacher une verite evidente : Historically geostatistics are as old asmining itself.. Si on peut definir la Geostatistique comme l’etude Matheron, 1963 (b).

des variables numeriques reparties dans l’espace, il est clair alors quedes problemes essentiellement geostatistiques ont ete abordes depuisfort longtemps : en art des mines certes, mais aussi en meteorologie,topographie, cartographie, pour ne citer que quelques exemples.

L’innovation ne reside pas non plus dans l’arsenal mathematique requis.Ainsi les Fonctions Aleatoires ont-elles ete introduites et etudieesdes les annees 1930 par les Ecoles francaise et sovietique (P. Levy,A. Kolmogorov, A. Khintchine) ; les outils theoriques que nous Voir aussi R. Fortet &

A. Blanc-Lapierre, 1953.utilisons en Geostatistique Lineaire etaient en place des les annees 1940(H. Cramer, N. Wiener, S. Bochner) ; et les methodes comme les Par exemple,

N. Wiener, 1949.moindres carres de Gauss ou les parametres de Lagrange, sont des plusclassiques et font partie du bagage mathematique de base de l’ingenieur.

Le declic, si l’on peut dire, qui a conduit a l’elaboration de ceque nous appelons ici et aujourd’hui la Geostatistique, c’est lerapprochement de ces deux domaines : des problemes techniques parfoisfort terre-a-terre d’une part, et d’autre part un arsenal de methodesmathematiques. Sans doute d’ailleurs ce rapprochement etait-il dans l’airpuisque, dans l’espace d’une decennie, la Geostatistique s’est elaboreeindependamment dans le domaine minier, dans le domaine forestier(B. Matern, en Suede), en meteorologie (L.S. Gandin, en URSS). Matern, 1959 ;

Gandin, 1960.Sans doute une recherche bibliographique approfondie trouverait-elle uneevolution semblable dans d’autres disciplines encore.

Concernant la Geostatistique elaboree a l’Ecole des mines, il estindeniable que les problemes miniers ont joue un role privilegie. Auplan anecdotique, cette influence se fait sentir au niveau du vocabulaire(effet de pepite, par exemple). Plus profondement, l’evolution decette Geostatistique made in Fontainebleau a ete etroitement guideepar les demandes du monde minier : il fut un temps ou la successiondes themes de recherche abordes a Fontainebleau reproduisait presqueexactement les etapes d’un projet minier. Actuellement toutefois, l’heureest a une diversification des champs d’application, et nous essaieronsdans le cours du texte d’eviter un vocabulaire trop specifiquement lie aquelque domaine particulier que ce soit.

2. Trois ages de la geostatistiquePour fixer les idees, nous examinerons ici les grandes lignes de l’evolutionde la Geostatistique au sein de l’Ecole francaise.

La premiere etape est d’inspiration exclusivement miniere. Pour etreplus precis, ce sont les problemes rencontres par les mineurs d’ord’Afrique du Sud qui suscitent les premieres recherches. On mentionneraplus particulierement les travaux de H.S. Sichel, D.G. Krige, Sichel, 1949, 1952,

Krige, 1951,de Wijs, 1952.H.J. de Wijs. L’idee directrice de ces recherches est de pallier les

insuffisances de la statistique classique constatees dans l’etude

Page 10: g é o Statistique

8 Aide-Memoire de geostatistique lineaire :

des gisements tres dissemines. Le neologisme krigeage est lapour rappeler cette rencontre entre une technique mathematique deregression et les difficultes d’exploitation du minerai d’or. Mais deja, lesapplications s’etendent a d’autres produits : uranium, fer, nickel, cuivre.

Deux traits caracterisent ce premier age de la Geostatistique. Au niveaupratique d’abord, les moyens de calculs demeurent rudimentaires, aussiles publications abondent-elles en formules d’approximation, courbesou abaques, qui progressivement constituent un veritable capital afind’eviter aux utilisateurs de reprendre des calculs fastidieux. Au niveautheorique ensuite, on remarque que les formalismes qui s’elaborent seplacent souvent dans le cadre d’une loi de distribution donnee. Il s’agitnon pas tant du modele Gaussien — inadapte aux variables disseminees— que du modele log-normal, pour lequel se manifeste un engouementextraordinaire dans les annees 1950. D’autres modeles de distributionsMatheron, 1956.

font l’objet de recherches theoriques (travaux de H.S. Sichel).

Ainsi, au sens etymologique, le mot Geostatistique convientMatheron,1962 (a), 1965, 1968.

Cours de l’Ecoledes mines de Paris :

Formery, 1964 ;Matheron,

1969 (b), 1971 (c).

parfaitement a cette premiere phase qui, etalee sur une quinzained’annees, culmine avec la publication d’un certain nombre d’ouvragesde synthese annoncant progressivement des orientations nouvelles.

Avec le second age de la Geostatistique, que l’on peut situer de 1965 a lafin des annees 1970, c’est la reference a des modeles statistiques qui estabandonnee. Ou bien on elabore des modeles qui ne font pas intervenirles lois de distribution (Geostatistique Lineaire), ou bien on se rameneprealablement a des modeles de reference par le jeu des anamorphoses.Parallelement, on cherche a elargir les hypotheses de travail : c’estle developpement d’une Geostatistique Non Stationnaire, puis d’uneMatheron, 1970, 1971 (b) ;

Matheron, 1973.Geostatistique Non Lineaire. La Geostatistique Non Stationnaire–NonLineaire reste encore a faire. . . Des formalismes nouveaux apparaissent :Simulations1 conditionnelles ou non, Ensembles Aleatoires. Dans ceJournel, 1974.

dernier domaine, il s’agit cette fois d’innovations theoriques. CeMatheron,1969 (a), 1975 (a).

foisonnement methodologique peut etre immediatement mis en valeurgrace a la remarquable amelioration des moyens de calculs.

Etrangement, une periode si riche ne produit pas d’ouvrages de synthese,sauf en ce qui concerne les Ensembles Aleatoires ; et si les traites deGeostatistique se multiplient, surtout en anglais, ils restent en retraitDavid, 1977 ;

Journel, 1978 ;Rendu, 1979 ;Clark, 1981.

des progres theoriques et meme des realisations informatiques. Et c’estfinalement par un ouvrage de nature philosophique et methodologiqueque l’on peut clore ce deuxieme age de la Geostatistique : Estimeret Choisir est publie en 1978 en francais (et demandera dix ans pourMatheron, 1978.

etre traduit et publie en anglais, ce qui en soi est deja un interessantsujet de reflexion). Il ne s’agit pas la d’un ouvrage facile : c’est biensur un tour d’horizon critique des methodes geostatistiques, mais c’estsurtout un guide pour les recherches a venir. Nous avons essaye de nousen inspirer au cours de l’Ecole d’Ete 1989.

Il n’est pas facile de parler de la Geostatistique de troisiemeMatheron &Kleingeld, 1987.

generation (expression due a W.J. Kleingeld), actuellement enpleine expansion. Dans un contexte informatique de plus en plusconfortable, la Geostatistique se developpe dans les directions lesplus variees. Les champs d’application ne se limitent plus desormaisaux ressources naturelles comme les mines ou le petrole. Plusfondamentalement, les recherches s’orientent vers des domainestheoriques extremement divers. Il est aussi interessant de noter quel’on se remet a prendre en compte les lois de distribution. Cependant,il ne s’agit pas la d’un quelconque retour en arriere : ce sont aucontraire des outils nouveaux dont le besoin se fait sentir et qui sontelabores actuellement. On peut donc penser que cette troisieme phasede la Geostatistique est une etape de synthese, dont il est encore trop

1On prefere maintenant la terminologie : Modeles Numeriques.

Page 11: g é o Statistique

Introduction 9

tot pour prevoir les aboutissants. Cette etape passionnante echappemalheureusement au cadre qui a ete choisi pour le present document.

3. Un point de vocabulaire

On a vu que le neologisme Geostatistique, apparu en 1962, s’adapteparfaitement a la premiere phase evoquee ci-dessus (jusqu’en 1965environ). De fait, il est significatif que beaucoup d’articles anterieurs De Wijs, 1951 ;

Sichel, 1952 ;Matheron,1955, 1956.

a 1960 aient des titres faisant directement mention des methodesstatistiques. Le prefixe geo ne fait donc qu’attirer l’attention surla prise en compte de la repartition spatiale.

A partir des annees 1970, alors meme que le mot connaıt une fortunecroissante et a droit a des traductions en des langues toujours plusnombreuses, il nous semble qu’il se revele moins adequat. Car lesmethodes geostatistiques se developpent alors, on l’a vu, dans desdirections qui leur sont propres, et qui n’ont plus que de lointainsrapports avec la Statistique usuelle. Il naıt alors un probleme decommunication, generateur d’incomprehension. Vouloir approcher laGeostatistique dans une optique exclusivement statisticienne est uneerreur de meme nature — osons ici une simple analogie — que demandera un critique musical de parler d’un tableau. . . Malheureusement, il noussemble bien que bon nombre de conflits ou de polemiques apparus dans Par exemple,

Sibson, 1981.les annees 80 ont leur origine dans ce qui au fond n’aurait du rester qu’unjeu de mots. En particulier, il est clair que le mot Geostatistics, bienqu’etant apparemment une traduction evidente de Geostatistique,n’a pas la meme acception qu’en francais.

Plutot que s’egarer dans d’interminables arguties philologiques, on auraitpu choisir de trancher dans le vif, et proposer une terminologie nouvelle.C’est du reste ce qui est fait dans Estimer et Choisir, avecl’apparition de l’expression modeles topo-probabilistes. Ce nouveau E & C, p5.

vocabulaire a certes le double avantage de prendre ses distances avecles Sciences de la Terre — d’ou l’abandon du prefixe geo — et demieux affirmer la genealogie theorique de nos methodes, probabilistesplutot que statistiques. Mais dans le meme temps, il donne l’impression— erronee, rappelons-le — que nous rejetons les methodes deterministes.Et puis, il bouscule un peu les habitudes. . .

Aussi, nous nous en tiendrons a la tradition, et conserverons le motde Geostatistique. Ce mot, presentement, n’est pas defini, et cetteintroduction n’est pas lieu ou proposer une telle definition. Nous esperonsau contraire que le texte qui va suivre, dans sa totalite, permettra aulecteur de se forger sa propre lecon, tant il est vrai que nous ne devonspas etre esclaves des mots, et que la seule chose importante est de savoirde quoi il est question, quel que puisse etre son nom.

4. Sommaire

Dans son plan, ce texte suit exactement l’enchaınement des exposesoraux proposes lors de l’Ecole d’Ete 1989. Afin de permettre aulecteur d’approfondir son travail personnel dans telle direction qui luiconviendra, nous conclurons chaque chapitre, selon les cas, par

• des annexes precisant des points techniques ou des demonstrations ;

• une bibliographie commentee ;

• une reference a des exercices juges particulierement illustratifs ;

• une breve presentation de sujets de reflexion.

Page 12: g é o Statistique

10 Aide-Memoire de geostatistique lineaire :

Les themes qui se degageront au cours de cet expose peuvent etreregroupes en cinq classes :

I. Variables Regionalisees et Fonctions Aleatoires.Il s’agit essentiellement de mettre en place les concepts et lesprincipes directeurs que nous utilisons par ailleurs — en somme toutsimplement de definir de quoi nous voulons parler. En particulier,il est essentiel de preciser a quel niveau d’abstraction nous noussituons a un moment donne : parlons-nous de mathematiquespures (demonstrations, theoremes) ou de physique (adequation d’unmodele a une realite exterieure) ?

II. Geostatistique Transitive.Il serait errone de croire que la Geostatistique se fonde par naturesur un formalisme probabiliste. Ainsi, nous evoquerons brievementles possibilites de travailler dans un contexte deterministe, et lesenseignements qu’apporte cette approche. Mais dans le meme temps,nous soulignerons pourquoi le recours aux modeles aleatoires est sifrequent, et s’impose pour ainsi dire de lui-meme.

III. Buts et moyens de la Geostatistique Lineaire.Nous avons volontairement fixe des limites, parmi le foisonnementdes methodes probabilistes, a ce qui fait l’objet du present cours.Nous preciserons donc ces frontieres et, dans le meme temps, nousferons l’inventaire des outils mathematiques requis pour la mise enpratique de cette Geostatistique Lineaire.

IV. Stationnarite et Ergodicite.Il s’agit la d’un theme recurrent. Pour pouvoir, dans des conditionsrealistes, appliquer a des donnees reelles les methodes elaborees auplan theorique, il importe de s’assurer de bonnes proprietes denos modeles, et de veiller a l’adequation de ces modeles aux donneeseffectivement etudiees. Stationnarite et ergodicite sont deux de cesbonnes proprietes, deux concepts-clefs auxquels nous ramene enpermanence la Geostatistique appliquee.

V. Estimations.Les problemes d’estimation sont parmi les plus frequemmentrencontres en pratique. Nous distinguerons l’Estimation Globaleet l’Estimation Locale qui, plus connue sous le nom deKrigeage, constitue le plus souvent le but meme d’une etudegeostatistique, et connaıt de nombreux developpements, tanttheoriques qu’informatiques. L’Estimation Globale, moins souventsollicitee, permet de soulever des questions methodologiquesessentielles a une bonne comprehension de la pratique geostatistique.

A ces cinq themes fondamentaux, il faudra prevoir d’en rajouter deuxautres qui ouvrent la porte a de multiples developpements :

VI. Variographie.Egalement nommee Analyse Structurale, cette etape est la phaseessentielle d’une etude reelle. Il s’agit de jeter un pont entre leformalisme abstrait elabore au niveau mathematique, et les donneesreelles que l’on souhaite etudier. Un tel sujet se prete evidemmentdifficilement a un expose fige, et rien dans ce domaine ne sauraitprendre le pas sur l’experience. Tout au plus peut-on proposerici quelques exemples et illustrations, ainsi que des remarquesempiriques ; mais il ne saurait y avoir de panacee.

VII. Developpements, et techniques specialisees.Meme dans le cadre strictement lineaire, l’eventail est large desextensions que l’on peut proposer aux methodes elementaires de laGeostatistique classique. On pense en particulier aux problemesmultivariables, qui correspondent a des situations frequemmentrencontrees dans la pratique. On peut aussi evoquer les modelesnumeriques (les Simulations, conditionnelles ou non) qui sont a lacharniere avec le domaine de la Geostatistique Non Lineaire.

Page 13: g é o Statistique

Chapitre 1

Variables Regionaliseeset Fonctions Aleatoires

Presentation

Ce chapitre a pour but de mettre en place l’objet et lesmethodes de la Geostatistique, et singulierement de souligner lesproblemes souleves par l’utilisation des modeles probabilistes dansles Sciences Naturelles.

Le premier paragraphe examine le statut des deux niveaux demodeles (deterministe, puis aleatoire) sollicites en Geostatistique.

Le second paragraphe detaille les problemes methodologiquesrencontres dans le cadre du choix probabiliste, et precisel’articulation entre les deux niveaux de modelisation.

Au troisieme paragraphe, on introduit les concepts de stationnariteet d’ergodicite, qui sont a l’arriere-plan de toutes nos modelisationsprobabilistes.

Enfin, le quatrieme paragraphe propose quelques reperes quidoivent guider le Geostatisticien aux prises avec un probleme reel.

1. Les deux niveaux de modele

1.1. Point de depart : le phenomene regionaliseAu commencement d’une etude geostatistique se trouve une informationbrute, partie quantitative, partie qualitative, que l’on cherche a mettre enforme puis a utiliser dans le cadre de tel ou tel probleme. Qu’il s’agissede teneurs minieres, de donnees meteorologiques ou economiques, demesures de pollution, de bathymetrie, de geophysique, cette informationa coute du temps, de la fatigue et de l’argent, et demande donc a etremanipulee avec respect.

Le respect de la donnee brute est sans doute la premiere regle d’or de J J J

la Geostatistique appliquee. La realite n’a pas a se plier a nos futuresconstructions intellectuelles ; bien au contraire, nous devons adapter nosoutils au materiau que nous aurons a travailler. Mais comme il n’existepas de panacee, il nous faut d’emblee circonscrire nos ambitions : unemethodologie qui saurait traiter de tout serait probablement soit untrivial passe-partout generateur de banalites, soit un monstre ecrase sousson propre poids. La Geostatistique, quant a elle, a choisi de s’attaqueraux phenomenes regionalises.

Par phenomene regionalise nous entendons un phenomene naturel quise deploie dans l’espace. La restriction a des phenomenes naturels —par opposition a des fonctions mathematiques — est imposee par uneconstatation de bon sens : la Geostatistique que nous proposons iciserait, a notre connaissance, depourvue d’interet pour l’etude de tellesfonctions. Quant a l’espace ou se deploie le phenomene regionalise, ils’agit bien sur le plus souvent de notre espace geographique, espaceeuclidien a 1, 2 ou 3 dimensions ; mais il peut s’agir aussi du temps, voire

Page 14: g é o Statistique

12 Aide-Memoire de geostatistique lineaire :

d’espaces plus complexes. Quoi qu’il en soit, etant donne son objet etson champ d’application, la Geostatistique ainsi definie apparaıt bel etbien comme une science physique.

La premiere colonne de la figure1, en fin de chapitre, illustre cettesituation : c’est bien dans le domaine du monde physique (symbolisepar la terre) que se recoltent les donnees qui alimenteront notreetude. Remarquons au passage que, par la force des choses, lephenomene regionalise est rarement accessible exhaustivement, et passela plus souvent par le filtre d’un echantillonnage1 ; le probleme del’echantillonnage n’est cependant pas specifiquement geostatistique, etne sera pas examine ici. En tout cas, c’est bien egalement dans ledomaine du monde physique que s’expriment et doivent se resoudre lesproblemes poses. Ce ne sont pas des vues de l’esprit, mais des teneursbien reelles qui seront envoyees en laverie, des debits bien reels quialimenteront les fleuves, des temperatures bien reelles qui gacherontou agrementeront vos vacances, des cours bien reels qui enrichiront ouruineront les speculateurs. . .

Et pourtant, la connaissance meme exhaustive du PhenomeneRegionalise ne suffirait en general pas a resoudre les problemes,parce que les valeurs numeriques ne sont pas le reel, mais uneE & C, p2.

premiere image (analytiquement tres riche, structuralement tres pauvre)de celui-ci. L’amoncellement des donnees brutes ne permet a luiseul la comprehension d’un phenomene ni vers l’amont (genese desdonnees initialement obtenues), ni vers l’aval (anticipation ou explicationde l’evolution du phenomene). Aussi doit-on, dans le processusd’exploitation des donnees, savoir prendre un temps ses distances d’avecle domaine de la realite physique, afin de construire des modelesintellectuels qui permettront de depasser le stade d’une interminableet sterile trituration des donnees brutes. De facon un peu provocante, ils’agit d’adjoindre une information supplementaire a ces donnees brutes.

Ce mecanisme du recours a la modelisation est illustre a la figure1 et, enGeostatistique classique, comporte deux etapes d’abstraction croissante.

1.2. Premiere etape : la Variable RegionaliseeNous supposerons desormais que le Phenomene Regionalise est connu(ou interessant, ou defini. . . ) sur un domaine borne S. Cette precisionest importante : elle souligne en particulier que les methodes que nousallons proposer ne pretendent nullement a un caractere d’universalite,mais sont au contraire assujetties a un domaine de validite. Cettelimitation s’apparente tres etroitement aux conditions de laboratoired’une experience en Physique a ceci pres que, contrairement auxPhysiciens, nous ne sommes que tres rarement maıtres du choix de notredomaine de validite.

Il est capital en tout cas de garder a l’esprit que toutes les manipulationsque nous ferons desormais sont donc relatives a un certain champS, et que toute extrapolation au-dela des limites de ce Champ devraetre evitee, ou en tout cas faite en connaissance de cause. Ce principereviendra a mainte reprise tout au long de l’expose.

Revenons maintenant au Phenomene Regionalise, circonscrit a sonChamp S. Nous supposons que ce phenomene se laisse decrire deE & C, p76.

maniere satisfaisante par la donnee d’une (ou eventuellement plusieurs)fonction z definie sur S, que nous appellerons, d’un terme general,variable regionalisee (V.R.).

Le premier niveau d’abstraction est atteint (cf. figure1, deuxiemecolonne) : le Phenomene Regionalise etait une realite physique, la

1Cette affirmation merite de plus en plus d’etre nuancee : il n’est plus rare

desormais que la Geostatistique ait a traiter par exemple des images satellitales,

qui constituent une approche exhaustive du phenomene etudie.

Page 15: g é o Statistique

[1] – Variables Regionalisees et Fonctions Aleatoires 13

Variable Regionalisee est une fonction. C’est un etre mathematique,susceptible de manipulations intellectuelles. En quelque sorte, la VariableRegionalisee a acquis une certaine autonomie vis-a-vis du phenomenequ’elle represente et — en termes anthropocentriques — elle peutdesormais vivre sa vie mathematique en oubliant le phenomene dontelle est censee temoigner. Inutile de dire que, pour l’interet pratiqued’une etude, cette liberte doit etre strictement surveillee. . .

Nous devons ici preciser qu’une Variable Regionalisee est une fonction Nous supposeronscette fonction reelle.Le cas d’une VRcomplexe demeureassez exceptionnel.

numerique. La Geostatistique theorique travaille sur des quantites, etl’information non numerique ou qualitative (par exemple, la geometrie)— bien que souvent decisive pour le bon deroulement d’une etude —echappe au formalisme general que nous voulons developper dans le . . . ou alors, il faut passer

par un codage numerique.present document.

Cette distinction entre Phenomene Regionalise et Variable Regionaliseepeut sembler triviale, et en tout cas sans mystere. A titre d’exemple,prenons pour Phenomene Regionalise le relief d’une region : c’est lui quioccasionne la fatigue lorsqu’il est parcouru sac au dos, qui offre la vuepanoramique lorsqu’on atteint le sommet, etc. La Variable Regionaliseeassociee sera, cela va de soi, la cote topographique. Le passage dupremier a la seconde paraıt anodin. Et pourtant, les pieges sont deja enplace. Supposons par exemple que la fonction cote topographiquesoit derivable ; cela aurait-il un sens de dire que sa derivee represente laderivee du relief ? Quel sens est-il reellement possible de donner acette derniere expression ?

Nous voyons ici apparaıtre le probleme du retour (apres manipulationsmathematiques) du modele a la realite physique. L’exactitudemathematique des operations entreprises ne suffit pas a garantir lesens physique du resultat. Il faut donc a chaque enonce distinguerscrupuleusement ce qui est propriete du modele et ce qui est caractere dela realite physique. Par exemple, l’enonce meteorologique le vent estle gradient de la pression, au sens litteral, n’a pas de sens : la pressionest un phenomene physique, et le gradient une operation mathematique.Il faut comprendre que l’enonce est un raccourci pour dire : nousdisposons d’un modele dans lequel la fonction (Variable Regionalisee)censee representer le vent est le gradient de la fonction censee representerla pression. Cet enonce, certes bien lourd, a l’avantage de separerclairement les deux niveaux :

• une affirmation au niveau mathematique, qui exprime une proprieteinterne du modele (identite de deux fonctions). Cette affirmation estsoit vraie, soit fausse ;

• une affirmation au niveau physique, qui exprime un lien entre lemodele et la realite. Cette affirmation ne peut etre declaree vraie oufausse ; on dira qu’elle est judicieuse ou non, adequate ou non — cequi prouve incidemment l’apparition d’une forme de subjectivite ace niveau du discours.

Naturellement, l’enonce laconique le vent est le gradient de lapression demeure un raccourci satisfaisant, des lors que l’on conservea l’esprit toutes les remarques precedentes. Mais, nous l’avons vu,les pieges sont deja en place et, n’etant pas Mathematicien pur, leGeostatisticien se devra a chaque etape de garder son sens critiqueen eveil, et ne pas se contenter de l’exactitude mathematique de Il est bon de rappeler avec

insistance cette exigence :il serait dramatique qu’unpragmatisme mal comprisincite a considerer larigueur mathematiquecomme superflue !

ses constructions : celle-ci est bien sur une condition necessaire(indispensable !) mais ne constitue pas une condition suffisante de laqualite d’un travail geostatistique.

1.3. Les lecons du modele primaire

Pour bien souligner le pas methodologique qui a ete franchi, nousdesignerons par modele primaire le modele des Variables Regionalisees. E & C, p89

Page 16: g é o Statistique

14 Aide-Memoire de geostatistique lineaire :

Ce premier niveau d’abstraction est, rappelons-le, illustre par lacolonne 2 de la figure1.

Nous esperons que les remarques du paragraphe precedent apparaissenttriviales et pesantes. Encore faut-il ne pas les perdre de vue. Carelles acquerront une acuite de plus en plus grande a mesure que l’ons’aventurera dans des modeles de plus en plus abstraits. Aussi noussemble-t-il deja temps de degager quelques lecons, qui devront restersous-jacentes a tous nos developpements ulterieurs.

Et tout d’abord : le modele, jamais, n’est identique a la realite.I I I

D’innombrables aspects du reel lui echappent toujours, et, inversement,E & C, p30.

le modele contient toujours d’innombrables propositions parasites, sanscontrepartie aucune dans la realite. Tout l’art — ou en tout cas toutela discipline — de la Geostatistique consiste a menager l’equilibre entrerealite et modele, tout en sachant respecter, en cas de desaccord, lapreeminence de la realite sur le modele. C’est la contrainte du seuilde realisme au-dela duquel la Geostatistique deviendrait un exercice deE & C, p23.

mathematique pure, passionnant certes, mais totalement hors du proposdu present expose.

Plus precisement, le concept de Variable Regionalisee est cense collera la realite physique (ce qui est symboliquement figure par le paralleleentre les deux premieres colonnes de la figure1). Aussi ce concept est-il soumis a des limitations assez strictes en dehors desquelles il cessed’etre operatoire. De ce point de vue, nous ne devons pas prendre auE & C, p89.

pied de la lettre des enonces purement mathematiques concernant parexemple la continuite ou la derivabilite de la Variable Regionalisee. . .Il s’agit la, toujours, de caracteristiques du modele, et non, en touterigueur, de proprietes de la realite physique..

Soulignons une nouvelle fois que ces remarques auront une importanceaccrue au niveau des modeles probabilistes. Nous n’y reviendrons pas,ayant deja ete assez pesants sur le sujet. Mais force est de constater que lameconnaissance de cette discipline peut conduire a de lourds contresens.On pourra, a titre d’exemple, reflechir aux ambiguıtes de la notion decontinuite telle qu’elle apparaıt en cartographie.Sibson, 1981, p22 ;

Chauvet, 1987 (a), p84-92.

1.4. Les outils du modele primaire

Placons-nous maintenant au niveau du Modele Primaire, c’est-a-dire dela Variable Regionalisee. Cela signifie que — pour un temps seulement !— nous oublions la realite physique et que nous parlons de manipulationsmathematiques (figure1, deuxieme colonne).

Nous avons affaire a une fonction numerique (supposee reelle, poursimplifier). Des lors, tout traitement numerique peut etre envisage, enparticulier les Statistiques classiques et l’Analyse des Donnees.

Du point de vue geostatistique, il existe une possibilite d’approchedirecte de la Variable Regionalisee. Les outils sollicites sont elementaires,et s’apparentent tous a des integrales d’espace. En realite, la VariableRegionalisee etant presque toujours disponible sur un echantillonnagefini, ces integrales se reduisent a des sommes finies. Le passage d’unformalisme fini a un formalisme continu peut d’ailleurs susciter desproblemes, qui seront evoques au chapitre suivant ; cela dit, le travaildirect sur la Variable Regionalisee presente de reels avantages : aucunehypothese n’est requise, et en particulier pas de nature probabiliste, pourdonner un sens aux calculs. On travaille sur un Champ parfaitementcirconscrit, borne, ce qui evacue les problemes de type stationnarite etFasc. 5, p6-7.

ergodicite (cf. infra). Les outils utilises sont absolument generaux.

On designe sous le nom de geostatistique transitive la partie de laGeostatistique qui opere directement sur la Variable Regionalisee, horsde toute hypothese supplementaire. Cette Geostatistique Transitive faitl’objet du second chapitre. On y voit en fait assez rapidement qu’il

Page 17: g é o Statistique

[1] – Variables Regionalisees et Fonctions Aleatoires 15

est difficile de faire l’economie d’une modelisation probabiliste mais,a l’inverse, cette approche tout a fait generale eclaire la significationde l’usage des probabilites en Geostatistique. Dans l’esprit du presentexpose, nous invoquerons la Geostatistique Transitive essentiellementpour cet apport methodologique ; pour les details techniques, nousrenverrons a la bibliographie.

Pour le moment, supposons acquises les lecons tirees de la GeostatistiqueTransitive, et admettons l’utilite de recourir a un modele probabiliste.Nous abordons ainsi le second niveau d’abstraction qui, en quelque sorte,

Matheron 1965,1ere partie ;Fasc 5, chapitre 1.

nous eloigne encore un peu davantage de la realite physique.

1.5. Le modele topo-probabilisteCe second niveau d’abstraction est designe par le terme tres general de Matheron 1965,

2eme partie ;Fasc 5, p6.geostatistique intrinseque, par opposition a Geostatistique Transitive.

Le modele constitutif est celui de Fonction Aleatoire : nous decidons deconsiderer la Variable Regionalisee comme Realisation d’une FonctionAleatoire. Ce choix — car c’en est un, et entierement libre — peut sereveler a terme opportun ou non, efficace ou non, mais il n’est en toutcas ni vrai ni faux. C’est une decision totalement arbitraire (et ce mot J J J

n’a strictement aucune connotation pejorative) dont nous esperons unregain d’efficacite. Quant au prix a payer, nous le connaissons deja :du fait que nous allons vers une abstraction croissante, il est previsibleque le retour vers la realite physique sera plus delicat. Les leconsdegagees au §1.3 ont ici une importance considerablement accrue.

Au plan mathematique, l’objet de l’etude est maintenant une FonctionAleatoire, traditionnellement notee Z. Cette fonction est donc definie ala fois dans un espace geographique et dans un espace probabilise— d’ou le nom de modele topo-probabiliste. L’espace geographiquen’a pas change : c’est le meme que pour la Variable Regionalisee associee,c’est-a-dire que c’est le modele de l’espace physique dans lequel ontravaille. En revanche, l’espace probabilise est une pure creation denotre esprit : il n’est l’image d’aucune realite physique. Ce n’est qu’unintermediaire de calcul, dont on espere qu’il nous rendra des services,mais qui doit s’evincer de l’enonce des resultats finaux. En aucun cas,la Geostatistique Intrinseque ne doit se transformer en une quete desvraies lois de probabilite, du vrai espace probabilise : il n’y a J J J

pas de vraie loi de probabilite ni de vrai espace probabilise, iln’y a que des outils qui ne feront rien, ni plus ni moins, que ce que leurdemandera le Geostatisticien. Charge a ce dernier de choisir des outilsadaptes a son probleme.

Il n’y a pas de probabilite en soi. Il n’y a que des modeles E & C, p37.

probabilistes.. Nous avons ici un exemple spectaculaire de la regle(§1.3) qui nous fait obligation de distinguer le modele de la realite. Lerisque est reel cette fois de s’engager dans des speculations au sens strictmetaphysiques. Comme illustration, la figure1 symbolise la longueur duchemin qu’il faut faire maintenant pour boucler la boucle, c’est-a-dire pour revenir apres traitement mathematique au niveau de la realitephysique. Mais, si les precautions necessaires ont ete prises, l’interet decette demarche — de ce detour pourrait-on dire — peut etre enorme. Carle passage au formalisme probabiliste met a notre disposition un arsenalmathematique considerable qui — l’experience le prouve — est dans biendes cas le seul ou en tout cas le meilleur qui puisse nous permettre deresoudre les problemes qui nous occupent.

1.6. NotationsNous designerons par x le point courant de l’espace de travail — c’est-a-dire de l’espace geographique. Nous avons precedemment note z laVariable Regionalisee etudiee. En notation complete, il s’agit donc d’unefonction z(x), pour x ∈ R

n.

Page 18: g é o Statistique

16 Aide-Memoire de geostatistique lineaire :

La Fonction Aleatoire associee est definie a la fois sur l’espacegeographique et sur un espace probabilise. Si on la designe par Z,c’est donc une fonction Z(x, ω), ou ω est un evenement de l’espaceprobabilise.

Une fois pour toutes, precisons ce modele probabiliste. Un espaceprobabilise est un triplet (Ω,A, P ) ou, en termes intuitifs :

• Ω est l’inventaire des etats possibles du systeme etudie ;

• A est l’ensemble des enonces, relatifs aux etats du systeme, ayantun sens ;

• P est une loi de probabilite, c’est-a-dire intuitivement une regle devaluation d’un enonce de A.

Il est inutile de souligner l’incroyable richesse d’un tel modele, mais aussison caractere abstrait : si dans certains cas particuliers on peut envisagerde donner un sens physique a Ω, il est clair par contre que P demeure unepure creation intellectuelle. Qui a jamais pu observer une probabilite ?I I I

Pour en revenir a la Fonction Aleatoire Z, elle s’ecrit donc Z(x, ω),avec x ∈ R

n et ω ∈ A. L’usage dans la litterature geostatistique estd’ailleurs de negliger l’ecriture de l’evenement ω, et de se contenter denoter Z(x). De plus, la coutume est de noter par des lettres minusculesles Variables Regionalisees, et des majuscules les Fonctions Aleatoires.La phrase : la Variable Regionalisee z est realisation de la FonctionAleatoire Z se traduit donc par la formule

z(x) = Z (x, ω0)

ou ω0 est un element de A tire selon la loi de probabilite P .

Cette relation a elle seule resume la methodologie et souleve le problemefondamental de la Geostatistique Intrinseque.

2. Geostatistique Intrinseque : problemes et methodes

2.1. LE probleme methodologiqueLe parallele entre la Variable Regionalisee et la Fonction Aleatoire meten lumiere une difference de statut essentielle.

Bien que de nature purement mathematique, la fonction z(x)demeure assez proche du monde physique. On a l’impression qu’unechantillonnage de plus en plus fin de cette fonction permettraitd’acceder a une connaissance exhaustive du phenomene qu’ellerepresente. Certes, il est vraisemblable que z(x) se revelerait deplus en plus compliquee a mesure que l’echelle de travail s’affinerait.Pourtant, il ne s’agit la que d’une simple difficulte technique, certesrisquant d’affecter le confort d’utilisation du modele, mais ne soulevantaucun probleme methodologique essentiel. En resume, on pourraitdire que le travail au niveau du modele primaire se reduit a desproblemes d’approximation. Le parallele entre realite physique etVariable Regionalisee reste assez facile a maintenir.

Au contraire, avec l’irruption d’un Espace Probabilise sous-jacent, lemodele de Fonction Aleatoire laisse une part considerable a l’arbitrairedu Geostatisticien. Il y a dans un modele complet de Fonction AleatoireI I I

infiniment plus d’information structurale qu’il n’y en a dans la VariableRegionalisee associee, et le Geostatisticien doit etre conscient quecette information supplementaire, c’est lui qui l’a injectee dans sonmodele. Il faut imperativement s’assurer que ce surcroıt d’informationne compromet pas la possibilite meme du retour a la physique duphenomene. En fait, d’emblee, on devine qu’il conviendra de limiterau maximum cet arbitraire dans le choix du modele. Il faut bien voirque cette incroyable richesse des modeles mathematiques n’est pas un

Page 19: g é o Statistique

[1] – Variables Regionalisees et Fonctions Aleatoires 17

atout pour le Geostatisticien applique, mais bien au contraire un ecueilparticulierement redoutable.

Il y a beaucoup plus fondamental cependant. Dans la plupart descas en Geostatistique, le phenomene physique est unique. Quel senspeut-on alors esperer donner a un modele probabiliste pour l’etuded’un tel phenomene ? Ou encore, plus concretement, comment peut-on esperer remonter a un modele complet de Fonction Aleatoirea partir d’une seule de ses Realisations ? En fait, presente ainsi, leprobleme est trivialement insoluble, d’autant plus que, nous l’avons vu,il n’existe pas d’Espace Probabilise reel qui se cacherait derriere lesdonnees. Contrairement a ce qui se passe en Geostatistique Transitive,il ne s’agit pas ici d’un simple probleme de quantite d’information, maisbien d’une difficulte de fond.

2.2. Element de solutionDe facon encore plus generale, on peut se demander comment un

J J J

evenement unique (ici, la Realisation d’une Fonction Aleatoire) peutfaire l’objet d’une approche scientifique, la condition de repetabilitequi, seule, fonde l’objectivite de nos disciplines scientifiques faisant ici E & C, p14.

defaut par definition..

La reponse dans ses grandes lignes est ceci : . . . si nous depouillons parla pensee l’evenement unique et singulier de telles ou telles circonstancesanecdotiques qui l’accompagnent (. . . ) de maniere a le reduire austatut d’occurrence particuliere d’une classe plus generale d’evenementssusceptibles de se repeter, alors, par cette demarche meme, nous le E & C, p14.

constituons en tant qu’objet d’une connaissance scientifique possible. Et,par la meme, nous devenons capable d’avancer des modeles, ou theories(. . . ), susceptibles d’etre corrobores ou refutes selon qu’ils se revelerontou non ”en accord” non seulement avec cet evenement-ci mais aussi avectous ceux qui relevent de la meme classe (constituee par nous) et quenous aurons eu l’occasion d’observer..

Il conviendra des lors d’adapter cette demarche au cas particulierdes Fonctions Aleatoires. Et l’on note tout de suite que cette voie,lorsqu’elle peut etre suivie, permet non seulement d’elaborer des modeles(abstraction croissante sur la figure1), mais egalement de les valider(controle des hypotheses).

Nous disposons donc d’un element de solution au probleme methodo-logique de la Geostatistique Intrinseque, mais au prix d’un engagementpersonnel : c’est a nous de decider de ce qui est anecdotique —donc a contrario de ce qui est significatif. Mais il ne faut pas se faired’illusions : les limites du realisme, voire du simple bon sens, restreignentnotablement cette apparente liberte. Tout l’art du Geostatisticienchevronne consiste a trouver, avec le moins de tatonnements possibles,un equilibre harmonieux entre les exigences de realisme et la richessedu modele. Mais surtout, le Geostatisticien sait (et doit garder enpermanence a l’esprit) qu’il n’existe pas de vrai modele qui auraitete perdu et qu’il faudrait retrouver, mais que tout modele coherent J J J

en theorie est admissible tant qu’il est en accord avec les observationsrealisees sur le phenomene qu’il est cense representer.

2.3. Mecanismes de passageLa mise au point des outils de la Geostatistique Intrinseque demandeun va-et-vient constant entre les modeles Variable Regionalisee etFonction Aleatoire.

Dans le sens de l’elaboration des outils d’abord, il s’agit d’unerandomisation

2 . Dans une expression jugee interessante et exprimee

2Nous conserverons ce barbarisme, faute de disposer d’un mot francais equivalent

consacre par l’usage. Mais, sur une suggestion de F. Maisonneuve, pourquoi

n’adopterions-nous pas l’expression : immersion probabiliste ?

Page 20: g é o Statistique

18 Aide-Memoire de geostatistique lineaire :

en termes de Variable Regionalisee, on substitue Z a z, et on etudie lesproprietes du nouvel etre mathematique en beneficiant de tout l’arsenaldes methodes probabilistes. Ainsi par exemple la valeur moyenne

z(v) =1

[v]

v

z(x) dx

calculee sur un support v de mesure [v] est, dans le Modele Primaire,un simple nombre. Apres Randomisation,

Z(v) =1

[v]

v

Z(x) dx

est une Variable Aleatoire, c’est-a-dire que, dans le modele constitutif, onpeut lui associer esperance mathematique, variance, loi de distribution,probabilites de depassement de seuils. . .

A l’inverse, apres traitement probabiliste, on peut revenir d’uneVariable Aleatoire a une quantite deterministe en substituant z a Z —c’est cette fois l’operation classique de Realisation. Par exemple, sides considerations probabilistes (sur esperance et variance, par exemple)C’est, par exemple,

la demarche duKrigeage, cf. Chapitre 6,

paragraphe 3 .

nous ont permis de construire un estimateur

Z∗ =∑

α

λαZ(xα)

(les λα etant des coefficients de ponderation), nous pouvons associer acette variable aleatoire Z∗ une valeur numerique z∗, en substituant lesz(xα) aux Z(xα) — soit

z∗ =∑

α

λαz(xα)

Dans la pratique, ce va-et-vient est beaucoup plus discret. On appliquede facon quasi automatique les formules issues du modele probabilisteaux valeurs numeriques, c’est-a-dire a la Variable Regionalisee. Encoreconviendrait-il de s’assurer que les manipulations entreprises auniveau theorique conservent un sens physique. Cette necessite d’unereconstruction operatoire sera evoquee au paragraphe ci-dessous.

3. Deux notions essentiellesNous voulons maintenant examiner de facon un peu plus approfondiele probleme methodologique souleve par le recours a un modeleprobabiliste.

Une premiere idee, devant la richesse du modele de Fonction Aleatoire,est de limiter nos ambitions et de nous borner a une classe plus modeste— c’est-a-dire a un ensemble de Fonctions Aleatoires satisfaisant aun certain nombre de contraintes. La seconde idee est de choisir descontraintes qui permettent, dans une certaine mesure, de contourner ladifficulte liee a l’unicite de la Realisation disponible. C’est ainsi que l’onest amene a solliciter la propriete de stationnarite.

3.1. StationnariteAu niveau du modele probabiliste, la stationnarite est une proprietedefinie sans ambiguıte : c’est l’invariance par translation de la LoiSpatiale du processus. Autrement exprime, cela signifie que la loi d’unmultiplet quelconque de points (de dimensions et orientation fixees) nedepend pas de l’implantation de ce multiplet.

Page 21: g é o Statistique

[1] – Variables Regionalisees et Fonctions Aleatoires 19

Deux remarques d’abord. D’une part, la stationnarite stricto sensu

est une propriete extremement forte, en ceci qu’elle concerne tous lesmultiplets possibles de points du processus. Par contre, cette proprietene contient aucune hypothese specifique concernant les moments, quipeuvent parfaitement ne pas exister.

Il apparaıt vite qu’un tel modele est totalement inappliquable auxVariables Regionalisees. C’est pourquoi il nous faut introduire lapropriete de stationnarite d’ordre 23 . Cette notion est, elle aussi, unepropriete mathematique precise, qui s’enonce ainsi : les esperances desvaleurs ponctuelles et des doublets de points du processus existent, etsont invariantes par translation. On se contente ainsi d’une proprieteconcernant au plus les lois bivariables, mais on exige en revanchel’existence des moments d’ordre 1 et 2 construits sur les valeursponctuelles.

En ce qui concerne les deux premiers moments tout au moins, leprocessus se reproduit identiquement a lui-meme dans toutes les

Dire qu’une quantite existe, c’estdire qu’elle prendune valeur finie.

regions de l’espace. Cela signifie qu’en parcourant l’espace, on rencontredifferentes Realisations de la meme loi (du moins au niveau des deuxpremiers moments) : on a ainsi dans une certaine mesure, grace al’hypothese de stationnarite, contourne la difficulte liee a l’unicite dela Realisation disponible.

Il s’agit cependant d’etre prudent. D’abord parce que meme si les lois(aux deux premiers ordres) du processus dans differentes regions del’espace sont identiques, elles ne sont pas independantes. De sorte que, en J J J

general, les Realisations multiples que l’on a suscitees sont relativesa des processus correles. A priori , cela complique considerablement uneapproche statistique de ces Realisations.

3.2. Ergodicite

Mais il y a plus. Il faut pouvoir etablir un pont entre la loi du processus etsa structure spatiale, qui seule sera observable au niveau de la Realisationdisponible. On dira par definition que le processus stationnaire satisfaita l’hypothese ergodique si la suite des moyennes d’espace

Zn =1

[Sn]

Sn

Z(x)dx

converge vers l’esperance mathematique E [Z] (qui est invariante dansl’espace d’apres l’hypothese de stationnarite) lorsque les domaines Sn

tendent vers l’infini. Nous renvoyons ici a la bibliographie pour les Lantuejoul, 1990 ;Boulanger, 1990.

complements techniques sur les modes de convergence.

Mentionnons des a present l’importance decisive de cette propriete : c’estelle, et elle seule, qui legitime le recours a des calculs numeriques de Chapitre 4, paragraphe 3.

moyennes spatiales pour estimer les deux premiers moments du modeleprobabiliste.

3.3. Recapitulation preliminaire

Nous disposons maintenant de limitations theoriques qui, nousl’esperons, rendront nos modeles operatoires. Ces deux proprietespeuvent se resumer en quelques formules lapidaires :

stationnarite : tout se passe de la meme facon dans toutes lesregions de l’espace, ou encore : tout se passe comme si onavait (les realisations de) plusieurs processus de meme loi. Maisattention : ces processus ne sont pas independants ! J J J

3Par abus de langage, on se contente souvent de l’expression stationnarite,

reservant a la definition precedente le nom de stationnarite stricte.

Page 22: g é o Statistique

20 Aide-Memoire de geostatistique lineaire :

ergodicite : lorsqu’elles sont realisees sur des domaines de plusen plus grands, les moyennes spatiales convergent vers l’esperancemathematique . Sous reserve que l’information soit suffisammentabondante, on peut donc approcher les deux premiers moments dela loi du modele probabiliste.

Remarquons au passage que la stationnarite n’implique pas l’ergodicite.Par exemple, il est immediat que le processus Z(x) = A, ou A est unevariable aleatoire quelconque, est stationnaire mais pas ergodique.

3.4. Parallele entre les deux niveaux de modelesIl s’agit maintenant de voir en quoi la limitation du modele probabiliste a

I I I

des processus aleatoires stationnaires et ergodiques permet de maintenirun parallele satisfaisant avec le modele primaire. Pose dans le sens del’analyse structurale4 , tel donc qu’il se presente dans une etude reelle,Voir par exemple

Journel, 1978,chapitres III et IV. le probleme s’enonce ainsi : la Variable Regionalisee etudiee peut-

elle (raisonnablement) etre consideree comme Realisation d’un processusstationnaire ergodique ?.

Notons d’emblee que nous sommes contraints de recourir a un modeleprobabiliste ergodique. En effet, nous ne disposons que d’une seuleRealisation du processus : comment savoir ce qu’aurait ete la limitedes moyennes spatiales sur une autre Realisation, a supposer meme quecette question ait un sens ? Nous sommes donc contraints de supposerque cette limite est l’esperance mathematique, c’est-a-dire en particulierqu’elle est la meme pour toutes les Realisations. Ce qui revient a choisircomme definition de l’esperance mathematique la limite de la suite desE & C, p105.

moyennes spatiales..

On observe que l’ergodicite est une propriete du modele probabiliste.Il n’en existe pas d’equivalent empirique au niveau de la VariableRegionalisee ; il n’existe donc pas de controle a priori de l’opportunitede representer une Variable Regionalisee donnee par un processusergodique. Par contre, il y a des possibilites de controle a posteriori ,c’est-a-dire au niveau de la cohesion interne du modele probabiliste. Enfait, le Geostatisticien experimente sait assez tot en general au coursd’une etude, par le biais de l’allure des fonctions structurales qu’ilconstruit, si l’ergodicite de son modele est raisonnablement admissible.

Dans toute la suite de ce paragraphe, nous supposons donc le modeleprobabiliste ergodique. La propriete de stationnarite se presente alorssous un angle totalement different, car on peut maintenant la traduireau niveau des Realisations (c’est-a-dire de la Variable Regionaliseeassociee) : les moyennes locales de la Realisation oscillent autour d’unevaleur constante dans l’espace (consequence de la stationnarite del’esperance), et ces oscillations ont la meme amplitude dans toutesles regions de l’espace (consequence de la stationnarite du momentd’ordre 2). Notons que si le modele probabiliste etait completementspecifie, la theorie permettrait de quantifier ces fluctuations, doncde construire des tests d’acceptation ou de rejet de l’hypothese destationnarite.

Revenons maintenant au probleme tel qu’il se presente au coursd’une etude sur des donnees reelles. Initialement, nous ne disposonsque de la Variable Regionalisee. La question : cette V.R. peut-elle(raisonnablement) etre consideree comme Realisation d’un processusstationnaire ? se ramene a la double interrogation :

1. la Variable Regionalisee presente-t-elle une valeur raisonnablementconstante dans l’espace ?

2. si oui, ses fluctuations autour de cette valeur sont-elles dans le memetemps raisonnablement constantes dans l’espace ?

4Nous suggerons d’utiliser plutot le terme analyse variographique, ou plus

simplement variographie, l’expression analyse structurale initialement

adoptee ayant une autre signification en Sciences de la Terre.

Page 23: g é o Statistique

[1] – Variables Regionalisees et Fonctions Aleatoires 21

C’est a dessein que nous utilisons l’adverbe raisonnablement, pourbien souligner qu’il s’agit cette fois d’une question purement empirique.Il n’est pas question a ce niveau de proposer des tests : au niveautheorique, des tests de stationnarite exigeraient une specification dumodele probabiliste bien plus complete a la fois que ce qui est requisulterieurement par la Geostatistique Lineaire, et que ce que l’on peutesperer atteindre en respectant le seuil de realisme. Autrement dit, E & C, p93.

l’hypothese de stationnarite au niveau de la Variable Regionalisee estune conjecture de nature physique, qui doit realiser un equilibre entrela commodite de manipulation mathematique et la compatibilite avecles donnees, et qui peut etre remise en cause au cours du travailgeostatistique. Ce sens physique est en definitive beaucoup plusimportant que la theorisation mathematique. E & C, p93.

3.5. Notion d’echelleL’approche physicienne des Variables Regionalisees met en evidencel’importance d’un facteur qui est totalement absent du formalismeprobabiliste : l’echelle. Il apparaıt en effet que la reponse a la question : la Variable Regionalisee peut-elle etre consideree comme Realisationd’un processus stationnaire ? depend de l’echelle de travail.

Il n’y a rien la de mysterieux, au contraire. A l’exception de phenomenestres particuliers (autohomothetiques), un meme objet pourra etre Matheron, 1975.

considere comme regulier ou irregulier, constant ou variable, structureou non, stationnaire ou non (tous ces qualificatifs etant pris au sensempirique), selon l’echelle a laquelle il sera examine : pensons parexemple aux cartes geographiques. . .

Le mieux est de proposer un exemple. Mais auparavant, denoncons toutde suite un prejuge malheureusement repandu : il n’y a pas de lienoblige, d’une part entre le structure et le deterministe, d’autre part entre Matheron, 1975.

l’erratique et l’aleatoire. Nous esperons avoir suffisamment souligne quedeterministe ou aleatoire sont des caracteristiques du modeleque nous avons librement choisi d’utiliser. Nous venons de voir questructure ou erratique sont des jugements que nous portons surun phenomene etudie a une certaine echelle.

3.6. Une illustrationLa figure2 represente une sequence de pollution par SO2 sur uneperiode de 500 jours. L’espace de travail est donc R

1, en l’occurrencele temps. Comme il s’agit d’un enregistrement, on peut considerer quela Variable Regionalisee est connue en continu (on negligera l’inevitablediscretisation informatique). Nous nous proposons de recapituler sur cetexemple les remarques exposees jusqu’ici.

Peu d’observations peuvent etre faites au niveau du Modele Primaire. Lafigure represente le graphe de la Variable Regionalisee. Cette VariableRegionalisee, fonction du temps, peut se reveler continue ou non,derivable ou non, mais — rappelons-le — ces proprietes seront desproprietes du Modele Primaire, non du phenomene lui-meme. D’ailleurs,que serait la derivee de SO2 par rapport au temps ?

La question : cette Variable Regionalisee est-elle Realisation d’uneFonction Aleatoire ? est, faut-il le rappeler, depourvue de sens. Lerecours a un modele probabiliste est un choix constitutif que nousdecidons de faire ou de ne pas faire.

Si maintenant nous choisissons de modeliser la Variable Regionalisee parune Fonction Aleatoire, nous devons adopter un modele ergodique — dumoins tant qu’un tel modele ne se revelera pas incoherent.

Cette Fonction Aleatoire peut-elle de plus etre prise stationnaire ? C’estici que l’experience du Geostatisticien doit intervenir. Sur cet exemplesimple, la reponse est facile. Si l’on travaille a l’echelle de quelques jours,

Page 24: g é o Statistique

22 Aide-Memoire de geostatistique lineaire :

il est clair que la valeur moyenne subit des variations significatives : il ya plus de pollution en hiver (autour de t = 50 et de t = 400) qu’en ete.Un œil un peu plus exerce constaterait egalement que les fluctuationsautour de la valeur moyenne sont plus importantes en hiver qu’en ete.En resume, dans ces conditions, un modele stationnaire (d’ordre 2)n’est pas a envisager, puisqu’aucun des deux premiers moments ne peutraisonnablement etre considere comme empiriquement stationnaire.Mais remarquons que la conclusion serait sans doute differente si on selimitait a la periode d’ete (110 ≤ t ≤ 240).

Pour completer cette illustration, la figure3 represente le logarithmedes teneurs en SO2 sur la meme periode. Les fluctuations semblent apeu pres constantes autour d’une valeur moyenne (le moment d’ordre2 empirique serait donc a peu pres constant), mais cette valeurmoyenne suit des fluctuations saisonnieres (et donc le moment d’ordre 1empirique apparaıt grossierement non stationnaire). Au contraire, lesaccroissements d’un jour sur l’autre des teneurs en SO2 presententune moyenne empirique constante (nulle, figure4), mais des fluctuationsvariables : cette fois encore, un modele stationnaire est a rejeter a priori .Finalement, c’est sur les accroissements des logarithmes (figure5) qu’ilsemblerait possible de proposer un modele stationnaire, etant bien surentendu que les controles ulterieurs pourraient nous amener a rejeter cemodele.

4. Structure d’une etude en Geostatistique Intrinseque

4.1. Rappel prealable

. . . on estime des grandeurs (objectives), on choisit des methodes,E & C, p4.

des modeles, ou des parametres conventionnels, et on convient decriteres.

La plupart des problemes rencontres au cours d’une etude reelle sont desproblemes d’estimation, qui ne se poseraient pas — en theorie ! — si laVariable Regionalisee etait connue exhaustivement. Mais il existe des casou l’on souhaite aller plus loin, par exemple proposer une interpretationdu phenomene : le modele est alors davantage sollicite, les risques accrus,et les possibilites de controles reduites. Il devient encore plus importantde toujours agir en connaissance de cause, et de toujours se referer auxdonnees des que cela est possible.

Dans le present expose, a l’exception du prochain chapitre, nous avonschoisi de recourir a un modele probabiliste. Encore une fois, ce choix n’estni vrai ni faux. C’est une libre decision qui a terme se revelera judicieuseou non ; mais il s’agira la d’un jugement de l’experience, auquel ne peutse substituer aucune presentation abstraite.

Nous n’avons pas parle jusqu’ici des criteres de choix : comment, dansun etude particuliere, trancher a priori entre plusieurs possibilites. Laencore, la determination d’un critere est chose arbitraire, mais il est clairque ce critere doit etre formule a l’aide des parametres que le modele meta notre disposition. Nous verrons ulterieurement qu’en GeostatistiqueLineaire, c’est la variance qui joue le role de critere de choix.Chapitre 3,

paragraphe 1.3.

Avant d’examiner les deux phases d’une etude geostatistique —specification du modele, puis reconstruction operatoire — rappelonsenfin que ces deux etapes n’ont rien de fige et qu’il est naturel en coursde travail de revenir en arriere et d’affiner ou corriger un modele a lalumiere des premiers resultats qui ont ete obtenus. Une telle demarchen’a rien de choquant si l’on se souvient que le but n’est pas de trouverun modele, qu’il n’y a pas de vrai modele dans la nature, mais qu’unmodele n’est qu’un intermediaire qui doit nous permettre de resoudre unprobleme concret pose sur des donnees reelles.

Page 25: g é o Statistique

[1] – Variables Regionalisees et Fonctions Aleatoires 23

4.2. Phase d’analyseRevenons a la figure1. Partant des donnees physiques (colonne 1), noussouhaitons arriver a un modele qui permette theoriquement (colonne 3)de resoudre les problemes poses. Nous avons vu que ce cheminementcomporte a la fois une part d’arbitraire (a commencer d’avoir choisi laGeostatistique !) et une contrainte de respecter les donnees.

Ce travail est traditionnellement appele analyse structurale, analysevariographique, ou plus brievement variographie. A notre sens, c’estla phase essentielle de toute etude geostatistique, puisque de sa qualitedepend tout ce qui sera fait en aval. Un mauvais modele — mauvaisau sens de non conforme aux donnees, car nous supposerons au moinsqu’il ne comporte pas d’incoherence theorique ! — un mauvais modeledonc condamne toute l’etude geostatistique. Cela dit, cela ne signifie pasqu’il existe un seul bon modele.

Et precisement parce qu’il n’existe pas une solution unique au problemede l’Analyse Variographique, il nous semble que cette phase de l’etude estparticulierement mal adaptee a un traitement de type boıte noire. Ceserait a notre sens une erreur methodologique grave que de vouloir fondersur quelque test statistique que ce soit une pseudo-objectivite de notre Henley, 1987.

modele. Essentiellement, l’Analyse Variographique doit garder la formed’un dialogue avec les donnees de depart. Les moyens informatiquesactuels ont a l’evidence leur mot a dire ici, mais en direction d’une plusgrande interactivite, non pas d’un plus grand automatisme.

Nous atteignons ici les limites d’un expose comme celui-ci. Car il estbien difficile de communiquer en peu de mots les experiences, les toursde main, les intuitions, les modes meme pourquoi pas, qui se conjuguentpour guider un Geostatisticien dans l’elaboration d’un modele. Lesproblemes de communication peuvent etre reels, avec les Naturalistes, Matheron, 1976, p5-6.

avec les Informaticiens, avec les Statisticiens. Sachons alors nous garderde tout dogmatisme : le mot de la fin, ce sera la sanction de la pratique.

L’Analyse Variographique comporte evidemment une critique deshypotheses de stationnarite et eventuellement (a posteriori) un controlede l’ergodicite. Un autre aspect important en est la constructiond’une fonction structurale. Dans tous les cas, le praticien avance deshypotheses, propose des valeurs qui specifieront son modele. Mais,pour se garantir au mieux contre le risque de prendre une decision J J J

erronee, (il) doit affaiblir le plus possible les hypotheses anticipatrices surlesquelles il est bien oblige de se fonder. Il recherche, par consequent, le E & C, p85.

degre de specification le plus faible possible compatible avec la resolutioneffective du probleme pose..

Cette regle d’or peut etre appelee : principe d’economie.

4.3. Phase de syntheseSur la figure1, cette phase est plutot nommee reconstruction operatoire.Nous nous trouvons alors a l’etape ou, une fois le modele specifie, lesoperations theoriques souhaitees ont ete realisees. Ce sont ces operations— estimations, simulations, selections — qui font l’objet de tout coursde Geostatistique theorique. Le probleme est maintenant de donner unsens physique, experimentalement controlable, aux operations abstraitesqui ont ete realisees sur le modele mathematique.

En realite, cette etape est en general assez fugitive, parce queles operations realisees au cours d’une etude geostatistique sontgeneralement toujours les memes, et que le tri a ete fait une fois pour E & C, p99.

toutes entre les parametres conventionnels du modele et les parametresauxquels on peut attribuer une signification objective.

Nous nous bornerons donc ici a une definition, puis a l’enonce d’unprincipe methodologique general. Et tout d’abord, on appelle grandeurregionale toute quantite qui est parfaitement connue dans la totalite de E & C, p77.

Page 26: g é o Statistique

24 Aide-Memoire de geostatistique lineaire :

son Champ. A contrario, on designera par parametre conventionneltout parametre du modele qui ne peut etre decrit comme GrandeurRegionale. Le principe des grandeurs regionales s’enonce alors :

Parmi les parametres d’un modele topo-probabiliste destine a decrireI I I

un phenomene unique, seuls ont une signification objective ceux quel’on peut exprimer en termes de grandeurs regionales. De meme, parmiles concepts introduits par ce modele, seuls ont un sens objectif ceuxE & C, p74.

qui peuvent recevoir une definition operatoire en termes de grandeursregionales, c’est-a-dire une definition constituee par un systeme derelations experimentalement verifiables (dans un domaine donne, avecune approximation donnee) entre de telles grandeurs..

La conclusion d’une etude geostatistique doit donc etre la reformulationen termes physiques de ceux des resultats obtenus ayant une significationobjective — dans l’attente de la sanction de l’experience qui preciserale degre d’objectivite externe de nos methodes. La boucle de la figure1est ainsi refermee.

Ce chapitre est avant tout une lecture rapide et partielle — de fait, tresBibliographie

partielle et beaucoup trop rapide ! — de

• Estimer et Choisir, Matheron, 1978.

Le lecteur desireux d’approfondir le cheminement qui historiquement aconduit a ces differents concepts pourra se referer a des publicationsanterieures, par exemple :

• Presentation des Variables Regionalisees, Matheron,1969.

• Hasard, echelle, structure, Matheron, 1975.

• Les concepts de base et l’evolution de la Geostatistiqueminiere, Matheron, 1976.

Ce dernier article evoque, parfois de facon etonnament premonitoire,les difficultes rencontrees au cours de l’evolution de la Geostatistique :difficultes methodologiques bien sur, mais aussi difficultes de contactavec differents interlocuteurs : Naturalistes, Informaticiens, Statisticiens.

Il n’est peut-etre pas inutile de renvoyer a certains ecrits de naturepresque (ou franchement. . . ) polemique, afin que le lecteur puisse sefaire une lecon par lui-meme. Nous avons ainsi cite dans ce chapitre unarticle extrait de l’ouvrage

• Interpreting Multivariate Data, Barnett ed., 1981.

ainsi qu’un article : Kriging : blue or pink ? releve dansHenley, 1987.

Mathematical Geology de fevrier 1987. Cette revue est d’ailleurs le lieufrequent d’affrontements passionnes dont le lecteur, s’il sait faire la partdes choses, peut, eventuellement, faire son profit.

Pour une presentation plus proche d’un expose magistral, nous renvoyonsune fois pour toutes a :

• Les Variables Regionalisees et leur estimation,Matheron, 1965.

• La theorie des Variables Regionalisees et sesapplications, Matheron, 1971.

Page 27: g é o Statistique

[1] – Variables Regionalisees et Fonctions Aleatoires 25

— ce dernier document existant egalement en version anglaise.

Enfin, dans une optique plus franchement miniere, on pourra citercomme document de reference

• Traite de Geostatistique Appliquee, Matheron, 1962.

Page 28: g é o Statistique

26

Aid

e-M

em

oire

de

geosta

tistique

lineaire

:

#) !!$##

,%!$ )) $#

#) $# !,%/' #

#!-(()'*)*'!

-%$).(( %-( &*((*%%!/"#) '(

'$ )/)) $##' )/(

/$()) () &*( !(( &*

$# ! #/ '

$# ()) $## '

$'"! (" %'$ ! ())) () &* !(( &*

#!-( $##/(

/$()) () &* )'#( ) +

$#!*( $# !/)*

Figu

re1

;

Page 29: g é o Statistique

[1] – Variables Regionalisees et Fonctions Aleatoires 27

Page 30: g é o Statistique

28 Aide-Memoire de geostatistique lineaire :

Page 31: g é o Statistique

Chapitre 2

Geostatistique Transitive

Presentation

Ce chapitre n’est qu’une breve introduction aux methodes detravail direct sur la Variable Regionalisee. Il permet cependantde degager quelques notions qui seront reprises en GeostatistiqueIntrinseque, en particulier l’importance du support, et la necessitede recourir a des modeles. On mettra en evidence les raisons derecourir ulterieurement aux methodes probabilistes.

Le premier paragraphe definit le Covariogramme Transitif, etenumere ses proprietes theoriques.

Le second paragraphe examine l’utilisation du CovariogrammeTransitif dans un probleme simple d’estimation, et en conclut ala necessite d’un modele.

Le troisieme paragraphe detaille et interprete la phase demodelisation.

1. Le Covariogramme TransitifNous nous placons ici dans l’optique d’une etude directe de la VariableRegionalisee, c’est-a-dire finalement d’une fonction definie dans l’espacegeographique, hors de tout presuppose probabiliste.

Nous rappelons que la Variable Regionalisee est definie sur un certainChamp borne (note S). Nous supposerons que z(x) est identiquement Chapitre 1,

paragraphe 1.2.nulle pour x exterieur a S.

1.1. DefinitionOn appelle covariogramme transitif de z l’integrale d’espace definie par :

g(h) =

z(x) z(x+ h) dx

L’integrale porte sur tout l’espace geographique ou, ce qui estequivalent compte-tenu de sa definition, sur le champ S de laVariable Regionalisee z.

La notation adoptee est celle de l’espace a 1 dimension ; c’est la puresimplification d’ecriture, le point dx etant en fait le point courant del’espace geographique (a 1, 2 ou 3 dimensions, ou davantage). De meme,h represente un vecteur de l’espace geographique.

On note enfin que le Covariogramme Transitif est l’exemple-type d’uneGrandeur Regionale : c’est donc une quantite qui, au sens ou cela a ete Chapitre 1,

paragraphe 4.3.defini, possede une signification objective dans le Modele Primaire.

1.2. Proprietes theoriques immediatesDe la definition mathematique du Covariogramme Transitif, il decoule uncertain nombre de proprietes theoriques, pour la plupart elementaires, Matheron, 1965, p18-24.

que nous nous contentons d’enumerer :

Page 32: g é o Statistique

30 Aide-Memoire de geostatistique lineaire :

• Symetrie :g(h) = g(−h)

• Soit Q l’integrale de z(x) sur son Champ, c’est-a-dire :

Q =

z(x) dx

Alors :

Q2 =

g(h) dh

• Inegalite de Schwarz :

| g(h) | ≤ g(0)

• Portee : on appelle portee dans une direction donnee la distance au-delade laquelle le Covariogramme Transitif reste definitivement egal a 0. Ilfaut remarquer que la portee est une propriete du champ, non de laVoir aussi Matheron,

1965, p98-100.Variable Regionalisee elle-meme.

• Covariogramme Geometrique : dans le cas particulier ou la VariableRegionalisee etudiee z(x) est la fonction indicatrice k(x) du Champ

— souvent notee egalement S

(x) —, on a :

z(x) = k(x) = S

(x) = 1 si x ∈ S

si x /∈ S

Traditionnellement note K(h), le Covariogramme Transitif est dans cecas appele covariogramme geometrique.

— K(h) represente la mesure (longueur, aire, volume, selon le nombrede dimensions de l’espace) de l’intersection du champ S et de sontranslate par le vecteur −h. En particulier, K(0) est la longueur(ou l’aire, le volume. . . ) de S, et

Un probleme denotations : les Covariances

Generalisees, auChapitre 8, seront

egalement notees K. Laconfusion est cependant

difficile, et nous garderonscette legere ambiguıte

de notations, plutot quebouleverser les habitudes.

[K(0)]2 =

K(h) dh

— La derivee K ′α(0) dans une direction α represente la variationMatheron, 1965, p102-107.

diametrale du Champ S dans la direction α.

1.3. PositiviteSoit un ensemble quelconque de points xi, . . . , xj de l’espace

geographique, et soit un systeme de ponderateurs λi, . . . , λj affectesa chacun de ces points.

Alors :

i, j λi λj g(xi − xj) =

i, j λi λj

z(t) z(t+ xi − xj) dt

=∑

i, j λi λj

z(t+ xj) z(t+ xi) dt

=∫ (∑

i λi z(t+ xi)

)2dt

quantite qui est toujours positive ou nulle.

En resume :

∀xi, ∀λi :∑

i,j

λiλj g(xi − xj) ≥ 0

Page 33: g é o Statistique

[2] – Geostatistique Transitive 31

Cette propriete peut etre etendue au cas continu : on doit alors substituerau systeme de ponderateurs λi une mesure λ(dt). Alors,

∀λ :

∫ ∫

λ(dt) g(t− u)λ(du) ≥ 0

Une fonction possedant cette propriete est dite de type positif. Cettepropriete caracterise la classe des fonctions de covariance.

Par ailleurs, le tres important theoreme de Bochner enonce qu’unefonction continue est de type positif (donc est une covariance) si etseulement si elle est transformee de Fourier d’une mesure positivesommable. Le lien est ainsi etabli entre le formalisme transitif et le travaildans l’espace de Fourier.

Remarque capitale : une fonction de type positif dans un certain espacel’est egalement dans un sous-espace de dimension inferieure, mais pasnecessairement dans un espace de dimension superieure1 .

Fasc. 5, p14.

1.4. Comportement a l’origineIl existe un lien etroit entre les proprietes de continuite, derivabilite,

J J J

etc. de la Variable Regionalisee, et le comportement a l’origine de sonCovariogramme Transitif. Ce lien resulte de la formule evidente :

g(0) − g(h) =1

2

[z(x+ h) − z(x)]2 dx

Si z(x) est derivable, g(h) est deux fois derivable a l’origine ; si z(x)est continue, g(h) est continue a l’origine. Une discontinuite de g(h) al’origine est appelee effet de pepite.

Placons-nous maintenant pour simplifier dans le cas isotrope, c’est-a-dire supposons que g(h) ne depend que du module r = | h |du vecteur h, et non de son orientation. On peut alors proposer undeveloppement limite de g(r) au voisinage de l’origine. Il convient Fasc. 5, p12.

de distinguer dans ce developpement les puissances paires de r, quicomposent la partie reguliere du developpement et sont indefinimentderivables, et les autres termes (puissances impaires et non entieres oucomposantes logarithmiques) qui en constituent la partie irreguliere ; Matheron 1965,

chapitre II.on montre alors que le degre de regularite spatiale de la VariableRegionalisee est lie au terme de plus bas degre de la partie irreguliere.

1.5. RegularisationsSoit une certaine fonction de ponderation p(x) ; notons p(x) satransposee definie par p(x) = p(−x). On appelle regularisee de zpar p la Variable Regionalisee definie par

zp(x) =

z(x+ u) p(u) du

ou, plus synthetiquement :

zp = z ∗ p

Il est alors facile d’etablir que le Covariogramme Transitif gp de zp sededuit de g (Covariogramme Transitif de z), par la formule :

gp = g ∗ p ∗ p

1La meconnaissance de ce theoreme conduit a des fautes graves, qui se manifestent

essentiellement par l’apparition de variances negatives.

Page 34: g é o Statistique

32 Aide-Memoire de geostatistique lineaire :

Il serait egalement facile d’expliciter les formules de regularisation auniveau des developpements a l’origine.

Un cas particulier de regularisation est la montee de la VariableRegionalisee. La montee (d’ordre 1) d’une Variable Regionalisee,dans une direction, consiste a prendre l’integrale de cette VariableRegionalisee le long de cette direction. On definit de la sorte unenouvelle Variable Regionalisee, dans un espace possedant une dimensionde moins. Incidemment, remarquons que cette operation n’a rien nide mysterieux, ni d’exceptionnel : elle correspond en particulier al’operation, courante en estimation miniere, de calcul d’accumulation.Il n’y a aucune difficulte ensuite a definir des montees d’ordre superieur(montee de montee, etc. ). On montre alors que le Covariogrammemonte en meme temps que la Variable Regionalisee a laquelle il estassocie . Dans le cas isotrope, on peut de plus etablir des formulesde montees sur les Covariogrammes Transitifs, particulierement simplesdans le cas de montees d’ordre pair. Ces regles de transformation, ainsid’ailleurs que leurs inverses (operation de descente) peuvent s’exprimerterme a terme au niveau de la partie irreguliere du developpement duCovariogramme Transitif.

2. Application a un probleme d’estimationOn se limitera ici a un exemple tres simple d’estimation (maille reguliere

Matheron 1965,chapitre II.

a 1 dimension), a seule fin d’examiner comment le Covariogramme

Fasc. 5, p15.

Par exemple, Matheron1965, p44-46 & p55-56.

Transitif intervient dans la definition de la Variance d’Estimation.L’extension a d’autres cas de figures (maille aleatoire stratifiee, plusieursFasc. 5, p25-26.

dimensions) ne modifierait pas essentiellement nos conclusions, et ne serapas abordee ici.

2.1. Position du problemeOn se donne a estimer la quantite

Q =

z(x) dx

cette quantite etant une Grandeur Regionale.I I I

Pour cela, on dispose d’une maille reguliere d’information, de dimensiona, implantee a partir d’un point x0 : on connaıt donc les valeursz(x0 + pa) ou p ∈ Z.

Remarque : comme le Champ de la Variable Regionalisee est parhypothese borne, z(x0 + pa) n’est different de 0 que pour un nombrefini de valeurs de p.

L’estimateur que l’on propose pour Q est de la forme :

Q∗(x0) = a∑

p

z(x0 + pa)

La maille etant supposee fixee, il est clair alors que l’estimateur Q∗(x0)depend de x0, et que plus precisement il est une fonction periodique dex0, de periode a. Il en est donc de meme de l’erreur d’estimation :

Q−Q∗(x0)

2.2. Implantation de la maillePour le moment, dans le modele de la Variable Regionalisee, l’Erreurd’Estimation est une quantite parfaitement deterministe, mais inconnue

Page 35: g é o Statistique

[2] – Geostatistique Transitive 33

(a cause de Q qui par hypothese n’est pas connue). Il n’est pas possibled’en dire plus sans hypothese supplementaire.

Il n’est pas non plus possible d’en dire plus sur z(x) qui, dans le modeleVariable Regionalisee, est une realite physique unique parfaitementdeterministe, sur laquelle nous ne savons rien a priori . Mais precisement,une maniere d’exprimer ce manque d’information a priori est de dire quela maille de reconnaissance a ete implantee au hasard. Tout se passeen fait comme si l’origine x0 avait ete implantee au hasard sur le segment[0, a], selon une loi de probabilite de densite constante.

En donnant cette definition precise a la notion jusqu’ici beaucoup trop

Fasc. 5, p21.

vague d’ implantation au hasard de la maille de reconnaissance, nousavons ipso facto constitue l’estimateur (et par voie de consequencel’Erreur d’Estimation) en Variable Aleatoire : nous avons defini une E & C, p126.

representation transitive de la Variable Regionalisee.

2.3. Proprietes de l’Erreur d’EstimationIl est alors immediat de calculer l’esperance mathematique de l’Erreurd’Estimation : Fasc. 5, p21.

E [Q−Q∗] = Q− E [Q∗] = 0

AinsiQ∗ est-il un estimateur sans biais deQ. Intuitivement, cela signifieque, pour une Variable Regionalisee z(x) immuable, les erreurs quel’on ferait en construisant l’estimateur Q∗(x0) pour un grand nombred’implantations equiprobablement reparties finiraient par se compenser.

Quant a la variance de cette Erreur d’Estimation, dite encore varianced’estimation, elle s’ecrit tous calculs faits :

Var [Q∗] = E[

(Q−Q∗)2]

= a∑

k

g(ka) −

g(h) dh

Elle ne depend donc que de la dimension de la maille de reconnaissance, Fasc. 5, p24 ;E & C,p127-131.et du Covariogramme Transitif.

Remarque : on notera que cette Variance d’Estimation presente lastructure d’une approximation de l’integrale :

g(h) dh

par la somme discrete

a∑

k

g(ka)

2.4. Necessite d’une modelisationSi le Covariogramme Transitif etait connu, cette Variance d’Estimationserait effectivement calculable. Mais si on se place dans l’optiqueprecedente d’une estimation, ou la Variable Regionalisee n’est supposeeconnue qu’aux points (x0 + ka), on ne peut pas connaıtre le vraiCovariogramme Transitif :

g(h) =

z(x) z(x+ h) dx

mais seulement en construire (et de surcroıt seulement pour les valeursh = ka) un estimateur g∗ appele covariogramme experimental :

g∗(x; ka) = a∑

p

z(x0 + pa) z(x0 + pa+ ka)

Page 36: g é o Statistique

34 Aide-Memoire de geostatistique lineaire :

Si, par la force des choses, on remplace g par g∗ dans la formule dela Variance d’Estimation, cette variance devient nulle. Ce qui signifiequ’ il est illusoire d’esperer, par des procedes purement empiriques,extraire d’un meme materiel purement experimental a la fois uneestimation et la precision de cette estimation.

Intuitivement, on atteint ici les limites de ce qu’il est possible de fairedire aux donnees. Si l’on ne veut pas que nos traitements numeriquesse bornent a des tautologies, nous devons franchir le pas et fournir,sous notre propre responsabilite, un surcroıt d’information pour pouvoiraller plus loin. En l’occurrence, il s’agit de proposer un modele deCovariogramme Transitif — et tout particulierement un modele qui soitutilisable en continu, et pas seulement sur la maille de reconnaissance.

Cette demarche est typiquement une hypothese anticipatrice. C’est

Fasc. 5, p24.

E & C, p132.

une etape indispensable mais bien sur risquee, puisque par natureelle consiste a injecter dans nos traitements plus d’informations qu’iln’en est reellement contenu dans les donnees. La se situe la difficulteessentielle de la pratique geostatistique. Mais il faut savoir prendreses responsabilites : la pire des choses a faire ici serait de s’enE & C, p132.

remettre aveuglement a quelque procede automatique pour interpolerentre les valeurs experimentales g∗. Ce n’est pas un test statistique quiHenley, 1987.

assurerait la validite de la modelisation, et encore moins qui en fonderaitl’objectivite.

Un mot encore de commentaire : dans cette formulation, l’expression dela Variance d’Estimation

Var [Q∗] = a∑

k

g(ka) −

g(h) dh

relie deux quantites qui ont une signification objective :

• la variance elle-meme qui, compte-tenu de la regle d’implantation dureseau de prelevement, serait calculable sans ambiguıte si la VariableRegionalisee etait connue exhaustivement ;

• l’expression en termes de Covariogramme Transitif, qui est uneGrandeur Regionale.

Nous sommes arrives a une telle expression sans avoir besoin d’introduireaucune hypothese de stationnarite sur la Variable Regionalisee, ni memeaucune hypothese probabiliste : la stationnarite qui se manifesteici n’est pas une propriete du phenomene, mais seulement uneE & C, p130.

caracteristique de notre reseau de prelevements. Notre CovariogrammeTransitif contient exactement la meme information structurale qu’unecovariance stationnaire, mais presente sur cette derniere un avantagedecisif : il est defini sans ambiguıte par la relation :

g(h) =

z(x) z(x+ h) dx

et sa signification est purement objective.

3. Modelisation du Covariogramme Transitif

3.1. Contraintes sur le modeleAu sens precis du terme, il s’agit d’estimer le Covariogramme Transitif,Chapitre 1,

paragraphe 4.1.c’est-a-dire de pallier une absence d’information. Nous avons vu que pource faire le recours a un modele est inevitable. Mais la liberte n’est pastotale dans le choix de ce modele, et deux types de contraintes doiventetre respectees :

Page 37: g é o Statistique

[2] – Geostatistique Transitive 35

• des contraintes theoriques : le modele doit satisfaire aux proprietesmathematiques enumerees precedemment. Il s’agit ici de contraintesessentielles et imperatives ;

• des contraintes experimentales : le modele doit approcher aumieux les valeurs experimentales disponibles (les g(ka) dansl’exemple d’une maille reguliere). Il s’agit cette fois d’une contraintede bons sens.

La mise en place d’un tel modele constitue la phase principale de

Paragraphe 1.2.

l’Analyse Variographique. De la qualite de cette etape dependent lasignification et l’interet de tout le travail ulterieur sur les donnees.

En ce qui concerne le respect des contraintes theoriques, on l’assure enallant chercher notre modele parmi des familles de fonctions classiquesqui ont ete elaborees a la faveur des experiences passees. En fait,il suffit de peu de modeles de base pour pouvoir faire face a laplupart des analyses structurales. Quant a l’ajustement du modele auCovariogramme Experimental, il constitue l’operation ou se manifestele plus clairement la pratique du Geostatisticien. A notre sens, il doitdans toute la mesure du possible s’agir d’un travail interactif, susceptibled’ailleurs de reajustements a la lumiere des resultats ulterieurs. C’est laou le Geostatisticien doit prendre ses responsabilites : recourir a des Sujet de reflexion,

helas aussi sourcede polemique.tests statistiques automatiques pour franchir cette etape ne serait pas

une solution, mais une derobade.

3.2. Les formules d’approximationToujours en se limitant au cas d’une maille reguliere a 1 dimension, laVariance d’Estimation

Var [Q∗] = a∑

k

g(ka) −

g(h) dh

peut etre consideree comme une fonction σ2(a) de la maille a.Examinons brievement le comportement de cette fonction pour de E & C, p133-135.

petites mailles (pour plus de detail, nous renvoyons a la bibliographie).

Notons qu’il s’agit la d’un probleme purement analytique : nous etudionsle comportement de σ2(a) lorsque g est un modele mathematique du Fasc. 5, p27-41.

Covariogramme Transitif. Nous designerons par la suite cette fonctionmathematique g sous le nom de covariogramme modelise.

Si g avait de bons caracteres de derivabilite, on pourrait utiliser pourcette etude un developpement de Mac-Laurin. Mais les modeles usuelsn’ont pas en general une regularite suffisante pour cela. Il faut expliciter Matheron, 1965, p77.

les calculs, qui font finalement apparaıtre une decomposition :

σ2(a) = T (a) + Z(a)

dans laquelle

• T (a), appele terme regulier ou terme d’extension, depend ducomportement de g(h) a l’origine ;

• Z(a), appele terme fluctuant ou parfois Zitterbewegung, dependdu comportement de g(h) au voisinage de la portee.

En ce qui concerne le terme regulier, on peut etablir une correspondanceterme a terme entre le developpement a l’origine de g(h) et le Matheron, 1965, p79-81.

developpement de T (a) pour a petit. On releve egalement que lapartie reguliere du Covariogramme n’apporte aucune contribution au Fasc. 5, p29.

developpement limite de la Variance d’Estimation.

Apres coup, ces relations peuvent permettre un controle du modele.Si en effet on dispose ulterieurement des moyens de calculerexperimentalement la Variance d’Estimation, on peut alors verifier si

Page 38: g é o Statistique

36 Aide-Memoire de geostatistique lineaire :

le developpement a l’origine que nous avons adopte pour le modele duCovariogramme est compatible avec le comportement de ces variancesd’estimation experimentales en fonction de la maille. Naturellement,la realisation effective d’un tel controle est assez utopique, mais cecine retire rien a cette conclusion : le comportement a l’origine duCovariogramme Modelise a bel et bien une signification objective.Ce n’est pas une simple extrapolation aux courtes distances d’unecourbe experimentale, mais bien une hypothese que nous pourronsulterieurement — du moins par la pensee — infirmer ou corroborer.

Le terme fluctuant Z(a) pose un probleme tout autre. On peut montrerqu’il depend essentiellement de la quantite :

ε = L/a (modulo 1)

ou L est la portee du Covariogramme et a la maille de reconnaissance.Le probleme, c’est que dans les applications, c’est-a-dire au niveau duCovariogramme Experimental, la portee n’est justement qu’encadreepar un intervalle de longueur a. Autrement dit, la quantite ε esttotalement indeterminee sur [0, 1]. Comme on peut montrer que Z(ε)est de moyenne nulle sur [0, 1], on choisit — par la force des chosesE & C, p133.

— de negliger le terme fluctuant, tout en sachant qu’il peut avoir uneFasc. 5, p38.

amplitude considerable.

3.3. Une situation prealeatoire

La situation ou nous nous trouvons est finalement inattendue. Lephenomene du Zitterbewegung revele que de petites modifications desFasc. 5, p39.

conditions initiales (ici : le rapport de la maille de reconnaissance a laportee) conduisent a d’importantes variations des resultats — ici de laVariance d’Estimation σ2(a). Il s’agit la d’une situation prealeatoire :des conditions initiales inseparables entraınent ulterieurement uneseparation des phenomenes observes.Ullmo, 1967, p649.

Notons au passage la dialectique theorie–pratique. Dans le formalismetheorique, fonde sur un modele de Covariogramme, la portee est unedonnee de l’enonce, et la taille de la maille est la variable en fonctionde laquelle on exprime la Variance d’Estimation. Dans la pratique aucontraire, c’est la maille de reconnaissance qui sera un parametre (plusprecisement, ce que l’on definit comme un parametre methodologique)E & C, p24.

et la portee du Covariogramme Modelise devient l’inconnue du problemede l’Analyse Variographique.

Quoi qu’il en soit, en negligeant (par la force des choses) le termefluctuant Z(a) dans l’expression complete :

σ2(a) = T (a) + Z(a)

tout se passe (. . . ) a peu pres comme si l’on considerait σ2(a) commeune variable aleatoire, dont l’esperance serait le terme regulier T (a),E & C, p134.

le terme fluctuant Z(a) representant la partie purement aleatoire etimprevisible.

De maniere encore plus essentielle, le recours a un modele, qui synthetise(en simplifiant peut-etre considerablement) la Variable Regionalisee elle-meme, constitue un equivalent camoufle d’un passage a l’esperanceFasc. 5, p39.

mathematique . Cela est particulierement spectaculaire peut-etre pourle comportement a l’origine, reduit au seul terme le plus bas de la partieirreguliere du developpement, qui est cense representer toute la richessedu comportement infinitesimal de la Variable Regionalisee. Ainsi, lesmethodes transitives, qui se voulaient au depart purement geometriques,Fasc. 5, p39.

se revelent, lorsque l’on analyse les conditions de leur mise en œuvreeffective, comme riches d’un contenu probabiliste implicite.

Page 39: g é o Statistique

[2] – Geostatistique Transitive 37

La porte est ainsi ouverte aux methodes probabilistes, qui serontbeaucoup plus developpees que la theorie transitive en raison de leurcommodite d’emploi. Cependant, cette approche degage une importantelecon : l’interpretation probabiliste est inevitable, mais l’hypothesestationnaire n’est pas reellement necessaire . A aucun moment en effet,nous n’avons eu a formuler d’hypothese sur la Variable Regionaliseeelle-meme ; et c’est bien ainsi, car cette Variable Regionalisee est unerealite physique (ou presque : c’est le Modele Primaire qui l’est) quenous ne pouvons pas plier a nos caprices intellectuels. Finalement,c’est la stationnarite du reseau qui nous a permis, en l’absence detoute hypothese portant sur la Variable Regionalisee, de beneficier descirconstances tres avantageuses que l’on croit generalement liees a lastationnarite du phenomene lui-meme, ou de la Variable Regionalisee quile represente. (. . . ) la stationnarite peut souvent etre introduite, non pasa titre d’hypothese relative a la realite physique, mais simplement commeune caracteristique de la methode d’estimation choisie par nous.

3.4. Remarque sur la stationnariteOn pourrait peut-etre discerner une contradiction entre ces dernieres

Fasc. 5, p40.

remarques — dans lesquelles la stationnarite est absente du Modele

E & C, p135.

Primaire — et les developpements proposes au chapitre precedent. En Chapitre 1, paragraphe 3.

realite, il y a une position d’equilibre a trouver, et ce qui permet detrancher est la possibilite de realiser l’inference statistique. On est amenea definir une condition de quasi–stationnarite, ou encore de stationnaritelocale, condition pratique pour rendre possible l’ajustement d’unmodele. Pour plus de detail, nous renvoyons a la bibliographie. Ce qui Fasc. 5, p97-102.

semble important ici, c’est de faire apparaıtre une nouvelle fois la notiond’echelle de travail, notion absente des formalismes probabilistes, mais Chapitre 1,

paragraphe 3.5.capitale pour leur application a des donnees reelles.

3.5. Les trois CovariogrammesNous voulons conclure ce chapitre par un inventaire des outilsstructuraux que nous y avons rencontres.

Le Covariogramme Transitif d’abord, defini par :

g(h) =

z(x) z(x+ h) dx

est une Grandeur Regionale. Inaccessible en pratique, il n’en possedepas moins une signification objective, et c’est lui qui serait la fonctionstructurale optimale pour calculer les variances d’estimation.

Notons ici, par opposition a ce qui apparaıtra dans le modeleprobabiliste, que le Covariogramme Transitif traduit a la fois desproprietes structurales de la Variable Regionalisee et des proprietesgeometriques de son Champ. Cet amalgame n’est pas toujours Voir aussi

Matheron, 1965, p96-102.souhaitable, ce qui explique en partie parfois le renoncement auxmethodes transitives. Il est des situations ou l’on prefererait manipulerdes proprietes intrinseques de la Variable Regionalisee.

Le Covariogramme Experimental g∗ n’est pas a proprement parlerune fonction, mais un nuage de points experimentaux. Dans l’exemple(1 dimension, maille reguliere a) que nous avons propose, il apparaıt Paragraphe 2.4.

comme une succession de valeurs :

g∗(x0; ka) = a∑

p

z(x0 + pa) z(x0 + pa+ ka)

Dans la pratique, il faut tenir compte de tolerances de calcul sur lesdistances, les directions, etc. Un Covariogramme Experimental est uneapproximation, une premiere estimation du Covariogramme Transitif.

Page 40: g é o Statistique

38 Aide-Memoire de geostatistique lineaire :

Enfin, le Covariogramme Modelise est une fonction mathematique,qui est censee representer le Covariogramme Transitif. C’est ceCovariogramme Modelise que l’on injecte dans les programmesinformatiques, en lieu et place du Covariogramme Transitif qui figuredans les expressions mathematiques theoriques.

Ces trois statuts se retrouveront au niveau de toutes les fonctionsstructurales que nous rencontrerons par la suite, a de simples nuancespres : nous ne reviendrons donc plus sur ces distinctions lorsque d’autresoutils structuraux seront examines (variogrammes ou covariancesgeneralisees, dans le cadre de la Geostatistique Intrinseque).

Pour resumer, l’essence de la Variographie en Geostatistique Transitive

Voir par exempleChauvet, 1987 (b), p2-8.

consiste alors a ajuster un Covariogramme Modelise au CovariogrammeExperimental, et a lui faire jouer le role du Covariogramme Transitif aucours des calculs numeriques qui sont developpes ulterieurement.

Les modeles transitifs font l’objet du chapitre 1 du Fascicule 5,Bibliographie

ainsi que du Chapitre VI de Estimer et Choisir.

Dans

• Les Variables Regionalisees et leur estimation,Matheron, 1965.

on trouvera le detail des calculs mathematiques sur les mecanismesde montee et descente, le principe de correspondance, et les formulesd’approximation.

Page 41: g é o Statistique

Chapitre 3

Buts et moyens de laGeostatistique Lineaire (1)

Presentation

Ce chapitre precise les limites que nous fixons aux modelesprobabilistes dans le cadre de cet expose. Nous nous placonsici au niveau theorique, plus precisement dans le cadre d’unehypothese stationnaire d’ordre 2 (les problemes de reconstructionoperatoire ne sont pas abordes). Cette premiere partie s’achevepar l’explicitation du calcul des variances.

Le premier paragraphe donne la liste des outils que s’autorise laGeostatistique Lineaire, et en precise les limites d’application.

Dans le cadre du modele stationnaire, le second paragraphe definitle role de la variance en Geostatistique Lineaire, et en donne lemode de calcul.

Le troisieme paragraphe introduit la notion de Varianced’Extension, qui en particulier aura une importance decisive auniveau des estimations.

Le quatrieme paragraphe definit la Variance de Dispersion, quigeneralise la variance des statistiques classiques, et qui sertegalement d’introduction aux modeles non stationnaires.

1. Limites de la geostatistique lineaire

1.1. Cadre de travailGeostatistique Lineaire est un raccourci : il convient de preciserune fois pour toutes que nous nous placons desormais dans le cadrede la Geostatistique Intrinseque, et que les developpements qui vontsuivre concernent le modele probabiliste — la Fonction Aleatoire et nonla Variable Regionalisee. Il s’agit donc ici d’une presentation non pasphysique, mais mathematique.

Cela dit, il est evident que les outils qui seront presentes doiventfaire l’objet d’une Reconstruction Operatoire. Les mecanismes de cette E & C,

chapitres VI et VII.operation ont ete partiellement evoques au chapitre precedent ; ilapparaıt d’ailleurs dans le detail que la question ne se pose pas de faconsemblable selon que l’on travaille globalement (totalite du champ de laVariable Regionalisee) ou localement. Pour alleger l’expose, nous avonsprefere renvoyer sur ce point a la bibliographie.

Nous nous placons donc dans le cas ou nous avons choisi de considererla Variable Regionalisee comme Realisation d’une Fonction Aleatoire,et pour le moment d’une Fonction Aleatoire Stationnaire d’ordre 2. En abrege : FASt-2

En toute generalite, l’outil le plus complet qui permette de decrire uneFonction Aleatoire est sa loi spatiale, c’est-a-dire la fonction :

f(x1, . . . , xn; z1, . . . , zn) = P (Z(x1) ≤ z1, . . . , Z(xn) ≤ zn)

Page 42: g é o Statistique

40 Aide-Memoire de geostatistique lineaire :

definie pour tout nombre n de points d’appui, et pour toute implantationx1, . . . , xn de ces n points.

En depit des contraintes theoriques qu’impose sa coherence interne,la Loi Spatiale est une fonction d’une incroyable richesse, et il estd’emblee clair qu’il sera impossible en toute generalite de lui donnerune signification objective. On sait d’ailleurs, meme en hypothesestationnaire, qu’il serait illusoire de vouloir obtenir des renseignementsvalides sur les lois a trois variables ou plus. En Geostatistique Lineaire,on choisit alors de limiter de facon draconienne la panoplie des outilsdisponibles, et on se borne a manipuler les deux premiers momentsde la Fonction Aleatoire — qui existent si nous sommes en hypothesestationnaire d’ordre 2.

On designera en toute generalite ces deux premiers moments par m(x)

E & C, p170.

Chapitre 1,paragraphe 3.1.

et C(x, y) (ou plus simplement par mx et Cxy) avec respectivement :

mx = E [Z(x)]

Cxy = Cov [Z(x), Z(y)]

— en rappelant qu’il s’agit d’une covariance centree.

1.2. Limites du modeleIl reste bien peu de choses de la richesse de la Loi Spatiale. Non seulementon perd tout controle sur les lois multivariables, mais les lois mono- oubivariables ne sont connues que par leurs esperances.

Des traits peut-etre essentiels de la Fonction Aleatoire (et par ricochetde la Variable Regionalisee qu’elle modelise) sont desormais invisibles anos outils :

• une esperance ne voit pas les atomes, les dissymetries, lesmultimodalites, les queues de distribution, etc. de la loi ;

• une covariance est par nature symetrique, et ne voit donc pas lesphenomenes de diffusion ni de maniere generale les comportementslies a des equations d’evolution ; pire, elle ne voit pas les relationsd’inegalites entre variables, la forme des lois conditionnelles, etc.

En ce qui concerne le champ d’application de ces outils, on voittres vite qu’il faut s’astreindre a ne manipuler que des combinaisonslineaires de la Fonction Aleatoire etudiee : dans le modele, ce n’estque pour de telles expressions que l’on saura fournir une esperance etune variance. Comme consequence, cela implique qu’il faudra travaillersur des Variables Regionalisees additives, c’est-a-dire telles que toutecombinaison lineaire de cette variable ait le meme sens physique quela variable ponctuelle, si l’on veut garder une signification physique anos operations mathematiques. Cette regle pourra cependant subir desentorses dans le cas de probleme de type purement cartographique.

Autrement dit, meme le choix de la variable etudiee peut poser desproblemes dans le formalisme lineaire. L’exemple classique est fournien estimation miniere, ou le triplet teneur–puissance–accumulation estredondant au niveau des donnees. Mais les deux dernieres variablessont additives alors que la premiere ne l’est pas, de sorte que pour uneestimation, il n’est pas indifferent de savoir sur quelle paire de variableson choisit de travailler.

1.3. Utilisation du modeleAvec tant d’inconvenients — reels — il faut bien que le modelede Geostatistique Lineaire presente quelque avantage, pour qu’on luiconsacre ainsi un expose. . .

Ces avantages tiennent en peu de mots, et semblent de peu de poidsau regard des restrictions precedentes, et ils sont pourtant bien souvent

Page 43: g é o Statistique

[3] – Buts et moyens de la Geostatistique Lineaire (1) 41

decisifs. Et tout d’abord, la Geostatistique Lineaire est facile a mettre enœuvre. Les mathematiques requises sont elementaires, et les mecanismesde raisonnement sont toujours les memes. C’est donc une theorie simplequi, meme si elle n’est comprise que comme prelude a des methodes pluselaborees, presente a notre avis une notable valeur pedagogique.

Mais surtout, la Geostatistique Lineaire, en particulier au debut d’une

Voir en particulierles developpementsde GeostatistiqueNon Lineaire.

etude, est bien souvent la seule approche possible. Du fait du petitnombre de parametres qu’elle conduit a inferer, elle peut etre utilisablesur des jeux de donnees pour lesquelles des techniques plus sophistiqueesseraient en echec. C’est evidemment la un argument decisif, meme siulterieurement on a recours des que possible a d’autres methodes.

Quant a la philosophie d’utilisation des methodes lineaires, elle estegalement tres simple : les esperances sont utilisees pour definir la valeur J J J

des estimateurs, les variances sont utilisees comme critere de qualite deces estimateurs. La aussi, il s’agit de choix : on aurait pu imaginer desestimateurs fondes sur la mediane ou le maximum de vraisemblance, descriteres utilisant des intervalles de confiance, etc. — mais a chaque fois,il aurait fallu des outils plus perfectionnes et un modele plus riche, cequi n’est pas toujours possible, tant s’en faut.

1.4. CommentairePour en terminer avec ce tour d’horizon preliminaire du domaine dela Geostatistique Lineaire, il est peut-etre bon de mentionner desinterrogations que l’on rencontre parfois dans la litterature, commepar exemple : la Geostatistique Lineaire est-elle ou n’est-elle pas nonparametrique ?. Ces questions s’accompagnent souvent de promotion Henley, 1981.

de telle ou telle methode non parametrique. . .

Il ne nous semble pas que de telles questions soient les bonnes.Comme tout le monde, nous aimerions pouvoir construire l’estimateurde l’esperance conditionnelle, mais nous savons dans le meme temps que, E & C, p168.

dans le monde physique, cet estimateur est definitivement inaccessible.Comme tout le monde, nous savons que la mediane est un estimateur plusrobuste — et souvent bien plus robuste — que l’esperance, mais noussavons aussi (comme tout le monde esperons-le) que cet estimateur est E & C, p98.

inadapte pour estimer des valeurs moyennes, et a fortiori pour realiserdes changements de support. Voir un cours de

GeostatistiqueNon Lineaire.Ainsi, si les critiques envers la Geostatistique Lineaire sont de nature

purement mathematique, elles sont inutiles parce qu’evidentes. Il esttrivial que, dans un modele theorique fixe quelconque, on puisse trouvermieux qu’un estimateur lineaire, et meilleur critere que la variance.

Mais nous nous placons dans un contexte pratique. Nous ne sommespas libres de choisir tout modele qui nous plairait, et nous devons par-dessus tout respecter les donnees. La marge de manœuvre existe —et elle nous est d’ailleurs parfois reprochee — mais elle a ses limites.Aussi, l’attitude qui nous semble raisonnable est d’agir en connaissancede cause, sans se dissimuler les limites et les risques de la methode,mais sans non plus faire preuve de trop de purisme. Nous savons quela Geostatistique Lineaire est d’autant mieux adaptee a une etude quela Fonction Aleatoire traitee est proche d’une Fonction Aleatoiregaussienne. Dans des cas fortement non-gaussiens, la GeostatistiqueLineaire peut se reveler insuffisante, y compris pour de simples problemesd’estimation. Encore faudrait-il pouvoir definir une distance entre uneFonction Aleatoire et une loi gaussienne, distance qui soit dans le memetemps un indicateur de la degradation de la qualite de l’estimation Notion a definir !...

lineaire. Un sujet de recherche passionnant, mais bien difficile !

Quoi qu’il en soit, les Geostatisticiens n’ont pas attendu pour mettreen evidence les limites des methodes lineaires, et pour proposer desalternatives. La Geostatistique Non Lineaire — qui sort des limites de E & C, p168.

cet expose — est une des reponses possibles a ces problemes.

Page 44: g é o Statistique

42 Aide-Memoire de geostatistique lineaire :

2. Mecanismes de calcul des variances

Dans toute la suite de ce chapitre, nous nous placerons dansle cadre de l’hypothese de stationnarite d’ordre 2.

2.1. Les Combinaisons Lineaires AutoriseesNotations : les combinaisons lineaires

i λi Z(xi) construites sur laUne convention de

notations classique,que nous utiliseronsdesormais de faconassez systematique.

Fonction Aleatoire seront desormais notees : λi Zi. Le cas echeant, ilnous faudra aussi manipuler des mesures, soit :

λ(dt)Z(t)

Dans le cadre de la Geostatistique Lineaire, c’est sur des combinaisonslineaires que porteront les deux outils, esperance et variance.

Encore faut-il, lorsqu’on ecrit :

E[

λi Zi

]

ou Var[

λi Zi

]

que ces expressions aient mathematiquement un sens : il faut que laI I I

combinaison lineaire λi Zi admette, dans le modele probabiliste, uneesperance et une variance — ce qui en toute generalite ne va pas de soi.

Bien sur, cette remarque peut sembler totalement superflue dans lecas present, puisque nous nous trouvons dans le cadre d’un modelestationnaire d’ordre 2, et que donc — par hypothese — les deux premiersmoments existent pour toute combinaison lineaire.

Il nous semble au contraire qu’il vaut mieux, des maintenant, fixer unefois pour toutes cette regle de conduite :

Avant d’ecrire des formules comme E[

λi Zi

]

ou

Var[

λi Zi

]

, il faut imperativement s’assurer queces expressions sont licites, c’est-a-dire qu’elles ontmathematiquement un sens.

— ce qui peut aussi s’exprimer : . . . c’est-a-dire que ces quantites ne

I I I

I I I

peuvent prendre (dans le modele) de valeurs infinies.

Une combinaison λi Zi, ou une integrale∫

Z(t)λ(dt), verifiant cettepropriete sera appelee une Combinaison Lineaire Autorisee — ce quel’on notera en abrege : CLA.

Un systeme de poids λi affectes a des points xi et tels que λi Zi soitune CLA, ou plus generalement une mesure λ(dt) telle que

Z(t)λ(dt)soit une CLA, sera appele mesure autorisee.

2.2. Moments d’une CLASoit λi Zi une CLA. Ses deux premiers moments existent par hypotheseet, en gardant les notations precedentes :Paragraphe 1.1.

E[

λi Zi

]

= λi mi

Var[

λi Zi

]

= λi Cij λj

Notons au passage que ces formules ne requierent aucune propriete destationnarite, mais seulement l’existence des deux premiers moments.

Page 45: g é o Statistique

[3] – Buts et moyens de la Geostatistique Lineaire (1) 43

La formule fondamentale :

Var[

λi Zi

]

= λi Cij λj

qui exprime la variance d’une CLA comme forme quadratique construitesur une fonction structurale, nous accompagnera sous des presentationsdiverses au long de tous les chapitres a venir.

2.3. Proprietes de la covariance stationnaire

Rappelons que nous nous sommes places pour le moment en hypothesestationnaire d’ordre 2. En ce qui concerne le premier moment, on endeduit :

m(x+ x0) = m(x0) ∀x

donc :

m(x) = m (constant dans l’espace)

Pour le moment d’ordre 2 :

C(x + a, y + a) = C(x, y) ∀x, y

donc :

C(x, y) = C(h) avec h = (x− y)

Les proprietes mathematiques de la covariance stationnaire sont voisinesde celles du Covariogramme Transitif : Chapitre 2,

paragraphe 1.2.

• Symetrie :

C(h) = C(−h)

• Inegalite de Schwarz :

| C(h) | ≤ C(0)

• Positivite :∫

λ(dt)C(t − u)λ(du) ≥ 0

• Le comportement analytique de la covariance a l’origine est lie auxcaracteres de continuite ou de derivabilite en moyenne quadratique de Fasc. 5, p57.

la Fonction Aleatoire.

Remarque : contrairement a ce qui se passait dans le cas duCovariogramme Transitif, il n’y a pas de raison pour que C(h) soitidentiquement nul au-dela d’une certaine valeur de h. Il n’est meme pasassure que l’integrale :

C(h) dh

existe (c’est-a-dire : ait un sens, et prenne une valeur finie). Chapitre 4,paragraphe 3.3.

Page 46: g é o Statistique

44 Aide-Memoire de geostatistique lineaire :

3. Variance d’extension

3.1. NotationsSoit un domaine v borne quelconque. On designera par Z(v) la VariableAleatoire obtenue en faisant la moyenne spatiale de Z(x) sur v, soit :

Z(v) =1

[v]

v

Z(x) dx

ou la notation [v] designe la mesure (longueur, aire, volume, etc. ) dudomaine v.

Remarque : nous ne distinguerons pas le cas ou v serait un ensemble finide N points xi, ce qui donnerait alors :

Z(v) =1

N

i

Z(xi)

On peut montrer, comme v est borne, que Z(v) admet une variance etFasc. 5, p60.

que cette variance peut s’ecrire :

C(v, v) = Var[

Z(v)]

=1

[v]2

v

v

C(x− y) dx dy

ce qui n’est autre que la version continue de la formule fondamentaleParagraphe 2.2.

exprimant la variance d’une CLA..

3.2. Formule de la Variance d’ExtensionSoient deux domaines v et v′. On note σ2

E(v, v′) , et on appelle variance

d’extension de v a v′, la variance de la difference Z(v) − Z(v′), soit :

σ2E(v, v′) = Var

[

Z(v) − Z(v′)]

Rappelons que, dans le cadre du modele stationnaire d’ordre 2, toutecombinaison lineaire est autorisee, de sorte que l’ecriture ci-dessus estlicite theoriquement.

On peut proposer une interpretation de la difference Z(v) − Z(v′), enconsiderant par exemple Z(v) comme une moyenne a estimer, et Z(v′)comme son estimateur. L’ecart Z(v) − Z(v′) represente alors l’erreurd’estimation de Z(v) par Z(v′) .

D’apres nos hypotheses de stationnarite d’ordre 2,Paragraphe 2.3.

E[

Z(v) − Z(v′)]

= m−m = 0

Cette propriete s’exprime en disant que Z(v′) constitue un estimateurClairement, cettepropriete de non-biais esteminemment souhaitable

lors de la constructiond’un estimateur. . .

sans biais de Z(v).

Quant a la Variance d’Extension, elle se developpe en :

σ2E =

1

[v]2

v

v

C(x− y) dx dy +1

[v′]2

v′

v′

C(x− y) dx dy

−2

[v] [v′]

v

v′

C(x−y) dx dy

Page 47: g é o Statistique

[3] – Buts et moyens de la Geostatistique Lineaire (1) 45

ou plus synthetiquement :

σ2E = C(v, v) + C(v′, v′) − 2C(v, v′)

avec les notations du paragraphe 3.1.

3.3. Analyse de la formule

Si on conserve le point de vue : estimation de Z(v) par Z(v′),σ2

E(v, v′) est donc une mesure de la qualite de cette estimation, puisquel’on a convenu de dire qu’une estimation est d’autant moins bonne quela variance de l’erreur est plus forte.

Comme il a ete dit precedemment, on peut legitimement juger ce critere Paragraphe 1.4.

trop fruste. Il ne constitue effectivement qu’une regle du jeu que l’onpeut a priori accepter ou rejeter. Mais, une fois qu’elle est accepteeen connaissance de cause, cette regle peut se reveler bien utile, parexemple pour classer des estimateurs. L’interpretation de cette operationne pose pas de probleme majeur, et a la Variance d’Extension peut etre Matheron &

Formery, 1962.appliquee la procedure de Reconstruction Operatoire. Le formalismedes representations glissantes — pour lequel nous renvoyons a labibliographie — permet alors de donner un sens objectif a la Variance E & C, p147-151.

d’Extension ; c’est la un exemple de contrecoup positif, et essentiel, dela simplicite du modele.

Bien sur, les limites d’un tel critere sont evidentes. Nous en releveronsdeux seulement, mais d’importance :

• σ2E n’est pas une variance conditionnelle. En particulier, cette

Variance d’Extension fait jouer un role symetrique a la quantitea estimer et a l’estimateur : la Variance d’Extension de v a v′

est toujours egale a celle de v′ a v. Autrement dit, la variancede l’(erreur d’)estimation de l’altitude moyenne de la France parl’altitude de la porte d’entree de l’Ecole des mines est egale a cellede l’estimation de l’altitude de cette porte d’entree par l’altitudemoyenne de la France. . . et ne depend pas des valeurs des donneesutilisees pour realiser cette estimation ;

• Il y a loin d’une Variance d’Extension a un intervalle de confiance.Il faut etre tres clair sur ce point : la Variance d’Extension enelle-meme ne permet pas de proposer un intervalle de confiance J J J

pour l’estimateur ; il faudrait pour cela d’importantes hypothesessupplementaires. Or il est vrai que, consciemment ou non, c’esta un intervalle de confiance que se refere souvent l’utilisateurd’une methode d’estimation : en matiere de Geostatistique, il luifaudra alors s’adresser a des methodes — du reste classiques — deGeostatistique Non Lineaire ou de Simulations.

Pour en revenir a l’expression mathematique elle-meme, nous relevonsque la Variance d’Extension depend :

• de la structure de la Fonction Aleatoire, par l’intermediaire de lafonction de covariance ;

• de la geometrie du domaine a estimer ;

• de la geometrie de l’estimateur ;

• de la position relative du domaine a estimer et de l’estimateur.

Page 48: g é o Statistique

46 Aide-Memoire de geostatistique lineaire :

Si nous restons, comme dans tout ce chapitre, dans le cadred’une hypothese de stationnarite d’ordre 2, il est clair que cetteVariance d’Extension ne depend pas de l’implantation particuliere dela configuration d’estimation formee par l’union de v et v′. Plusprecisement, si nous notons par τhv le translate de v par le vecteurh — c’est-a-dire l’ensemble des points x tels que x− h ∈ v —, alors

σ2E(v, v′) = σ2

E(τhv, τhv′) ∀h

On peut donc dire que la Variance d’Extension est une caracteristiquenon locale de notre modele ; elle ne depend que de la geometrie duprobleme, et du modele global exprime par la fonction structurale.

Une curiosite, enfin : supposons que v et v′ se reduisent respectivementau point x et au point x+ h. La formule generale devient :

σ2E (x, x+ h) = 2C(0) − 2C(h)

Cette Variance d’Extension d’un point x quelconque au point x+hn’est fonction que de h compte-tenu de l’hypothese de stationnarited’ordre 2, et connaıtra une certaine notoriete (et une importancePremiere apparition du

concept de variogramme.decisive) au fil des paragraphes suivants. . .

3.4. Cas particulier d’un reseau de prelevements finiSupposons que l’estimateur Z(v′) soit constitue de la moyenne :

Z(v′) =1

N

i

Z(xi)

deN valeurs ponctuelles. La formule generale de la Variance d’ExtensionFasc. 5, p66.

est bien sur toujours valable, mais elle peut aussi etre ecrite dans ce casparticulier en remplacant les integrales par des sommes finies :

σ2E =

1

[v]2

v

v

C(x − y) dx dy +1

N2

i

j

C(xi − xj)

−2

N [v]

v

i

C(xi − y) dy

Cette expression — qui dans sa signification ne differe absolument pasde la forme generale — est parfois appelee variance d’estimation de vpar les prelevements Z(xi). Elle peut souvent etre interpretee comme unmelange de calculs exacts et de calculs approches des memes integrales,et peut a ce titre etre comparee a la formule semblable obtenue dans leChapitre 2,

paragraphe 2.2.cadre du modele transitif. Cette convergence, qui ne devrait plus noussurprendre, laisse d’ores et deja prevoir dans le modele intrinseque desregles (correspondances terme a terme et approximations) voisines deChapitre 2,

paragraphe 3.3–3.4.celles rencontrees dans le cas transitif.

4. Variance de dispersionLa notion que nous voulons definir maintenant nous semble occuper uneplace tout a fait singuliere en Geostatistique :

• la premiere raison en est historique : on peut interpreter lagenese de la Geostatistique comme la recherche d’explication ades comportements de cette variance de dispersion, comportementsqui se revelent incompatibles avec le formalisme de la Statistiqueclassique. Naturellement, l’expression meme de variance de

Page 49: g é o Statistique

[3] – Buts et moyens de la Geostatistique Lineaire (1) 47

dispersion n’etait pas encore introduite, mais la notion etait dejabien connue et manipulee par les mineurs d’or d’Afrique du Sud ;

• en second lieu, ces manipulations purement empiriques ontimmediatement ouvert la voie a un elargissement theorique dumodele stationnaire ; retrospectivement, on peut dire que lespremieres manipulations de la variance de dispersion contenaientles premisses de la Geostatistique Non Stationnaire ;

• par la suite, ce formalisme permet d’introduire la notion essentiellede Changement de Support, qui joue un role capital enGeostatistique Non Lineaire ;

• enfin, la variance de dispersion permet d’elaborer un controle del’hypothese d’ergodicite du modele utilise.

Remarque : la Reconstruction Operatoire est ici un peu plus compliqueeque — par exemple — pour la Variance d’Extension : nous renvoyonspour plus de details a la bibliographie. Nous nous proposons seulementdans cet expose de fournir les etapes de la definition de la variance dedispersion. Notons ici une situation peu frequente : nous devons allerchercher le point de depart de cette definition au niveau du modeleprimaire, c’est-a-dire de la Variable Regionalisee.

4.1. Dispersion statistique de v dans VSoit un certain domaine V de l’espace geographique, et une partition de

Chapitre 4.

E & C, p108.

V par des sous-domaines vi identiques a une translation pres. Les vi se

E & C, p107.

deduisent donc tous par translation d’un certain domaine generique v :

Vv1

vi

vj

vNv

Designons par z la valeur moyenne sur V de la Variable Regionalisee Probleme de notations :nous conserverons danstout ce paragraphe l’usagede designer par V ouW le domaine. L’emploid’une majuscule ne designebien sur pas dans ce casune quantite aleatoire !

z(x) etudiee, et par zi la valeur moyenne de z(x) sur vi. On a donc :

z =1

[V ]

V

z(x) dx et zi =1

[vi]

vi

z(x) dx

Soit N le nombre de sous-domaines vi constituant V :

V =N⋃

i=1

vi et vi ∩ vj = ∅ si i 6= j

Page 50: g é o Statistique

48 Aide-Memoire de geostatistique lineaire :

On appelle alors dispersion statistique de v dans V et on note s2(v | V )la quantite :

s2(v | V ) =1

N

i

(zi − z)2

Il ne s’agit ni plus ni moins que d’une generalisation de la dispersion(ou plus precisement de la variance) au sens de la statistique classique.Du reste, si on fait tendre v vers un support ponctuel, on retrouvera lavariance statistique usuelle de z(x) (ponctuelle) dans le champ V .

4.2. Passage a la version probabilisteSuivant le mecanisme classique de randomisation, on transposeChapitre 1,

paragraphe 2.3.l’expression precedente dans le modele probabiliste. Formellement, celarevient tout simplement a remplacer la Variable Regionalisee z par laFonction Aleatoire associee Z. On definit ainsi un objet qui a le statutmathematique d’une Variable Aleatoire, notee S2(v | V ) :

S2(v | V ) =1

N

i

(

Zi − Z)2

Selon le mecanisme de passage inverse, on voit donc que la DispersionStatistique de v dans V definie au paragraphe precedent s’interpretecomme une Realisation de cette Variable Aleatoire S2(v | V ).

4.3. Variance de dispersion de v dans VOn definit la variance de dispersion de v dans V comme etantl’esperance mathematique de S2(v | V ), et on la note σ2(v | V ) :

σ2(v | V ) = E[

S2(v | V )]

L’explicitation de cette formule ne presente pas de difficulte : elle estFasc. 5, p67-68.

fondee uniquement sur des interversions d’integrales et de sommes, etsur la linearite de l’integrale ; notons toutefois que c’est a cette etapequ’intervient de facon cruciale l’hypothese que les vi constituent unepartition de V . Tous calculs faits, on obtient :Voir complement

en fin de chapitre.

σ2(v | V ) = C(v, v) − C(V, V )

Remarque : cette formule pourrait d’ailleurs etre utilisee commedefinition de la Variance de Dispersion ; il n’y aurait alors plus decontrainte de partition de V par v. On pourrait meme imaginer quev soit un sur-ensemble de V , auquel cas σ2(v | V ), desormais depourvude sens physique, pourrait parfaitement etre negatif. Dans cette optique,on pourrait egalement introduire la covariance de dispersion de v et v′

dans V , par :

σ2(v, v′ | V ) = C(v, v′) − C(V, V )

Mais, dans ces conditions, on perdrait la possibilite de realiser laUn sujet de reflexion. . .Reconstruction Operatoire. En revanche, on introduirait la possibilitetheorique d’exprimer la Variance d’Extension de v a v′ a l’aide des(co)variances de dispersion dans un champ V arbitraire :

σ2E(v, v′) = σ2(v | V ) + σ2(v′ | V ) − 2σ2(v, v′ | V )

Page 51: g é o Statistique

[3] – Buts et moyens de la Geostatistique Lineaire (1) 49

4.4. Resultats complementairesLorsque v est reduit a un point, le modele de partition de V par v esttoujours possible, quelle que soit la forme de V . La formule generale sesimplifie en :

σ2(0 | V ) = C(0) − C(V, V )

4.5. Formule de KrigeLa formule de Krige, dite encore relation d’additivite, a ete constateeempiriquement bien avant tout recours aux modeles probabilistes. Elledecoule en tout cas immediatement de l’expression generale de σ2(v | V )et, pour trois ensembles quelconques v, V et W , s’ecrit :

σ2(v |W ) = σ2(v | V ) + σ2(V |W )

Naturellement, sa signification physique n’est assuree que si v et Vconstituent des partitions emboıtees de W . Comme cas particulier, on

Il est prudent depreferer l’expression formule de Krige,l’expression relationd’additivite ayantune signification toutautre en GeostatistiqueNon Stationnaire (voirAnnexe au Chapitre 7.).

retiendra :

σ2(v | V ) = σ2(0 | V ) − σ2(0 | v)

Nous sommes maintenant de plain-pied avec la Geostatistique Lineaire, Commentaires

du moins dans le cadre de l’hypothese stationnaire. Avec le mode decalcul des differentes variances, nous disposons de tous les outils quinous seront necessaires dans les problemes d’estimation. Mais plutotque nous lancer immediatement dans ces calculs, nous voudrions profiterde cette premiere etape — plus methodologique que technique — pourreexaminer la notion de stationnarite et voir dans quelle mesure il estpossible d’assouplir nos hypotheses actuelles.

Ce choix n’est pas innocent. Il ne semble pas judicieux ici de developperdes calculs qui — l’histoire l’a prouve — se representeront presque telsquels au fur et a mesure que nous elargirons notre champ de travail.Il nous semble donc preferable, maintenant, de seulement degagerles idees directrices qui, quel que soit le degre de stationnarite, assurentl’unite de la demarche de la Geostatistique Lineaire.

Pour ce chapitre, les references bibliographiques que l’on peut envisager Bibliographie

sont essentiellement des cours de Geostatistique. Autant donc se limiterau Fascicule 5 ou, pour plus de detail, a

• Les Variables Regionalisees et leur estimation,Matheron, 1965.

Concernant la notion de Variance d’Extension, voir l’article

• Recherche d’optimum dans la mise en exploitation desgisements miniers, Matheron et Formery, 1962.

Les documents plus appliques, comme par exemple :

Page 52: g é o Statistique

50 Aide-Memoire de geostatistique lineaire :

• Traite de Geostatistique Appliquee, Matheron, 1962.

constituent une approche plus technique que le present expose, etinsistent sur des formules, abaques et approximations que les moyensde calcul actuels rendent sans doute moins indispensables.

Et cette fois encore, concernant les limites de la Geostatistique Lineaire,nous esperons que le lecteur a assez de sens critique pour tirer profitmeme des polemiques que l’on rencontre parfois dans les publications. . .

Explicitation de la variance de dispersion : avec les notations duComplement

paragraphe 4, soit a calculer la Variance de Dispersion

σ2(v | V ) = E[

S2(v | V )]

= E

[

1

N

N∑

i=1

(

Zi − Z)2

]

On obtient successivement :

σ2(v | V ) = E

[

1

N

N∑

i=1

(

Zi − Z)2

]

(1)=

1

N

N∑

i=1

Var[

Zi − Z]

=1

N

N∑

i=1

[

Var[

Zi

]

+ Var[

Z]

− 2Cov[

Zi, Z]

]

(2)=

1

N

N∑

i=1

[

1

[vi]2

vi

vi

C(x− y) dx dy

+1

[V ]2

V

V

C(x − y) dx dy

−2

[vi] [V ]

vi

V

C(x− y) dx dy

]

(3)=

1

NNC(v, v) + C(V, V )

−2

(N [v]) [V ]

N∑

i=1

vi

V

C(x − y) dx dy

(4)= C(v, v) + C(V, V ) − 2C(V, V )

= C(v, v) − C(V, V )

Page 53: g é o Statistique

[3] – Buts et moyens de la Geostatistique Lineaire (1) 51

(1) : par linearite de l’esperance, et parce que d’apres l’hypothesede stationnarite, E

[

Zi

]

= E[

Z]

: d’ou E[

Zi − Z]

= 0. Enconsequence,

E[

(

Zi − Z)2]

= Var[(

Zi − Z)]

(2) : par application de la formule generale du calcul de la varianced’une forme lineaire

Var

[∫

Z(u)λ(du)

]

=

∫ ∫

C(u− v)λ(du)λ(dv)

(3) : parce que tous les domaines vi ont meme mesure que v (donc,[vi] = [v], et ceci ∀i), et par definition de la covariancemoyenne sur un domaine.

(4) : parce que les vi constituent une partition de V , et que lasomme en i des integrales sur les vi equivaut a l’integrale surV . Par ailleurs, N [v] = [V ] .

Page 54: g é o Statistique

52 Aide-Memoire de geostatistique lineaire :

Page 55: g é o Statistique

Chapitre 4

Stationnarite et ergodicite

Presentation

Les outils elabores jusqu’ici ne requierent en realite, au niveau dumodele probabiliste, que l’existence des deux premiers moments ;leur stationnarite n’apparaıt pas indispensable. Peut-on alorsechapper a toute hypothese de stationnarite ? Quelles sont leshypotheses minimales requises ?

Le premier paragraphe revient sur le sens meme de l’hypothese destationnarite, en distinguant les modeles globaux et les modeleslocaux.

Le second paragraphe rappelle en quoi des modeles stationnairespeuvent se reveler insuffisants au cours d’une etude reelle, etesquisse la demarche generale d’affaiblissement des hypotheses destationnarite.

Au troisieme paragraphe, on revient sur la signification objectivede l’esperance mathematique, et sur les controles possibles del’ergodicite.

1. Les deux niveaux de modele

1.1. Signification et necessite de l’hypothese stationnaireArrives a ce point de la presentation de la Geostatistique, nous noustrouvons dans une situation qui peut paraıtre paradoxale. Car, ayantchoisi de developper cette presentation au niveau du modele probabiliste— cf. la figure1 du Chapitre 1. : nous travaillons dans la derniere Chapitre 1,

paragraphe 1.1.colonne, au niveau le plus abstrait — il apparaıt que l’hypothese destationnarite ne joue finalement aucun role dans les developpements denature mathematique. On aurait pu etablir l’equivalent des formulesdu chapitre precedent, en se contentant de l’existence de la fonction decovariance Cxy, sans pour autant imposer la stationnarite :

Cxy = C(x− y)

Mais la situation n’est pas si simple. La Geostatistique n’est en effetpas une discipline de Probabilites pures. Nous avons longuement insiste Chapitre 1.

sur la necessite de maintenir le parallele entre les manipulations denature mathematique (par exemple celles du chapitre precedent) et lesoperations physiques, c’est-a-dire schematiquement celles qui concernentla Variable Regionalisee. Autrement dit, sauf si nous choisissons de fairedes mathematiques pures, nous devons garder a l’esprit le Principe des Chapitre 1,

paragraphe 4.3.Grandeurs Regionales ; la gamme des modeles probabilistes que nouspouvons utiliser s’en trouve ipso facto considerablement reduite.

1.2. Les problemes globauxUn probleme global est un probleme qui met en jeu la totalite du champde la Variable Regionalisee etudiee. Par hypothese donc, on se trouve

Page 56: g é o Statistique

54 Aide-Memoire de geostatistique lineaire :

confronte simultanement aux effets de la structure intrinseque de laVariable Regionalisee et a ceux de la geometrie du Champ.

L’approche naturelle de ce type de probleme est la methode transitive.Des lors, nul besoin d’hypothese stationnaire au niveau de la physiquedu phenomene. On a vu en revanche que, pour introduire une notionde Variance d’Estimation, on etait amene a probabiliser le reseaude donnees. Cette technique, presentee ci-dessus dans le cas d’unemaille reguliere, peut etre generalisee a une maille quelconque : nousdevons exprimer alors une certaine condition de stationnarite(ou si l’on prefere ici, d’homogeneite spatiale) de l’implantation desdonnees : la stationnarite peut souvent etre introduite, non pas a titred’hypothese relative a la realite physique, mais simplement comme unecaracteristique de la methode d’estimation choisie par nous.

Naturellement, cette hypothese ne pourra pas toujours etre faite. Si le

Chapitre 2.

Chapitre 2,paragraphe 2.2.

champ est reconnu de facon tres heterogene, il sera souhaitable de le

E & C, p135.

E & C, p135.

subdiviser en sous-zones sur lesquelles l’hypothese de stationnarite (dela reconnaissance...) puisse etre admissible. C’est la une manipulationde nature purement geometrique (il n’est question que de l’implantationdes donnees) et qui releve du simple bon sens : on essaie de ne pasmelanger des informations de qualites differentes. Nul besoin ici degrandes theories, mais seulement de sens pratique.

Ainsi probabilise, le probleme peut etre traite selon le formalismeclassique : l’estimation globale est desormais sans mystere. On peutChapitre 2.

cependant vouloir aussi se poser des questions plus structurales sur laVariable Regionalisee elle-meme. Toute la question est de savoir si onest capable de separer, dans le Covariogramme Transitif, ce qui dependde la Variable Regionalisee et ce qui depend du Champ.Matheron 1965, p96-102.

Sans rentrer dans les details, disons que cette analyse se fondeprincipalement sur une etude simultanee du Covariogramme Transitif etE & C, p137.

du Covariogramme Geometrique. Mais la aussi, le simple sens physiqued’abord, l’experience geostatistique ensuite, par le simple examen visueldes fonctions structurales experimentales, permettent de trancher s’il estraisonnable de faire l’hypothese d’une certaine forme de stationnarite —au sens physique — de la Variable Regionalisee.

Si la reponse est negative, il faut alors s’engager vers des modelesplus compliques. Nous examinerons ulterieurement, mais seulementdans le cadre local, un modele fonde sur la dichotomie de la VariableRegionalisee, et un autre fonde sur l’elargissement de l’hypothese destationnarite. Mais d’avance, on peut se douter que les interrogations denature structurale au niveau global souleveront d’importantes difficultes.

En conclusion : au niveau global,

• un probleme d’estimation ne requiert aucune hypothese destationnarite au niveau de la Variable Regionalisee. Le facteur decisifest le comportement a l’origine du Covariogramme Transitif ; il s’agiten l’occurrence d’un parametre objectif ;

• un probleme d’interpretation structurale de la Variable Regionaliseeest a priori beaucoup plus difficile.

1.3. Les problemes locaux

1.3.1. DefinitionOn designe par probleme local un probleme qui ne se pose qu’au niveauPour tout ce paragraphe,

voir Estimer etChoisir, p147-156. d’une petite portion du champ de la Variable Regionalisee. On met ainsi

en evidence la tres importante notion de voisinage, portion de l’espacequi englobe a la fois le support de la Grandeur Regionale a estimer etl’ensemble des donnees utilisees dans ce but. En general, on ne se bornepas a un seul probleme ponctuel, mais on travaille sur un meme voisinageV de l’origine, que l’on translate ensuite a travers l’ensemble du champ :c’est le travail en voisinage glissant.

Page 57: g é o Statistique

[4] – Stationnarite et ergodicite 55

Le travail en Voisinage Glissant ou, en d’autres termes, l’elaboration demodeles locaux, est peut-etre plus minutieux mais souleve en fait moinsde problemes methodologiques que pour les modeles globaux. Nous noustrouvons dans le cas ou la repetition spatiale, obtenue par la translationdu voisinage, peut se substituer a la multiplicite des Realisations de laFonction Aleatoire associee, moyennant des hypotheses de stationnariteet d’ergodicite.

Le probleme est, une fois de plus, de se limiter a une gamme de modelesqui puissent etre specifies dans des conditions raisonnables. La premieredes decisions consiste en l’occurrence a construire des estimateursinvariants par translation — et lineaires, rappelons-le. L’expression del’estimateur en fonction des donnees ne dependra que de la configurationd’estimation, non de sa localisation. Autrement dit, nous introduisonsune propriete de stationnarite au niveau de l’estimateur, sans prejugerd’une quelconque stationnarite du phenomene physique.

Naturellement, cette affirmation doit etre nuancee. Car, commeconsequence de notre choix, la variance de notre estimateur sera nonlocalisee : elle ne representera qu’une moyenne obtenue sur des voisinagesglissants indifferencies. Pour que cette moyenne ait un sens, ou encore,pour que les fluctuations de la Variance d’Estimation ne soient pas tropimportantes, il convient donc que les configurations d’estimation soientsuffisamment semblables d’un voisinage a l’autre : comme d’ailleurs enmodele global, on a une contrainte d’homogeneite de la repartition del’information. Si cette contrainte n’est pas satisfaite, on a recours a lamethode habituelle de la division du champ en sous-zones homogenes.

1.3.2. Un exemplePour simplifier, examinons le probleme de l’estimation ponctuelle dela Variable Regionalisee sur un domaine S0. On notera qu’il n’y aactuellement aucune hypothese, ni probabiliste, ni de stationnarite. Soitdonc S0 la zone d’interet, supposee homogene. Soit V le voisinageglissant. Pour tout u ∈ S0, on forme alors :

z∗(u) =

V

z(u+ x)λ(dx)

ou λ(dx) ne depend pas de u.

On adoptera classiquement, comme critere de qualite de cette estimation, E & C, p148.

la valeur quadratique moyenne sur S0 de l’erreur z∗(u) − z(u), soit :

S0

(

z∗(u) − z(u))2

du

Il est facile de voir que cette quantite s’exprime en fonction des λ et dela seule fonction structurale C definie par :

C(x, y) =1

[S0]

S0

z(u+ x) z(u+ y) du

On notera la similitude avec le formalisme transitif.

On pourrait, au moins au plan theorique, en rester la. Mais lamanipulation des integrales d’espace est peu commode. Guides parl’expression de C(x, y), dans laquelle le point courant u parcourt ledomaine S0, nous definissons une Fonction Aleatoire sur V par : E & C, p149.

Z(x) = z(u+ x) x ∈ V

ou u est le point aleatoire uniforme sur S0. Z(x) est appelerepresentation glissante de z(u) dans S0. Il est alors immediat que :

C(x, y) = E [Z(x).Z(y)]

Page 58: g é o Statistique

56 Aide-Memoire de geostatistique lineaire :

L’integrale d’espace C(x, y), qui est une Grandeur Regionale, est lacovariance de la Fonction Aleatoire que nous venons de definir.

La specification de C(x, y) est donc un probleme classique demodelisation de covariance, avec la particularite que les parametres dumodele ont cette fois une signification objective : l’analyse structuralen’est pas une inference statistique, mais constitue simplement unehypothese d’approximation anticipee d’une integrale d’espace.

C’est ici seulement qu’intervient l’hypothese de stationnarite, dans lebut d’acceder a une robustesse raisonnable de la modelisation. Plutot

E & C, p149.

qu’une fonction C(x, y) de deux variables, on cherchera une fonctiond’expression beaucoup plus simple C(x−y), pour x et y ∈ V . Et cettefois, l’hypothese de stationnarite est controlable puisqu’il est possible deconstruire :

1

[S0]

S0

z(u+ x) z(u+ y) du

et de verifier que cette fonction (avec une approximation convenue) nedepend pas de x et y separement, mais seulement de x− y.

1.3.3. Remarques finales

L’hypothese de stationnarite que nous venons d’introduire est unestationnarite locale : elle ne concerne que des distances x− y pour x ety appartenant a V . L’adjectif local a donc bien la signification de :E & C, p156.

relatif au voisinage glissant. Le modele de covariance ne signifie plusI I I

rien en dehors de V , alors meme qu’il est mathematiquement valable surtout l’espace.

On notera aussi que local n’est pas synonyme de localise.Au contraire, notre modele ne fait aucune distinction entre deuxI I I

implantations quelconques du voisinage glissant. Il n’a qu’une valeurmoyenne sur l’ensemble de ces implantations.

Enfin, bien qu’ayant une validite locale, le modele a ete obtenu par uneconstruction globale — ou plus precisement par une integrale sur S0.

2. Vers un affaiblissement de l’hypothese stationnaire

2.1. Modele sans variance a prioriIl peut sembler surprenant de vouloir examiner des modeles probabilistespresentant une variance a priori infinie. Le modele probabiliste est eneffet suppose rendre compte de la Variable Regionalisee et celle-ci, auniveau de l’echantillonnage, presentera toujours une variance finie. Cetteextension a de nouveaux modeles semble donc superflue.

Il est exact qu’une simple photographie statistique des donnees seraimpuissante a deviner des phenomenes de dispersion infinie. En revanche,on peut considerer qu’une dispersion statistique est fonction a la fois dela taille de l’echantillon et de la population de reference. En faisantvarier l’un ou l’autre de ces parametres geometriques, on pratique uneapproche dynamique des donnees qui peut mettre en evidence descomportements avec lesquels un modele stationnaire est incompatible.

Revenons pour cela a l’expression de la Variance de Dispersion :Chapitre 3,paragraphe 4.3.

σ2(v | V ) = C(v, v) − C(V, V )

Si le modele stationnaire d’ordre 2 est acceptable, cela signifie que laDispersion Experimentale s2(v | V ), calculee sur un nombre suffisantde panneaux V repartis dans l’ensemble du Champ, devient enmoyenne egale a C(v, v) − C(V, V ). Ce controle est parfaitementrealisable. De plus, dans le modele stationnaire d’ordre 2, cette quantiteest bornee, et admet meme une asymptote en general.

Page 59: g é o Statistique

[4] – Stationnarite et ergodicite 57

Or, il existe des phenomenes pour lesquels la quantite experimentales2(v | V ) croıt indefiniment lorsque V croıt. Un tel comportement nepeut donc etre decrit par une expression C(v, v)−C(V, V ), ou C seraitune Covariance Stationnaire. Il faut alors chercher un affaiblissement del’hypothese stationnaire.

Naturellement, on peut objecter que dans la pratique, on ne pourrajamais faire tendre V vers l’infini, et que par consequent on pourraitsupposer que σ2(v | V ) admette une borne pour une dimension Vsuperieure a celle du domaine de travail. Mais une telle affirmationechappe a tout controle, et n’a donc plus de caractere objectif : laconnaissance parfaite de la Variable Regionalisee ne suffirait pas atrancher le dilemme, puisqu’il faudrait egalement changer de Champ— c’est-a-dire tout simplement changer de probleme. La valeur finiede variance que l’on integrerait dans ce modele stationnaire serait unparametre purement conventionnel.

On est confronte une nouvelle fois au seuil d’objectivite. La varianceeventuelle ne pouvant recevoir un statut operatoire, l’attitude positiveconsiste a la filtrer du formalisme, a ne manipuler que des expressionsqui n’ont pas besoin d’elle.

2.2. Combinaisons lineaires autoriseesLe passage a une hypothese plus faible sur la stationnarite est classique : Fasc. 5, p53.

il consiste a supposer que ce sont cette fois non plus les valeursponctuelles, mais les accroissements de la Fonction Aleatoire quisatisfont au modele stationnaire d’ordre 2.

Ce nouveau modele sera examine au chapitre suivant. Ce qui nousinteresse ici, c’est le mecanisme qui conduit a ce genre d’hypothese.L’idee directrice est un examen de la notion capitale de combinaison Chapitre 3,

paragraphe 2.1.lineaire autorisee.

Dans le modele stationnaire d’ordre 2, toutes les mesures1 sontautorisees ; toutes les combinaisons lineaires sont donc autorisees, et sontde surcroıt stationnaires.

Nous souhaitons maintenant elaborer un modele qui puisse prendre encompte le fait que la plus simple des combinaisons lineaires, la valeurponctuelle elle-meme, n’admette plus de moment d’ordre 2. Autrementdit, nous cherchons un modele dans lequel l’hypothese de stationnarited’ordre 2 ne porte que sur un sous-ensemble de l’ensemble de toutes lescombinaisons lineaires — et nous savons deja que les valeurs ponctuellesn’appartiendront pas a ce sous-ensemble. Ou encore : nous cherchonsa caracteriser un ensemble de mesures autorisees, sous-ensemble del’ensemble de toutes les mesures, auquel n’appartiennent pas les mesuresponctuelles.

La dialectique est claire : J J J

• d’un cote, une limitation, puisque ce n’est plus que pour une famillereduite de combinaisons lineaires que nos operations theoriquesauront une signification objective ;

• de l’autre cote, un gain, puisque on saura alors rendre compted’une gamme plus large de phenomenes, et en particulier traiterdes modeles sans variance a priori .

Une derniere remarque : le choix des contraintes qui caracterisentles mesures autorisees n’est pas entierement libre. Nous avons choiside travailler sur des estimateurs invariants par translation. L’erreurd’estimation en particulier, qui doit etre une combinaison lineaireautorisee, doit garder cette propriete quelle que soit son implantation : le

1On supposera toujours ces mesures a support borne pour eliminer les problemes

de convergence.

Page 60: g é o Statistique

58 Aide-Memoire de geostatistique lineaire :

caractere autorise d’une mesure ne doit dependre que de sa configuration,pas de son implantation.

Ces remarques trouveront tout leur sens dans la definition des modelesnon stationnaires (FAI-k). Pour le moment, on relevera seulementqu’elles s’appliquent parfaitement a la classe particuliere des mesuresde poids total nul :

λ(dt) telles que

λ(dt) = 0

3. L’ergodicite

3.1. Permanence d’une hypothese de stationnariteLa discussion des modeles locaux a attire notre attention sur un

Chapitre 8,paragraphes 1.2–1.3.

Paragraphe 1.2.

point important : pour pouvoir realiser la Variographie dans desconditions raisonnables, on se ramene toujours a une certaine formede stationnarite, ce qui permet d’identifier a une moyenne spatialeexperimentale toute esperance mathematique du modele — etantnaturellement entendu que ce modele est suppose ergodique.

Tot ou tard, on se ramene a quelque chose de stationnaire : toutesles differences entre les differents modeles de stationnarite tiennent a lanature de ce quelque chose.

Pour simplifier le propos, nous nous limiterons maintenant a unmodele de Fonction Aleatoire Stationnaire d’ordre 2, et au problemede l’estimation de l’esperance mathematique.

3.2. Estimation de l’esperanceLe modele etant suppose stationnaire d’ordre 2, on sait que :

E [Z(x)] = m = constante dans l’espace

et, le modele etant suppose ergodique :

1

[S]

S

Z(x) dx → m lorsque S → ∞

Au niveau pratique, cela signifie que l’on calcule :

m∗ =1

[S]

S

z(x) dx

pour S aussi grand que possible, et que l’on adopte m∗ pourestimateur de m.

Dans la version probabilisee, on a donc :

M∗ =1

[S]

S

Z(x) dx

et il est immediat d’etablir :

E [M∗] = m

Var [M∗] =1

[S]2

σ(h)K(h) dh

ou K(h) est le Covariogramme Geometrique de S et σ(h) est laVoir complementen fin de chapitre.

covariance centree de Z.

Le probleme est qu’il n’est jamais possible en pratique de rendre S aussigrand que possible : nous sommes irremediablement limites par la tailledu Champ. D’ou la question : S est-il assez grand pour assurer unebonne estimation de m ? Ou plus correctement : S est-il assez grandpour assurer a m une signification objective ?

La reponse se fait en deux temps :

• au niveau du modele probabiliste d’abord,

• puis au niveau operatoire.

Page 61: g é o Statistique

[4] – Stationnarite et ergodicite 59

3.3. La portee integraleOn pourrait dire que plus faible est la variance Var [M∗] et meilleur est Terminologie usuelle.

M∗ comme estimateur de m. Mais m est un Parametre Conventionnel E & C, p106.

du modele, et il est plus precis de dire : plus Var [M∗] est faible, plusm presente de signification objective. On peut alors montrer que, pourS assez grand, cette varianceest asymptotiquement egale a :

1

[S]

σ(h) dh

(il faut se souvenir que K(0) = S). Posons alors : Chapitre 2,paragraphe 1.2.

A =1

σ(0)

σ(h) dh

Cette quantite est appelee portee integrale, et a une dimension d’espace(longueur dans R

1, aire dans R2, etc. ). En reportant cette Portee

Integrale dans la formule asymptotique de la variance deM∗, on trouve :

Var [M∗] ∼A

Sσ(0)

Si enfin on pose : N = S/A, c’est-a-dire si on considere que S estconstitue de N paves disjoints A, la formule devient :

Var [M∗] ∼σ(0)

N

c’est-a-dire une formule equivalente a celle de la Statistique classique.Tout se passe donc, dans ce modele, comme si l’estimateur M∗ etait E & C, p105.

obtenu en prenant la moyenne de N variables independantes de varianceσ(0). La portee integrale A represente donc bien l’element de referencevis-a-vis duquel il y a un sens a dire que le champ S est grand. Plusce nombre N = S/A est grand, plus, en effet, la variance de M ∗ −mest petite, et plus, par consequent, le parametre presente de significationobjective. C’est seulement si le champ S est grand vis-a-vis de A quel’on peut dire que l’ergodicite est, en pratique, atteinte.

3.4. Reconstruction operatoireLe probleme de l’ergodicite n’est encore resolu qu’en theorie. Car la E & C, p107.

definition de A fait intervenir le comportement de σ(h) a l’infini ce qui,on le sait, ne correspond a aucune propriete objective du phenomenereel. Il faut donc reconstruire la Portee Integrale en termes operatoires.

Un exercice classique etablit que, pour tout support v suffisamment Fasc. 5, pp107–112.

grand, la valeur moyenne sur v de la fonction de covariance σ vaut : Chapitre 3,paragraphe 3.1.

σ(v, v) =A

v

Alors, pour un support s grand vis-a-vis de A et constituant unepartition de S, la formule de la Variance de Dispersion de s dans S Chapitre 3,

paragraphe 3.4.montre que la Regionale s2(s | S) doit, si le modele est correct, suivreune relation de la forme :

s2(s | S) = A

(

1

s−

1

S

)

Naturellement, le controle effectif de cette relation peut etre delicat,en particulier en ce qui concerne les effectifs disponibles pour le calcul

Page 62: g é o Statistique

60 Aide-Memoire de geostatistique lineaire :

de la Variance de Dispersion Statistique. Mais fondamentalement, cetterelation constitue une loi physique, qui peut etre corroboree ouE & C, p108.

infirmee, et qui permet de donner une definition cette fois operatoire dela portee integrale. Par contre-coup, l’hypothese ergodique sur le modeledevient susceptible d’un controle.

Remarque finale : il existe des modeles theoriques de portee integraleinfinie ; aucun domaine ne saurait alors etre grand par rapport a laportee integrale. Autrement dit, de tels modeles ne permettent jamaisd’atteindre experimentalement l’ergodicite, et sont donc a eviter...

Ce chapitre est avant tout une ouverture vers de futurs developpements :Commentaires

distinction global–local (cf. les estimations), possibilite de stationnaritesmoins strictes (en particulier les FAI-k). Quant a l’ergodicite, son examenest, il est vrai, assez souvent absent des etudes reelles ; peut-etre n’est-cepas toujours une bonne chose. . .

Calcul de la Variance d’Estimation de l’esperance :Complement

Var [M∗] = Var

[

1

[S]

S

Z(x) dx

]

=1

[S]2

S

S

σ(x − y) dx dy

Rappelons que K(h), Covariogramme Geometrique de S, est defini par

K(h) =

S

(x) S

(x+ h) dx

ou la notation S

(x) designe la Fonction Indicatrice de S. L’interetChapitre 2,paragraphe 1.2.

de l’utilisation des Fonctions Indicatrices est de pouvoir remplacer lesintegrales sur le domaine S par des integrales sur tout l’espace, et faciliterde la sorte les changements d’ordre des sommations. Ainsi,

Var [M∗] =1

[S]2

∫ ∫

S

(x) S

(y)σ(x− y) dx dy

(1)=

1

[S]2

∫ ∫

S

(y + h) S

(y)σ(h) dh dy

=1

[S]2

σ(h) dh

S

(y + h) S

(y) dy

(2)=

1

[S]2

σ(h)K(h) dh

(1) : par changement de variable h = x− y.

(2) : par definition du Covariogramme Geometrique K(h).

Page 63: g é o Statistique

Chapitre 5

Buts et moyens de laGeostatistique Lineaire (2)

Presentation

Ce chapitre poursuit la presentation des formules fondamentales deGeostatistique Lineaire, en incluant cette fois dans ses hypothesesle modele intrinseque.

Au premier paragraphe, on definit l’hypothese intrinseque,elargissement de l’hypothese stationnaire, et on etablit lesmecanismes de calcul dans le cadre de cette hypothese.

Le second paragraphe est une simple transcription en modeleintrinseque des formules de Variances d’Extension et deDispersion.

Au troisieme paragraphe, toutes hypotheses confondues, on evoquebrievement le probleme du changement de support, si importanten Geostatistique Non Lineaire.

1. Mecanismes de calcul en hypothese intrinseque

1.1. Le modele intrinsequeOn a vu precedemment qu’une methode, pour elargir la notion de Chapitre 3,

paragraphe 2.2.stationnarite, consiste a formuler la propriete de stationnarite d’ordre 2au niveau non pas de la Fonction Aleatoire elle-meme, mais d’un sous-ensemble de l’ensemble des combinaisons lineaires formees sur cetteFonction Aleatoire.

Ainsi, nous definirons une Fonction Aleatoire Intrinseque comme En abrege : FAI.

etant une Fonction Aleatoire dont les accroissements sont stationnairesd’ordre 2. Autrement dit, pour deux points quelconques, l’accroissementZ(x) − Z(y) admet des moments d’ordres 1 et 2, et ces moments sont Fasc. 5, p53.

stationnaires :

E [Z(x) − Z(y)] = E [Z(x+ x0) − Z(y + x0)]

Var [Z(x) − Z(y)] = Var [Z(x+ x0) − Z(y + x0)]

pour tout x0. Ces moments ne sont donc fonctions que de l’argument :h = (x− y).

Pour le moment d’ordre 1, on a donc m(h) = E [Z(x+ h) − Z(x)],∀x. Ainsi, pour x = u :

m(h) = E [Z(u+ h) − Z(u)]

et, pour x = u+ h :

m(h′) = E [Z(u+ h+ h′) − Z(u+ h)]

Page 64: g é o Statistique

62 Aide-Memoire de geostatistique lineaire :

d’ou, par sommation et linearite de l’esperance :

m(h) +m(h′) = E [Z(u+ h+ h′) − Z(u)] = m(h+ h′)

Notons que, dans le modele probabiliste, ces manipulations ne sontlicites que parce qu’elles portent sur des accroissements ; en revanche,il ne figure dans le modele plus aucune hypothese d’existence en cequi concerne l’esperance — et a fortiori la variance — des valeursponctuelles.

La fonction m(h) est appelee la derive de la Fonction Aleatoireintrinseque. De la relation :

m(h+ h′) = m(h) +m(h′)

il resulte immediatement que la derive est une fonction lineaire de h.En fait, dans la suite de l’expose, nous n’examinerons que des FonctionsAleatoires Intrinseques sans derive, c’est-a-dire telles que m(h) = 0.Cette restriction, qui simplifie beaucoup les manipulations, apparaıtrad’ailleurs comme peu contraignante lorsque la notion de proprieteintrinseque sera a son tour elargie. En revanche, il s’agit d’une hypothesea laquelle il est possible, dans les conditions usuelles, de donner unesignification objective, et qui donc pourra etre corroboree ou infirmeeChapitre 4,

paragraphe 3.2.au cours de chaque Analyse Variographique.

Quant au moment d’ordre 2, il permet d’introduire la fonctionstructurale γ, definie par la relation :

γ(h) =1

2Var [Z(x+ h) − Z(x)]

Cette fonction est appelee demi-variogramme deZ, l’usage apparaissantetre de negliger le prefixe demi. Compte-tenu de l’hypothesed’absence de derive, le variogramme peut aussi s’ecrire :

γ(h) =1

2E[

(Z(x+ h) − Z(x))2]

ce qui permet le recours au processus desormais classique de

Concernant le facteur 2,il n’y a pour ainsi dire

jamais risque de confusion.

Reconstruction Operatoire.

1.2. Combinaisons lineaires autoriseesAu point de vue des mecanismes de calculs, la grande nouveaute est qu’ilexiste dans ce modele des combinaisons lineaires dont l’esperance, et aI I I

fortiori la variance, n’a pas de sens.

C’est l’occasion de rappeler ici la definition des Combinaisons LineairesChapitre 3,paragraphe 2.1.

Autorisees : une CLA est toute combinaison lineaire admettantesperance et variance dans le modele. Il resulte alors immediatement deshypotheses que les combinaisons lineaires finies d’accroissements sontdes CLA ; par extension, il en est de meme des combinaisons lineairesd’accroissements a support borne.

Mais une combinaison d’accroissements : λi (Z(xi) − Z(yi)) est aussiune combinaison de valeurs ponctuelles, avec la particularite que lasomme des ponderateurs y est nulle. Ainsi, toute CLA peut s’ecrire :λi Zi, avec

i λi = 0.

Reciproquement, soit une combinaison lineaire de poids total nul :∑

i λi = 0. Alors, la somme λi Zi peut aussi s’ecrire : λi (Zi − Z0) ou

Z0 est la valeur Z(x0) en un point fixe arbitrairement. La combinaisonlineaire peut s’ecrire comme combinaison d’accroissements : elle est doncune CLA.

Page 65: g é o Statistique

[5] – Buts et moyens de la Geostatistique Lineaire (2) 63

On dispose donc d’une nouvelle definition de l’autorisation dans le cadredu modele intrinseque :

Dans le cadre de l’hypothese intrinseque,une CLA est une combinaison lineaire depoids total egal a 0.

Cette nouvelle definition prouve que les CLA du modele intrinseque

J J J

constituent un sous-ensemble strict des CLA du modele stationnaired’ordre 2. Par dualite, on etablit qu’une Fonction Aleatoire Stationnaired’ordre 2 est a fortiori intrinseque : l’ensemble des Fonctions AleatoiresStationnaires d’ordre 2 est un sous-ensemble de l’ensemble des FonctionsAleatoires intrinseques. On appellera alors strictement intrinseque uneFonction Aleatoire intrinseque, mais non stationnaire d’ordre 2.

1.3. Mecanismes de calculLe probleme est maintenant de donner explicitement les expressions desdeux premiers moments des CLA.

En ce qui concerne le moment d’ordre 1, rappelons que toute CLA estcombinaison d’accroissements, et que, dans le modele d’une FonctionAleatoire intrinseque sans derive, un accroissement est d’esperance nulle.Finalement :

L’esperance mathematique de toute CLAd’une Fonction Aleatoire Intrinseque sansderive est nulle.

Ce resultat nous permettra ulterieurement de confondre variance et

J J J

esperance du carre au niveau des CLA, ce qui sera evidemment decisifpour la signification physique de l’inference du variogramme.

La construction du moment d’ordre 2 d’une CLA necessite unintermediaire de calcul, afin de se ramener au formalisme deja connu. Chapitre 3,

paragraphe 2.2.Nous presenterons ici le variogramme de Z sous la forme generale :

γxy =1

2Var [Z(x) − Z(y)]

et, x0 etant un point arbitraire, nous posons :

Y (x) = Z(x) − Z(x0)

Etant une CLA, Y (x) admet une covariance (qui d’ailleurs se trouve nepas etre stationnaire) : Rappelons que la

stationnarite estimportante pourl’inference statistiqueet la ReconstructionOperatoire, mais queles developpementstheoriques comme ici merequierent que l’existencede la covariance.

Cxy = Cov [Y (x), Y (y)]

Exprimons Cxy en fonction de γxy. Pour cela, on peut ecriresuccessivement :

γxy =1

2Var [Z(x) − Z(y)]

=1

2Var [Z(x) − Z(x0) − Z(y) + Z(x0)]

=1

2Var [Y (x) − Y (y)]

Page 66: g é o Statistique

64 Aide-Memoire de geostatistique lineaire :

Cette derniere expression s’applique a une Fonction Aleatoire (Y ) quien l’occurrence admet une covariance Cxy. Elle peut donc se developpersuivant le mecanisme habituel, d’ou finalement :

γxy =1

2[Cxx + Cyy − 2Cxy]

ou encore :

Cxy =1

2Cxx +

1

2Cyy − γxy

Soit maintenant a calculer la variance d’une CLA sur Z :

Chapitre 3,paragraphe 2.2.

Var[

λi Zi

]

avec∑

i

λi = 0

On a λi Zi = λi Yi, puisque la condition d’autorisation filtre les Z(x0),et on est donc classiquement ramene a un calcul de variance lorsqu’unecovariance existe. Ainsi :

Var[

λi Zi

]

= Var[

λi Yi

]

= λi Cij λj

=1

2

i,j

λiλj Cii +1

2

i,j

λiλj Cjj − λi γij λj

Mais les deux premieres sommes doubles sont nulles, du fait de lacondition d’autorisation

i λi = 0, et finalement :

Var[

λi Zi

]

= −λi γij λj

On peut ainsi fixer une fois pour toutes une regle de calcul :

En modele intrinseque, la variance d’une CLAs’obtient en developpant une forme quadratiqueCOMME SI il existait une covariance C, mais eny remplacant C par −γ.

Cette regle de substitution est extremement utile. Elle permet un calcul

I I I

tres rapide des variances de CLA :

• on verifie d’abord si l’expression concernee est autorisee ;

• si oui, on calcule alors sa variance selon la regle ci-dessus.

Remarque importante : il est capital de noter que cette regle de calculn’est qu’un court-circuit algorithmique. Nous pouvons remplacer Cpar −γ dans l’expression d’un resultat etabli dans le cadre stationnaire :cela etablira (demontrera) la version de ce resultat dans le cadreintrinseque. Mais nous n’avons pas le droit de nous arreter a desexpressions intermediaires, parce qu’elles risquent de ne pas etre definiesdans le modele.

Par exemple, NOUS N’AVONS PAS LE DROIT d’ecrire :I I I

Var [Zx − Zy] = Var [Zx] + Var [Zy] − 2 Cov [Zx, Zy]

parce que le membre de droite n’a pas de sens dans le modele.

Page 67: g é o Statistique

[5] – Buts et moyens de la Geostatistique Lineaire (2) 65

Par ailleurs, notons ici encore que l’hypothese de stationnarite des CLAn’est pas sollicitee dans l’etablissement de cette regle de calcul : c’estseulement l’existence d’un moment d’ordre 2 qui doit etre garantie.Autrement dit, l’expression :

Var[

λi Zi

]

= −λi γij λj (avec

λi = 0)

demeure valable avec un variogramme non stationnaire.

1.4. Proprietes du variogramme stationnaireNous enumerons simplement ici quelques proprietes classiques duvariogramme stationnaire γ(h) :

• γ(h) ≥ 0 et γ(0) = 0

• Symetrie : γ(h) = γ(−h)

• La fonction −γ est de type positif conditionnel, c’est-a-dire que pour

Chapitre 3,paragraphe 2.1.

Naturellement, la questionde l’ajustement d’unmodele de variogrammenon stationnairedemeure entiere !

Fasc. 5, p54.

toute mesure λ verifiant∫

λ(dt) = 0,

λ(dt) [−γ(t− u)] λ(du) ≥ 0

• Pour tout t > 0, e−tγ est une covariance.

• Cette fois encore, de facon sans doute meme plus intuitive quedans le modele stationnaire, le comportement a l’origine de la fonctionstructurale (γ en l’occurrence) traduit le caractere de regularite de laFonction Aleatoire.

• On montre aussi que le rapport γ(h)/ |h |2 reste borne pour h tendantvers l’infini. C’est la d’ailleurs une possibilite de controle de l’hypothesesur l’absence de derive puisque, si la Fonction Aleatoire est sans derive,on doit avoir :

limh→∞

γ(h)

|h |2= 0

• Enfin, si γ(h) est borne pour h → ∞, la Fonction Aleatoire est enrealite stationnaire d’ordre 2, et il existe donc une covariance stationnaireC(h). Classiquement alors :

γ(h) = C(0) − C(h)

C(h) = γ(∞) − γ(h) (si γ admet une asymptote)

2. Formules des variancesLes formules etablies pour les Variances d’Extension et de Dispersiondans le cadre de l’hypothese stationnaire peuvent bien sur etrereconstruites directement sans difficulte. Mais c’est la une premiereoccasion d’appliquer la regle de calcul : des que l’on est assure que Paragraphe 1.3.

l’expression etudiee est bien une CLA, il suffit de remplacer C par −γpour avoir la nouvelle formulation en hypothese intrinseque.

2.1. Variance d’ExtensionRevenons a la definition des moyennes spatiales Z(v) et Z(v′). Chacunede ces expressions est une combinaison lineaire de Z, de poids total egala 1. L’Erreur d’Estimation Z(v) − Z(v′) est ainsi de poids total nul :c’est donc une CLA. La Variance d’Extension σ2

E(v, v′) existe donc Chapitre 3,paragraphe 3.2.dans le modele (c’est-a-dire : est finie).

Page 68: g é o Statistique

66 Aide-Memoire de geostatistique lineaire :

Il suffit alors d’appliquer la regle pour obtenir :

σ2E(v, v′) = 2γ(v, v′) − γ(v, v) − γ(v′, v′)

Une curiosite : dans le cas ou v et v′ se reduisent respectivement auxpoints x et x+ h, γ(v, v) et γ(v′, v′) sont alors nuls — puisqueγ(0) = 0 — et la formule se simplifie en :

σ2E(v, v′) = 2γ(v, v′)

qui est une version elargie de la relation :

σ2E(v, v′) = 2C(0) − 2C(h)

deja vue dans le cas stationnaire :

Le variogramme γ(h) est egal a la demi variance d’extensiond’un point x quelconque au point x+ h.

Tous les calculs developpes ulterieurement se ramenent a des

Chapitre 3,paragraphe 3.3.

manipulations de cette Variance d’Extension elementaire.

2.2. Variance de Dispersion

Reprenons la construction effectuee dans le cas stationnaire. LesChapitre 3,paragraphe 4.1.

(

Zi − Z)

sont des CLA ; la version probabilisee S2(v | V ) de laDispersion Statistique de v dans V :

S2(v | V ) =1

N

i

(

Zi − Z)2

est ainsi une somme de carres de CLA. Elle admet donc une esperance.

Il suffit alors, dans l’expression de σ2(v | V ) correspondant au casstationnaire, d’appliquer la regle de calcul (remplacer C par −γ) pourobtenir :

σ2(v | V ) = γ(V, V ) − γ(v, v)

Si en particulier l’ensemble v se reduit a un point o, γ(v, v) = 0 :

σ2(o | V ) = γ(V, V )

2.3. Autre presentation du variogramme

Le role essentiel du variogramme est de permettre le calcul des variancesUn sujet de reflexionpour l’instant de peu de

consequence, mais quiprendra tout son sens

dans le cadre des FAI-k.

de Combinaisons Lineaires Autorisees. On pourrait alors en proposer unedefinition purement operationnelle, en disant :

I I ILe variogramme est une fonction γ telle que, si

i λi = 0 :

Var[

λi Zi

]

= −λi γij λj

Page 69: g é o Statistique

[5] – Buts et moyens de la Geostatistique Lineaire (2) 67

Bien sur, avec une telle definition, il faudrait d’abord s’assurer del’existence d’une telle fonction : de fait, il y a un theoreme d’existence,qui sera presente (sans demonstration) ulterieurement dans le cadred’hypotheses plus larges.

Mais ce qui est interessant ici, c’est de remarquer que cette definitionn’est pas univoque : elle ne caracterise pas le variogramme. Si eneffet on rajoute une constante a la fonction γ figurant dans la formule,cette constante sera filtree par la condition d’autorisation : pour touteconstante A,

−λi γij λj = −λi (γij +A) λj

et donc γ + A est encore un modele admissible de variogramme pourle calcul de Var

[

λi Zi

]

(avec toujours :∑

i λi = 0). Cette nouvelle

definition ne fournit le variogramme qu’a une constante additive pres.Un theoreme etablit qu’il s’agit la de l’indetermination maximum : sideux fonctions γ et γ′, de type negatif conditionnel, sont telles que :

λi γij λj = λi γ′ij λ

j

pour toute CLA λ, alors γ′ est de la forme γ +A.

Autrement dit, la fonction structurale definie par :

Cas particulier dutheoreme d’existence etd’unicite des CovariancesGeneralisees, voirannexe du Chapitre 8.

γ(h) =1

2Var [Z(x+ h) − Z(x)]

se revele, finalement, trop specifiee— ou, plus exactement, sa definitionest trop restrictive. Naturellement, dans la mesure ou cette definitionpermet a la fois une Analyse Variographique en contact etroit avec lesdonnees et un developpement theorique des calculs, il serait superfluvoire absurde de s’embarrasser d’une indetermination qui n’apporte rienen pratique. Pourtant, cette situation s’inversera lorsque l’on elargira leshypotheses de stationnarite. Il sera bon alors de se rememorer que, desl’hypothese intrinseque, le variogramme requis par les calculs theoriquesn’est pas une fonction, mais seulement une classe d’equivalence defonctions : deux fonctions etant ici equivalentes si elles different d’uneconstante quelconque.

3. Regularisations

3.1. Resultats generauxNous voulons ici seulement evoquer, en parallele avec ce qui a ete fait Chapitre 2,

paragraphe 1.5.en Geostatistique Transitive, le probleme de la regularisation.

Ce probleme a deja ete implicitement aborde lors de la presentation dela Variance d’Extension puisque, en toute generalite, la valeur moyenne :

Z(v) =1

[v]

v

Z(x) dx

est deja une regularisee de Z sur v. Sous sa forme la plus generale, uneregularisee pourra s’ecrire :

Zp(x) =

Z(x+ t) p(dt)

ou p(dt) est une mesure que l’on supposera de masse totale unite1 :

p(dt) = 1

1Cette contrainte n’est en rien restrictive sur la signification des resultats. Elle vise

simplement a eviter dans les formules la presence de coefficients de normation.

Page 70: g é o Statistique

68 Aide-Memoire de geostatistique lineaire :

En toute rigueur (et contrairement au cas transitif), ces integralesdemandent une definition precise. Il s’agit la d’integrales stochastiques :Zp(x) ou Z(v) sont des Fonctions Aleatoires, dont il faut controlerl’existence. Un theoreme enonce, (dans le cas stationnaire d’ordre 2)que Zp(x) existe si et seulement si :

∫ ∫

p(dx)Cxy p(dy) < ∞

La presentation traditionnelle de la regularisation commence dans le

Matheron 1965, p119-120.

cadre stationnaire d’ordre 2 : il est facile d’etablir que Zp(x) est elle-Fasc. 5, p61-62.

meme stationnaire d’ordre 2, et que sa covariance Cp(h) se deduit deC(h) par :

Cp(h) =

∫ ∫

C(h+ x− y) p(dx) p(dy)

Il est interessant de rapprocher cette formule de son equivalent transitif.Comme en transitif, il existe des formules de regularisation ou de monteeFasc. 5, p63-64.

faisant correspondre terme a terme les developpements a l’origine deC etCp. On peut ensuite exprimer ces formules de regularisation en fonctiondu variogramme γ(h), c’est-a-dire en fonction de C(0) − C(h).

Enfin, on peut montrer que les formules obtenues demeurent validesmeme dans le cas ou il n’existe pas de covariance, c’est-a-dire enhypothese intrinseque stricte.

3.2. Formule de changement de support

Dans le present expose, nous voudrions seulement mentionnerque le formalisme des Variances d’Extension permet d’exprimersynthetiquement la regularisation. Pour ne pas encombrer les notationsavec une fonction de ponderation, nous nous bornerons au probleme duchangement de support, c’est-a-dire a l’etude de la structure de Z(v).

Soit donc v un support quelconque, et vx son translate d’un vecteur x :

Z(vx) =1

[v]

v

Z(x+ t) dt

En tant que Fonction Aleatoire de x, Z(vx) est stationnaire ouintrinseque selon que Z est stationnaire ou intrinseque. Dans l’hypothesela plus generale, son variogramme :

γv(h) =1

2Var[

Z(vx+h) − Z(vx)]

n’est autre que la demi-Variance d’Extension de Z(vx+h) a Z(vx).Ainsi, γ etant le variogramme stationnaire de Z :

2γv(h) = 2γ(vx, vx+h) − γ(vx, vx) − γ(vx+h, vx+h)

D’apres la stationnarite de γ,

• les deux derniers termes sont egaux,

• et γ(vx, vx+h) ne depend pas de x.

Page 71: g é o Statistique

[5] – Buts et moyens de la Geostatistique Lineaire (2) 69

Ainsi :

γv(h) = γ(v0, vh) − γ(v0, v0)

Cette expression fait apparaıtre un terme constant en h, γ(v0, v0), qui

assure que γv(0) sera bien nul. A ce terme pres qui, on l’a vu, n’influe passur les calculs de variances, l’etude analytique du variogramme moyenγ(v0, vh) permet d’etablir les formules de correspondance.

Dans l’hypothese stationnaire d’ordre 2, si l’on note Cv(h) la covariancestationnaire de Zv , la relation est encore plus simple :

Cv(h) = C(v0, vh)

Le passage de l’hypothese stationnaire a l’hypothese intrinseque nesemble pas presenter de difficulte. Il est, du reste, tres largement entredans les habitudes des praticiens de la Geostatistique, et on utilise bienplus frequemment le variogramme que la covariance. Cette demarchecependant merite une certaine attention, dans la mesure ou elle pourraulterieurement etre generalisee. Lors de la presentation des modelesnon stationnaires au chapitre 8, on pourra utilement se souvenir que,fondamentalement, le passage de C a −γ contenait deja en puissancetoutes les difficultes des FAI-k, c’est-a-dire plus precisement tous lesmecanismes d’indetermination.

Paragraphe 6.3.

Fasc. 5, pp63–64

Commentaires

Page 72: g é o Statistique

70 Aide-Memoire de geostatistique lineaire :

Page 73: g é o Statistique

Chapitre 6

Estimations

Presentation

Le premier propos de ce chapitre est de definir ce que nousentendons par estimation, puis par la suite d’en mettre enplace les mecanismes.

Au premier paragraphe donc, on rappelle la definition adopteepour estimation, et on examine en quoi divergent alors lesapproches globale et locale.

Consacre a l’estimation globale, le second paragraphe estextremement succinct, et cherche surtout a orienter le lecteur versla bibliographie.

Le troisieme paragraphe presente l’estimation locale, pluscouramment appelee krigeage. L’idee directrice est qu’il n’existepas une panoplie de krigeages epars, mais une seule optique qui, enfonction des hypotheses de travail, peut conduire a des formalismesmathematiques quelque peu differents, mais homogenes quant aleur signification.

1. Alternative global/local en estimation

1.1. Qu’appelons-nous estimation ?Rappelons la definition que nous avons adoptee precedemment : une Chapitre 1,

paragraphe 4.1.estimation porte sur des grandeurs objectives, c’est-a-dire sur desquantites qui existent independamment de nos choix (arbitraires)methodologiques. L’estimation est requise pour pallier une lacuned’information : si la totalite de la Variable Regionalisee etaitconnue, l’estimation n’aurait plus de raison d’etre, puisqu’elle pourraitavantageusement etre remplacee par une mesure.

Il n’est d’ailleurs pas necessaire d’envisager une situation aussi utopique.Apres tout, rien ne nous interdit de chercher a estimer une quantiteque nous connaissons experimentalement : il s’agit la d’une demarche Voir notion de

non biais,paragraphe 3.2.4.peu pertinente au plan de l’interet pratique, mais qui pourra se reveler

ulterieurement instructive.

En tout cas, il apparaıt clairement que le mot estimation telque nous l’utilisons n’a pas la meme acception qu’en Statistiques.Schematiquement, on pourrait dire que le Statisticien estime desparametres de son modele — ce que nous avons appele des ParametresConventionnels. Dans le vocabulaire statistique classique, ce que nousappelons estimation serait plutot designe par prediction.

Il ne s’agit evidemment pas de se singulariser a tout prix. Mais ceterme de prediction sous-entend peut-etre trop une notion d’ordre, desequence : un vocabulaire convenant aux series chronologiques auraitpeut etre paru moins bien adapte aux variables se deployant dansun espace geographique a plusieurs dimensions. On peut supposerque, forgee initialement dans un contexte minier, la terminologiegeostatistique a ete influencee par une interpretation economique : il

Page 74: g é o Statistique

72 Aide-Memoire de geostatistique lineaire :

est clair en effet que estimer un gisement sonne plus naturellementque prevoir un gisement. . . L’essentiel, comme toujours, est de s’entenir a une definition sans ambiguıte et, en l’occurrence, il ne noussemble d’aucun interet de remettre en cause un vocabulaire enterinepar la pratique.

1.2. Estimation globale, estimation locale

Il reste, avant tout developpement technique, a voir comment semanifeste au moment de l’estimation la difference entre les points devue global et local.

Rappelons d’abord qu’un probleme global s’interesse a la totalite duChapitre 4,paragraphe 1.1.

Champ etudie, et utilise toutes les donnees disponibles. On peut direun peu rapidement, s’agissant d’une estimation, que c’est une phase dedegrossissage. Si de surcroıt les donnees sont tres nombreuses, on nepeut guere envisager de leur faire subir des traitements sophistiques quideviendraient vite exorbitants.

Aussi, en Geostatistique Lineaire, une estimation globale consiste aproposer une formule a priori , en general tres simple, de l’estimateur ;pour fixer les idees, cet estimateur a priori sera souvent simplement lamoyenne arithmetique des echantillons. L’apport de la Geostatistiqueconsiste, compte-tenu du modele propose, a calculer de facon exacte ouapprochee la variance associee a cet estimateur.

A l’oppose, une estimation locale est une entreprise plus minutieuse,qui veut tenir compte des particularites de chaque voisinage glissant(densite, disposition de l’information). Cette fois, on n’impose plus uneexpression a priori pour l’estimateur. Au contraire, dans une familled’estimateurs possibles (dans le present expose, parmi des estimateurslineaires), on va chercher a construire un estimateur qui presente aumieux de bonnes proprietes : il y a cette fois demarche d’optimisation,et ce mecanisme caracterise ce que nous appelons le krigeage. Cetteprocedure sera repetee de proche en proche sur tout Voisinage Glissant.

2. L’estimation globaleNous n’examinerons — brievement — dans ce paragraphe quel’estimation de la valeur moyenne de la Variable Regionalisee par lamoyenne arithmetique simple de la totalite des echantillons disponibles.Les differences d’approches que nous proposons ici tiennent auxhypotheses faites sur le mode d’echantillonnage. Autrement dit, lacontribution de la Geostatistique consiste ici a prendre en comptela structure spatiale de l’information afin d’attribuer une Varianced’Estimation a la plus simple des statistiques qui soit. Dans le memetemps naturellement, on supposera modelisee la structure spatiale de laVariable Regionalisee : on suppose que l’Analyse Variographique a eterealisee dans les regles de l’art, et que l’on dispose d’un modele structural(covariance ou variogramme).

Nous n’envisagerons pas ici le detail ni le deroulement complet des calculsFasc. 5, p70-96.

d’Estimation Globale : nous renvoyons pour plus de developpementsMatheron, 1962.

a la bibliographie. Nous remarquerons seulement que c’est un desdomaines de la Geostatistique ou les progres informatiques ont ete lesMatheron, 1965,

pp195-214.plus decisifs : il n’est plus guere interessant d’avoir recours a des abaquesou des fonctions prealablement tabulees, lorsque les moyens de calculpermettent un calcul effectif au cas par cas.

Notons enfin que les cas de figures proposes ci-dessous ont pour butprincipal de susciter la reflexion du lecteur, dans une perspectivepratique. Car, au plan theorique, il n’y a ici aucune nouveaute : lesvariances d’estimation que nous nous proposons d’expliciter maintenants’expriment toutes a l’aide de l’expression generale :

Page 75: g é o Statistique

[6] – Estimations 73

σ2E =

1

[v]2

v

v

C(x− y) dx dy +1

N2

i

j

C(xi − xj)

−2

N [v]

v

i

C(xi − y) dy

ou plus synthetiquement encore par la formule :

σ2E = C(v, v) + C(v′, v′) − 2C(v, v′)

ou bien sur par les formules equivalentes exprimees en termes devariogrammes. Les commentaires du Chapitre 3, §3.3 demeurentevidemment valides.

Chapitre 3,paragraphe 3.2.

2.1. Echantillonnage aleatoire purDans ce modele, nous supposons que les donnees sont implantees auhasard, independamment les unes des autres, et uniformement dans le Matheron, 1965, p211.

champ V a estimer. On cherche donc a estimer :

ZV =1

V

V

Z(x) dx

par la moyenne :1

N

i

Z(xi)

ou les xi sont eux-memes consideres comme Realisations de variablesaleatoires Xi , independantes et uniformes dans V . La Varianced’Estimation se deduit donc immediatement de la formule generale (oude son equivalent en variogramme) :

σ2E =

E

1

[v]2

v

v

C(x− y) dx dy +1

N2

i,j

C(Xi −Xj) −2

N [v]

v

i

C(Xi − y) dy

ou l’esperance est prise sur l’ensemble des Xi.

Il ne s’agit la que de calcul peu difficile, et peu instructif. On peut aussi J J J

revenir a la definition de la Variance d’Estimation, a savoir

σ2E = Var

[

1

N

i

(Z(Xi) − ZV )

]

ou, dans le present modele, a la fois la fonction Z et les implantationsXi sont aleatoires. Cette formule peut encore se mettre sous la formeun peu plus pratique :

σ2E =

1

N2Var

[

i

(Z(Xi) − ZV )

]

ou les expressions sous le signe de sommation sont des erreurs partielles.

Calculons maintenant cette expression, par le moyen de la formulede l’esperance totale. Et d’abord, observons que, dans l’hypothese Voir tout cours

de Probabilites.stationnaire comme dans l’hypothese intrinseque sans derive, les erreurs

Page 76: g é o Statistique

74 Aide-Memoire de geostatistique lineaire :

partielles sont d’esperance nulle : leur variance s’identifie donc al’esperance de leur carre. Ainsi :

σ2E =

1

N2E

(

i

(Z(Xi) − ZV )

)2

et, par l’esperance conditionnelle :

σ2E =

1

N2E

E

(

i

(Z(Xi) − ZV )

)2

| Z

A Realisation fixee de la Fonction Aleatoire, la Variance d’EstimationI I I

Un des interets detravailler sans derive.

— il s’agit donc en l’occurrence d’une variance conditionnelle — s’ecrit :Une notation intuitive,mais qui prend trop

de liberte avec larigueur mathematique !

σ2E(• | Z = z) =

1

N2E

(

i

(z(Xi) − zV )

)2

formule deduite de la precedente en remplacant formellement la fonctionaleatoire Z par la variable regionalisee z. Mais alors, toujours aRealisation fixee, la seule composante qui demeure aleatoire dans lemodele est l’implantation Xi des echantillons. Or, par hypothese, lesXi sont independantes. Donc, les erreurs partielles a Realisation fixeesont independantes, et :

σ2E(• | Z = z) =

1

N2

i

E[

(z(Xi) − zV )2]

(les termes croises sont nuls, comme covariances de variables aleatoiresindependantes).

Tenant compte maintenant de l’uniformite de la loi de Xi dans V , onvoit que

E[

(z(Xi) − zV )2]

n’est autre que :1

V

v

(z(x) − zV )2dx

c’est-a-dire la Variance Statistique de z(x) dans V , soit avec lesChapitre 3,paragraphe 4.1.

notations habituelles :s2(o | V )

Donc :

σ2E(• | Z = z) =

1

N2

i

s2(o | V ) =1

Ns2(o | V )

Il ne reste plus, pour avoir σ2E , qu’a deconditionner cette expression par

rapport a Z (c’est-a-dire par rapport a la Realisation) d’ou, avec lesnotations du Chapitre 3, §4.2–4.3 :

σ2E =

1

NE[

S2(o | V )]

=1

Nσ2(o | V )

Telle est l’expression, tres simple, que l’on aurait pu obtenir en partantdirectement de la formule generale de la Variance d’Estimation.

Page 77: g é o Statistique

[6] – Estimations 75

Remarque : il sera interessant d’examiner cette formule en larapprochant des resultats de la Statistique classique. On retrouve bienune variance globale qui decroıt en 1/N . En revanche, le numerateur del’expression n’est pas la variance a priori du modele : c’est une quantitequi depend aussi du domaine a estimer, et qui ne coıncidera avec lavariance a priori du modele que dans le cas particulier d’un effet depepite pur.

2.2. Echantillonnage aleatoire stratifie

Dans ce nouveau modele d’echantillonnage, on suppose cette fois quele domaine V a estimer est compose de N sous-domaines vi, tousidentiques a un volume v, et constituant une partition de V . A l’interieurde chaque sous-domaine vi, on preleve un echantillon et un seul,uniformement dans vi, et independamment des autres prelevements.

La demarche est la meme que precedemment : on commence le calcul Fasc. 5, p70-71.

de la Variance d’Estimation globale a Realisation fixee (c’est-a-dire : auniveau de la Variable Regionalisee), puis on deconditionne par rapporta la Realisation : on passe au niveau de la Fonction Aleatoire.

Le resultat est cette fois : Fasc. 5, p71.

σ2E =

1

Nσ2(0 | v)

On peut, a titre de reflexion, noter que l’echantillonnage aleatoire J J J

stratifie conduit toujours a une Variance d’Estimation inferieure acelle de l’echantillonnage aleatoire pur, puisque, d’apres la relationd’additivite : Chapitre 3,

paragraphe 4.5.

1

Nσ2(0 | v) −

1

Nσ2(0 | V ) = −

1

Nσ2(v | V ) ≤ 0

On notera egalement que l’hypothese d’une partition de V par les vi estici absolument essentielle.

2.3. Remarque sur la geometrie

Les formules ci-dessus sont proposees a geometrie connue : le domaineV est suppose correctement circonscrit par un procede quelconque.

Cette hypothese n’est pas toujours admissible, tant s’en faut. En realite, J J J

un Champ est souvent delimite par reference aux valeurs prises parla Variable Regionalisee. Celle-ci etant echantillonnee, c’est dire que lageometrie du Champ est elle-meme sujette a erreur, et donc qu’elle doitintervenir dans le calcul d’une Variance d’Estimation realiste.

Cette difficulte ne sera pas examinee ici : nous renvoyons pour cela a labibliographie, et en particulier a [Matheron, 1965], ou est detaillee Matheron, 1965, pp89-

92 ; pp98-100 ; p213.l’etude de la relation entre une variable et son Champ. Deux ideesseulement seront soulignees :

• d’une part, l’erreur d’origine geometrique (effet de bord) serevele le plus souvent preponderante dans le calcul d’une Varianced’Estimation globale ;

• d’autre part, au niveau methodologique, il est souvent necessairede revenir au formalisme de la Geostatistique Transitive pour toutequestion mettant en jeu des problemes de geometrie. Le formalismedevient alors tres complique si l’echantillonnage n’est pas regulier.

Page 78: g é o Statistique

76 Aide-Memoire de geostatistique lineaire :

2.4. Maille reguliere a implantation preferentielleNous supposerons maintenant que le volume V a estimer est constituepar la reunion de volumes vi tous egaux, constituant une partition deV . Au centre de chacun de ces volumes vi, on dispose d’un echantillonponctuel. On se trouve donc de nouveau pour l’instant dans un problemea geometrie fixee.

Cette fois encore, la formule generale de la Variance d’Estimation estpar elle-meme la reponse au probleme du calcul de la variance del’estimation globale. La question, purement pratique, est de trouver dessimplifications a cette expression qui devient inextricable a calculer siles donnees sont trop nombreuses ou la geometrie trop tourmentee.

De nouveau, nous ne rentrerons pas dans les details techniques, quid’ailleurs peuvent varier selon le nombre de dimensions de l’espacede travail. Mais la demarche est constante : on cherche a decomposerl’Erreur d’Estimation globale en erreurs elementaires dont on il seraraisonnable de supposer qu’elles sont non (ou tres faiblement) correlees.On arrive ainsi a un principe de composition des termes de la varianceMatheron, 1965,

pp196-199.globale, c’est-a-dire que celle-ci apparaıt comme somme de differentescontributions, comme par exemple :

• variance de l’erreur commise en estimant un volume elementaire par

Chapitre 3,paragraphe 3.4.

son echantillon central. On en deduit la variance de l’erreur commiseen estimant une ligne (un sondage par exemple) par la moyennedes echantillons qu’elle contient. Cette contribution est usuellementappelee terme de ligne ;

• variance de l’erreur commise en estimant un plan par la moyenne

Fasc. 5,paragraphe 2.5.2.

ponderee des lignes (supposees connues) qu’il contient : c’est leterme de section ;

• variance de l’erreur commise en estimant le Champ tout entier parla moyenne ponderee de ses sections : c’est le terme de tranche.

Les calculs effectifs font intervenir de facon systematique les memesexpressions de variogrammes (ou covariances) regularises sur desvolumes geometriquement simples. On peut ainsi avantageusements’aider d’abaques ou de tabulations ( fonctions auxiliaires), et menerainsi rapidement a bien les calculs numeriques. Mais le vrai problemen’est pas la.

La vraie difficulte tient a la validite du principe de composition : ceprincipe n’est nullement un theoreme, et il est capital de s’assurer, avantd’entreprendre effectivement un calcul, si ce principe est compatibleavec le modele adopte et la structure des echantillons disponibles. Cetteapproche critique est essentielle, si l’on ne veut pas courir le risque dese heurter a des paradoxes apparents : il existe ainsi bien des facons dedecrire un volume donne, reconnu par une maille reguliere, comme unehierarchie de lignes, sections et tranches, et il n’y a pas de raison que desdescriptions differentes conduisent a la meme evaluation (approchee) dela variance globale. Il nous semble utile, une fois de plus, d’insister ace propos sur le caractere physique de la demarche du Geostatisticien,qui ne doit jamais oublier que les resultats qu’il a elabores sont toujoursrelatifs a un jeu bien precis de conditions experimentales. Le plus sageest donc d’inviter le lecteur a s’attaquer par lui-meme a des exercicesinstructifs, en particulier les trois exercices du Fascicule 5 consacresaux grandes mailles(mailles superieures a la portee) : le test decisifFasc. 5, p107-112.

n’est pas de mener a bien les calculs en eux-memes, mais bien de savoirtirer un enseignement positif de resultats apparemment contradictoires.

2.5. Maille reguliere a implantation flottanteMeme si les calculs ont ete menes a bien dans les regles de l’art, il restea donner une signification objective a la variance globale ainsi obtenue.Nous rejoignons ici une reflexion deja abordee lors de l’introduction de

Page 79: g é o Statistique

[6] – Estimations 77

l’hypothese stationnaire. La reponse est, dans les grandes lignes, quepour donner une signification a cette variance, il faut probabiliserle reseau d’information, c’est-a-dire considerer qu’il a ete implante auhasard uniformement sur le phenomene etudie.

Mais ainsi, ipso facto, cela signifie que l’on ne travaille plus a geometrie

Chapitre 4,paragraphe 1.1.

connue puisque le Champ est affecte par cette implantation aleatoiredu reseau d’echantillons. Les problemes d’evaluation de la variancequi decoulent de ce modele sont alors de meme nature que ceux deja Matheron, 1965,

pp208-210.rencontres a propos de la maille aleatoire stratifiee.

2.6. Une remarque instructiveRevenons brievement au cas de la maille a implantation preferentielle.Meme si la signification profonde de la Variance d’Estimation peut poserprobleme, il n’en demeure pas moins que, au plan mathematique, cettevariance est une quantite qui permet de comparer la qualite de differentsdispositifs d’estimation.

Rappelons qu’il ne s’agit pas la d’une verite absolue, mais simplementde la consequence triviale du choix que nous avons fait (librement)de la variance comme critere de qualite d’une estimation. Alors, dired’un estimateur n1 qu’il est meilleur que l’estimateur n2 est tresexactement synonyme de dire que sa Variance d’Estimation est inferieurea celle de l’estimateur n2.

Cette mise au point faite, c’est un exercice classique que comparer desvariances associees a des dispositifs usuels d’echantillonnage (fermes,centres, etc. ). Nous ne pouvons qu’inviter le lecteur a faire par lui-meme Fasc. 5, p103, exercice 5.

de tels exercices. Mais on peut dire qu’il se degage de ces manipulationsune regle empirique — ce n’est pas un theoreme — qu’il peut etre bienutile parfois de se rememorer :

• pour une Fonction Aleatoire tres structuree, un estimateur serad’autant meilleur que les echantillons seront de bonne qualite(proches, places de facon reguliere, etc. ) ;

• pour une Fonction Aleatoire peu structuree, un estimateur serad’autant meilleur que les echantillons seront nombreux. A la limite,pour une fonction totalement destructuree (effet de pepite pur, casde la Statistique classique), la qualite de l’estimateur ne depend quedu nombre des echantillons.

Appliquee a chaque voisinage glissant, cette regle empirique pourra sereveler d’une grande utilite pour la pratique de l’estimation locale.

3. L’estimation locale

3.1. IntroductionNous avons precedemment donne un sens precis a la notion de probleme Chapitre 4,

paragraphe 1.2.local. L’estimation locale, comme cas particulier d’un tel probleme,concerne donc l’estimation d’une portion bien circonscrite du Champde la Variable Regionalisee etudiee, a l’aide d’un jeu egalement biendelimite de donnees disponibles.

Comme de surcroıt nous nous placons ici dans le cadre de laGeostatistique Lineaire, la quantite a estimer sera une fonctionnellelineaire appliquee a la Variable Regionalisee, tandis que l’estimateur Voir commentaire ci-

dessous, paragraphe 3.2.2.sera une combinaison lineaire des donnees disponibles. Par suite,l’Erreur d’Estimation — difference entre valeur a estimer et estimateur— sera egalement une fonctionnelle lineaire construite sur VariableRegionalisee (ou sur la Fonction Aleatoire associee dans le modeleprobabiliste correspondant). Pour la simplicite de l’expression, nousdirons simplement de facon elliptique : l’erreur d’estimation est unecombinaison lineaire.

Page 80: g é o Statistique

78 Aide-Memoire de geostatistique lineaire :

Si l’expression de la quantite a estimer est imposee par le probleme,il n’en est pas de meme de l’expression de l’estimateur. Nous savonsseulement que cet estimateur doit etre une combinaison lineaire desdonnees disponibles, sans preciser a priori quels sont les poids a attribuera chacune de ces donnees. Et precisement, ces poids sont les inconnuesdu probleme d’estimation locale. La demarche est alors classique :le formalisme probabiliste nous donne les moyens de determiner cespoids, lesquels sont ensuite affectes aux valeurs prises par la VariableRegionalisee (c’est-a-dire aux donnees).

Un dernier mot enfin. L’estimation locale ainsi elaboree a recu enGeostatistique le nom de krigeage. Il ne s’agissait pas, par un nomnouveau, de revendiquer le statut de methode nouvelle : car, a toutprendre, nous verrons vite que le Krigeage n’est autre qu’une regressionmultiple de variance minimum, a partir de donnees correlees. Du pointde vue seulement mathematique, les equations correspondantes ne sontpas une innovation : les Mathematiciens sont donc fondes a recuser laChapitre 0, paragraphe 1.

nouvelle terminologie. Mais il est non moins vrai que, meme classique,cette methode mathematique n’avait pas encore a la fin des annees 40trouve droit de cite dans le monde minier. Le neologisme Krigeagesalue donc d’abord une rencontre, rencontre d’une methode et d’unchamp d’application. Qu’ulterieurement la methode se soit etoffee et queles champs d’application se soient multiplies, n’est probablement pas uneraison suffisante pour changer un vocabulaire desormais sanctionne parl’habitude, qui a de plus le merite d’attirer l’attention sur une certainephilosophie du travail.

3.2. Les etapes du krigeage

Avertissons d’emblee le Geostatisticien neophyte : au hasard dela bibliographie, le Krigeage est souvent associe a de multiplesadjectifs (simple, ordinaire, intrinseque, universel. . . )qui donnent l’impression deroutante d’une proliferation de techniquesdistinctes, peut-etre concurrentes voire contradictoires. La terminologiePar exemple, KI

signifie-t-il comme en 1975Krigeage Intrinseque,

ou comme en1985 Krigeaged’Indicatrices ?

de plus n’a pas ete constante dans le temps ; quand on sait de surcroıtqu’elle se complique d’abreviations elles-memes non stabilisees, on courtun risque reel de confusion.

La cause que nous cherchons a plaider ici est simple : il n’existe qu’unseul Krigeage en ce sens qu’il n’y a qu’une seule demarche geostatis-tique pour aborder un probleme d’estimation au sens local. Bien entendu,cette demarche doit s’adapter aux circonstances particulieres (differenteshypotheses de stationnarite par exemple), et par suite les formulationsultimes peuvent presenter des differences eventuellement notables ; maisle fil conducteur est immuable.

Plutot donc qu’obliger le lecteur a ingurgiter d’emblee une longue listede systemes de krigeages essayant d’epuiser toute la combinatoiredes situations possibles, nous voudrions d’abord enumerer les quatreetapes qui president a la construction de tout systeme de Krigeage. IlI I I

ne s’agit pas de marteler un dogme (tout le monde est libre d’utiliser ounon le Krigeage comme estimateur, pourvu que ce soit en connaissancede cause), mais simplement de rappeler un code de bonne conduite,de fournir un fil d’Ariane pour parcourir en securite ce qui pourraitapparaıtre comme un labyrinthe de systemes de Krigeage.

3.2.1. L’erreur d’estimation

La quantite autour de laquelle gravite tout le formalisme du krigeagen’est pas l’estimateur lui-meme, mais bien l’Erreur d’Estimation, c’est-a-dire — rappelons-le — l’ecart entre la quantite a estimer et l’estimateur.

Au niveau de la Variable Regionalisee, cet ecart n’est autre que l’erreur(au sens physique) commise faute de connaıtre la vraie valeur de laquantite a estimer. Dans bien des cas, il serait possible de fournir la

Page 81: g é o Statistique

[6] – Estimations 79

valeur exacte de cette erreur, en mesurant effectivement la quantite pourlaquelle on a construit l’estimateur (mesures de controle des teneurs enmine, par exemple).

Transposee au niveau du modele probabiliste — c’est-a-dire de laFonction Aleatoire—, cette Erreur d’Estimation acquiert le statutmathematique d’une Variable Aleatoire (voir ci-dessus les mecanismesde passage entre Variable Regionalisee et Fonction Aleatoire). C’estau niveau de cette Variable Aleatoire que nous allons travailler pourconstruire le Krigeage.

Une definition enfin : nous appellerons configuration de krigeage

Chapitre 1,paragraphe 2.3.

l’ensemble des points de l’espace mis en jeu a la fois par la quantitea estimer et par l’estimateur. La Configuration de Krigeage est donc,tres exactement, le support de l’Erreur d’Estimation.

3.2.2. Etape 1 : contrainte de linearite

Nous avons choisi de ne travailler que sur des formes lineaires de la LFonction Aleatoire etudiee. Cette contrainte nous est d’ailleurs imposeepar nos choix anterieurs, puisque les outils probabilistes dont nousdisposons (esperance et variance) ne sauront operer que sur de tellesformes compte-tenu de nos hypotheses de travail (stationnarite d’ordre 2ou intrinseque).

D’un point de vue mathematique, il ne faut pas se limiter a une vue tropetroite de la linearite. On peut legitimement envisager l’estimation detoute fonctionnelle lineaire (moyenne ponderee bien sur, donc convoluee ;mais aussi deconvoluee, derivee, integrale, etc. ) de la Fonction Aleatoire.Dans chaque cas, il peut surgir des difficultes techniques specifiques,et il faut en permanence prendre garde au seuil de realisme ; mais Chapitre 1,

paragraphe 3.4.fondamentalement, la voie est ouverte.

Quant a l’estimateur, nous le presenterons toujours, par souci desimplicite, comme une combinaison finie de donnees la plupart dutemps ponctuelles. Cette fois encore, il ne s’agit pas d’une contrainteimposee par la theorie, mais simplement d’un souci de realisme. Pourune presentation mathematique dans toute sa generalite, on se reportera Matheron, 1965,

pp214-216.a la bibliographie.

En resume, la premiere etape du Krigeage consiste donc a satisfaire deuxcontraintes :

• s’assurer que la quantite a estimer est bien une fonctionnelle lineairede la fonction aleatoire etudiee, par exemple :

Q =

Z(x) p(dx)

Cette contrainte exclut les problemes de type coupure et selectionqui font l’objet de la Geostatistique Non Lineaire ;

• exprimer que l’estimateur que l’on veut construire est unecombinaison lineaire des donnees disponibles :

Q∗ = λα Zα

3.2.3. Etape 2 : contrainte d’autorisation

A l’issue de la premiere etape, nous savons maintenant que l’erreur Ad’estimation est, au sens large, une combinaison lineaire construite sur Paragraphe 3.1.

la Fonction Aleatoire.

Il faut maintenant nous assurer que les manipulations a l’ordre 2(esperance et variance), que nous envisageons sur cette erreur, sont bienlicites. Autrement dit, il nous faut contraindre l’Erreur d’Estimation a Chapitre 3,

paragraphe 2.1.etre autorisee.

Page 82: g é o Statistique

80 Aide-Memoire de geostatistique lineaire :

Nous n’insisterons pas ici sur les problemes de convergence, lies a uneventuel travail en continu : implicitement, nous supposerons par la suiteque l’Erreur d’Estimation est une forme lineaire a support borne de laFonction Aleatoire etudiee. Ces difficultes etant evacuees, le caractereautorise ou non d’une combinaison lineaire dependra etroitement dumodele de stationnarite adopte.

Ainsi, dans le modele stationnaire d’ordre 2, toutes les combinaisonslineaires sont autorisees. Nous avons precedemment donne lesChapitre 3,

paragraphe 2.1–2.2.mecanismes de calcul des deux premiers moments de telles expressions.Dans ce modele, il n’y a donc pas de contrainte effective d’autorisation.

Au contraire, dans le modele intrinseque, une combinaison lineaireest autorisee si et seulement si son poids total est nul. Cette foisChapitre 5,

paragraphe 1.2.donc, il surgit une contrainte pour mener a bien le Krigeage :l’Erreur d’Estimation doit etre de poids total nul, c’est-a-dire queles ponderateurs λ, qui apparaissent dans l’expression de l’estimateurQ∗ = λα Zα et qui constituent les inconnues du problemes, sont sujetsa contrainte.

Ces contraintes prendront des formes diverses, au gre des futureshypotheses sur le degre de stationnarite.

3.2.4. Etape 3 : contrainte d’universalite

Un point de vocabulaire d’abord. La contrainte que nous allons definirUmaintenant pourrait egalement etre nommee : contrainte de nonbiais. Cette terminologie cependant renvoie trop a l’estimation auVoir tout cours

de Statistiques.sens de la Statistique classique, c’est-a-dire a l’estimation de ParametresConventionnels du modele ( inference statistique). N’oublions pasque dans notre formulation, les deux quantites (estimateur et quantite aestimer) sont des Variables Aleatoires du modele probabiliste : aucunen’a le statut de parametre.

Nous pourrions aussi parler de contrainte d’esperance nulle.L’avantage de cette formulation est sa neutralite. En particulier,elle ne suggere aucune interpretation physique, et garde une tonalitemathematique depourvue de tout parti-pris. C’est precisement pourcette meme raison que nous gardons le terme — consacre par l’usagegeostatistique — de contrainte d’universalite, certes un peu tropemphatique, mais dont la signification tres precise apparaıtra a mesureVoir au chapitre 7 le

Krigeage Universel.que nous relacherons les hypotheses de stationnarite.

Cette Contrainte d’Universalite, donc, consiste a exprimer que l’Erreurd’Estimation Q∗ −Q est d’esperance nulle :

E [Q∗ −Q] = 0

Remarquons tout de suite que nous sommes fondes a ecrire unetelle formule des que les deux contraintes precedentes sont satisfaitespuisqu’alors, par hypothese, l’esperance deQ∗−Q existe dans le modele.

Cette equation introduit une (nouvelle) contrainte sur les inconnues duprobleme, c’est-a-dire sur les λα de :

Q∗ = λα Zα

3.2.5. Sens de la contrainte d’universalite

Il n’est pas raisonnable, dans la demarche geostatistique, de s’en tenir al’aspect purement mathematique de la contrainte d’universalite : il fautpouvoir se donner les moyens de l’interpreter en termes plus physiques.

Observons d’abord que, pour l’exactitude mathematique de notredemarche, nous n’avons besoin que de l’existence de l’esperance :

E [Q∗ −Q]

Page 83: g é o Statistique

[6] – Estimations 81

pour un jeu particulier de donnees Zα et pour une quantite particuliereQ a estimer. A ce point, nous nous trouvons ramenes aux memesdifficultes d’interpretation que pour une Estimation Globale, a ceci presque le domaine d’etude ne s’etend pas au Champ entier, et avec ladifficulte supplementaire que nous serions bien en peine de probabiliserla Configuration de Krigeage.

C’est pourquoi, bien que nous n’en ayons pas besoin mathematiquement,

Paragraphe 2.1.

nous invoquerons nos hypotheses de stationnarite pour des raisons

Chapitre 4,paragraphe 1.1.

Paragraphe 3.2.1.

physiques. De fait, que nous soyons en modele stationnaire ou enmodele intrinseque, la loi d’une combinaison lineaire autorisee est parhypothese stationnaire d’ordre 2. Appliquee a l’Erreur d’Estimation (quiest par hypothese une Combinaison Lineaire Autorisee), cette proprietesignifie que les deux premiers moments de Q∗ − Q sont invariants par J J J

translation, c’est-a-dire qu’ils ne dependent pas de l’implantation de laConfiguration de Krigeage.

Naturellement, transcrire cette propriete au niveau physique — c’est-a-dire en termes de Variable Regionalisee — necessite quelquesamenagements. L’idee directrice est bien sur d’associer l’esperance :

E [Q∗ −Q]

a une moyenne spatiale. C’est, a peine compliquee, une demarche deja Chapitre 4,paragraphe 3.1–3.2.

rencontree. La difficulte supplementaire tient a la notion de translationde la Configuration de Krigeage : sauf cas particulier de donneesparfaitement regulieres, on ne pourra pas reproduire strictement laConfiguration de Krigeage dans les differentes zones du Champ totalde la Variable Regionalisee. Il faut donc introduire des tolerances surla description des Configurations de Krigeage, avec tous les risques quecela represente et toute l’experience que cela requiert. Mais enfin, grosso

modo, la contrainte mathematique

E [Q∗ −Q] = 0

signifie ceci : la moyenne statistique des Erreurs d’Estimation Voir : Lesrepresentationsglissantes, dans Estimeret Choisir, chapitre VII.

experimentales obtenues a travers tout le Champ sur des Configurationde Krigeage raisonnablement similaires, s’approche de 0 lorsque lenombre de ces configurations devient suffisamment grand.

C’est a dessein que les mots employes dans cette propositioncomme raisonnablement, s’approche, suffisamment. . . ontune tonalite subjective : nous sommes maintenant au niveau del’interpretation physique, de l’experience et du savoir-faire, et donner unstatut mathematique rigoureux a cette proposition exigerait un arsenalmathematique beaucoup plus developpe et un modele probabilistebeaucoup plus specifie (et ipso facto beaucoup moins realiste) que ceque nous nous bornons a manipuler dans le present expose.

Prosaıquement, cela signifie que si nous realisons le Krigeage sur ungrand nombre de voisinages de Krigeage a peu pres similaires, noussommes en droit d’esperer que l’erreur moyenne commise sera a peupres nulle. Mais remarquons dans le meme temps que cela ne garantitaucunement qu’il n’y ait localement de fortes erreurs : tout au plus peut-on dire que ces erreurs se compenseront globalement.

3.2.6. Etape 4 : contrainte d’optimalite

A l’issue des trois etapes precedentes, nous disposons d’un estimateur, Onon encore totalement specifie, et sujet eventuellement a un certainnombre de contraintes.

La derniere etape consiste a imposer a l’Erreur d’Estimation d’etre devariance minimale. La variance est, rappelons-le, le critere de qualitedont nous avons convenu pour la Geostatistique.

Page 84: g é o Statistique

82 Aide-Memoire de geostatistique lineaire :

Mathematiquement, nous savons par les etapes 1 et 2 que cette varianceexiste. Il s’agit ni plus ni moins d’une Variance d’Estimation que noussavons donc exprimer par les formules usuelles. Il reste donc a minimiserles quantites obtenues compte-tenu de la contrainte d’universalite, lesinconnues etant evidemment les ponderateurs λα a affecter aux donnees.Nous n’examinerons pas ici le probleme purement mathematique del’existence et l’unicite de la solution a ce probleme. Sauf cas speciaux,nous admettons cette existence et cette unicite. Au point de vue del’interpretation physique, nous ne reprendrons pas les commentaires du§3.2.5 : il suffit de noter que l’Erreur d’Estimation etant par hypothesed’esperance nulle, sa variance s’identifie a l’esperance de son carre. Ce quia ete dit precedemment sur la quantite Q∗ −Q peut donc s’appliquer ason carre. Ainsi, sous toutes les contraintes antecedentes, on cherchea ce que la moyenne statistique du carre des Erreurs d’Estimationexperimentales obtenues a travers tout le Champ sur des configurationsde Krigeage raisonnablement similaires, soit aussi faible que possiblepour un nombre suffisamment grand de ces configurations.

3.2.7. L. A. U. O.

Revenons une nouvelle fois sur les quatre contraintes du krigeage.

Chapitre 3, paragraphe 3.

Voir par exempleMatheron, 1970, 1971.

Ces contraintes sont, essentiellement, hierarchisees :I I I

• nous ne pouvons, dans notre modele, parler d’expression autoriseeque si celle-ci est prealablement lineaire (c’est la contrainte quenous nous sommes imposee dans le present document, consacre ala Geostatistique lineaire) ;

• il n’y a de sens a exprimer la condition d’universalite que pour unecombinaison lineaire autorisee. Cette contrainte est fondamentale :si elle n’est pas respectee, les manipulations mathematiques quisuivent sont ipso facto illegitimes ;

• et l’optimisation n’est formulee que sur des combinaisons satisfaisantdeja a la contrainte d’universalite. Il s’agit cette fois d’une contraintede bon sens : la construction d’un estimateur biaise est possiblemathematiquement, mais elle risque fort de ne presenter aucuninteret pratique. . .

En resume, et dans cet ordre, les contraintes :

1. L inearite

2. A utorisation

3. U niversalite

4. O ptimalite

caracterisent la demarche — unique — du Krigeage. Idealement, uncours sur l’estimation locale (sur toutes les Estimations Locales) devraitpouvoir s’arreter ici. . .

Il n’est cependant pas inutile de proposer quelques exemples, neserait-ce que pour introduire certains elements de vocabulaires passesmaintenant dans le langage geostatistique courant. Mais, la demarcheetant immuable et repetitive, les presentations seront de plus en plusrapides au fil des paragraphes.

Page 85: g é o Statistique

[6] – Estimations 83

3.3. Quelques exemples de krigeage ponctuel

3.3.1. Krigeage stationnaire a moyenne connue

Nous nous placons pour commencer dans le cas d’une Fonction AleatoireZ Stationnaire d’ordre 2, de covariance K, d’esperance m connue. Onpeut sans inconvenient supposer alors que m = 0, faute de quoi ilsuffirait de travailler sur la Fonction Aleatoire Z − m qui a la memecovariance que Z et qui, elle, est d’esperance nulle.

Nous nous bornerons ici a examiner le probleme de l’estimationponctuelle, c’est-a-dire a estimer la valeur de Z(x) en un point x donne,a l’aide d’un estimateur Z∗(x) forme a partir de donneesZα. Examinonsles quatre contraintes :

• Linearite : l’Erreur d’Estimation : L

Au sujet de la notation K,voir remarque Chapitre2,paragraphe1.2. Voiraussi commentairesen fin de chapitre.

Z∗(x) − Zx

doit etre une forme lineaire sur Z. Donc, Z∗(x) est de la forme :

Z∗(x) = λα Zα

ou les λα sont les inconnues du probleme.

Remarque : on notera au passage que ces ponderateurs, pour des Zα

donnes, dependent a priori du point x a estimer. Il conviendrait donc J J J

de les noter λα(x). Il est rare cependant que cette ecriture completesoit indispensable, et les risques de confusion sont limites. Afin de nepas alourdir les notations, on conservera donc l’ecriture simplifiee λα.

• Autorisation : l’Erreur d’Estimation : A

λα Zα − Zx

doit etre autorisee dans le modele. Il se trouve que nous sommes parhypothese dans le cadre du modele stationnaire, de sorte que toutes lescombinaisons lineaires sont autorisees. Pour cette fois, il se trouve doncqu’il n’y a pas de condition d’autorisation active.

• Universalite : conditionnellement aux deux contraintes precedentes, Unous voulons maintenant que :

E [λα Zα − Zx] = 0

Mais, par hypothese, E [Zx] = 0 et E [Zα] = 0 (quel que soit α).La condition est donc automatiquement satisfaite. Pour cette fois, il setrouve donc qu’il n’y a pas de condition d’universalite active.

• Optimalite : conditionnellement aux trois contraintes precedentes, il Onous reste enfin a minimiser :

Var [λα Zα − Zx]

Cette expression se calcule suivant le formalisme classique, et vaut : Chapitre 3,paragraphe 2,2.

λα Kαβ λβ − 2 λαKαx + Kxx

En l’occurrence, il n’y a pas de contrainte active, et le minimum decette forme quadratique est obtenu en annulant sa derivee partielle parrapport a chacune des inconnues λα, soit :

2 λβ Kαβ − 2 Kαx = 0 (∀α)

Page 86: g é o Statistique

84 Aide-Memoire de geostatistique lineaire :

Rappelons que nous admettrons l’existence et l’unicite de cet optimum.

Dans les hypotheses actuelles, le systeme de Krigeage s’ecrit donc :

βλβ Kαβ = Kαx (∀α)

C’est un systeme lineaire, dont le nombre d’equations et le nombred’inconnues sont egaux au nombre de points de donnees.

Designons1 par λαS

— on devrait meme ecrire : λαS(x) — la solution de

ce systeme. La valeur minimale de la Variance d’Estimation est donc :

σ2S

= λαSKαβ λ

βS

− 2 λαSKαx + Kxx

et comme, d’apres les equations memes du Krigeage,

λβSKαβ = Kαx

on trouve apres simplification :

σ2S

= Kxx − λαSKαx

Ce Krigeage, dont la denomination precise devrait logiquement etreKrigeage Stationnaire a moyenne nulle, est connu traditionnellementsous le nom de Krigeage Simple — en abrege : KS.

3.3.2. Krigeage stationnaire a moyenne inconnue

Nous restons encore dans l’hypothese d’une Fonction AleatoireStationnaire d’ordre 2, de covarianceK. Mais on ne suppose plus connuel’esperance m, qui cependant existe dans le modele. Nous suivons biensur les memes quatre etapes que precedemment :

• Linearite :LZ∗(x) = λα Zα

• Autorisation : cette fois encore, toutes les combinaisons lineairesAsont autorisees dans le modele. Il n’y a de nouveau pas de conditiond’autorisation active.

• Universalite : nous voulons avoir, conditionnellement aux deuxUcontraintes precedentes :

E [λα Zα − Zx] = 0

D’apres le modele, nous savons que E [Zx] = m , ce qui est vraien particulier pour tout point de donnee α : E [Zα] = m. Mais parhypothese nous ne connaissons pas m. Alors, pour que :

E [λα Zα − Zx] = m

(

α

λα − 1

)

soit nul, et dans l’ignorance ou nous sommes de cette valeur de m, ilfaut et il suffit que :

α

λα − 1 = 0

Telle est la contrainte d’universalite portant sur les λα.

1L’indice S est mis comme reference a la denomination usuelle de Krigeage

Simple — voir ci-dessous.

Page 87: g é o Statistique

[6] – Estimations 85

• Optimalite : il nous reste maintenant a minimiser :

Var [λα Zα − Zx] = λαKαβ λβ − 2 λα Kαx + Kxx

conditionnellement aux contraintes precedentes, c’est-a-dire dans ce casconditionnellement a :

α

λα − 1 = 0

Cette minimisation s’obtient par la technique des multiplicateurs deLagrange. C’est une methode issue du calcul des variations qui,schematiquement, revient a ceci : pour minimiser par rapport aux λune certaine forme Q(λ) sous un certain jeu de contraintes

Φl(λ) = 0

on ecrit que la quantite :

Q(λ) + 2 µl Φl(λ)

doit voir s’annuler ses derivees partielles par rapport aux λ et par

O

La presence du facteur 2devant le multiplicateurn’a evidemment riend’essentiel : nous avonschoisi cette definition aseule fin de permettre dessimplifications dans lederoulement des calculs.

rapport aux µl. Ce sont ces µl, inconnues auxiliaires du probleme, quisont appeles Multiplicateurs de Lagrange, chacun d’eux correspondant aune contrainte. Notons d’ailleurs que l’annulation de la derivee partiellepar rapport a µl (l fixe) ne fait que restituer la l-eme contrainte.

Explicitons pour cette fois le calcul. Il n’y a qu’une contrainte, doncqu’un seul multiplicateur, que l’on notera µ. Il faut donc ecrire que lesderivees partielles de :

λα Kαβ λβ − 2 λα Kαx + Kxx + 2 µ

(

α

λα − 1

)

sont nulles simultanement par rapport aux λα et par rapport a µ.

Par rapport a µ, on retrouve donc naturellement :

α

λα = 1

et par rapport a λα (α fixe quelconque), et apres simplification par 2 :

λβ Kαβ + µ = Kαx

La formule usuelle de presentation de ces equations est :

βλβ Kαβ + µ = Kαx (∀α)

βλβ = 1

On note que, toutes autres conditions egales par ailleurs, ce systemecomporte une inconnue et une equation de plus que le systeme duKrigeage Simple.

Si nous designons par λβO

et µO

la solution de ce systeme, la valeur dela Variance de Krigeage est :

σ2O

= λαOKαβ λ

βO

− 2 λαOKαx + Kxx

Page 88: g é o Statistique

86 Aide-Memoire de geostatistique lineaire :

et en tenant compte des relations que satisfont les λβO

et µO

, on peutsimplifier cette expression en :

σ2O

= Kxx − λαOKαx − µ

O

Ce krigeage stationnaire a moyenne inconnue est traditionnellementappele Krigeage Ordinaire — KO en abrege, ce qui justifie l’indice O

affecte a la solution.

3.3.3. Krigeage Intrinseque

Comme dernier exemple de krigeage ponctuel, supposons maintenantque la Fonction Aleatoire soit strictement intrinseque et de plus sansChapitre 5,

paragraphe 1.1.derive. Reprenons encore une fois les quatre etapes du Krigeage :

• Linearite :LZ∗(x) = λα Zα

• Autorisation : dans le modele intrinseque, une combinaison lineaireAest autorisee si et seulement si la somme totale de ses poids est nulle.Chapitre 5,

paragraphe 1.2.Le poids total de λα Zα − Zx est

α λα − 1 d’ou la contrainte

d’autorisation :∑

α

λα − 1 = 0

• Universalite : rappelons que dans le modele FAI sans derive,Utoute CLA est d’esperance nulle. La contrainte d’universalite estChapitre 5,

paragraphe 1.3.automatiquement satisfaite

• Optimalite : exprimons la variance — qui existe d’apres la contrainteOd’Autorisation — de l’erreur λα Zα − Zx. Comme cette erreur est uneCLA (d’apres les trois contraintes precedentes), on peut calculer savariance selon le mecanisme de substitution etabli precedemment. Ainsi :Chapitre 5,

paragraphe 1.3.

Var [λα Zα − Zx] = −λα γαβ λβ + 2 λα γαx

Nous avons a minimiser cette expression sous la contrainte (unique)d’autorisation. Le developpement de ce calcul serait tout a fait semblableau precedent ; plus simplement encore, il suffit dans le resultat du KOde remplacer K par −γ, et le systeme de krigeage est finalement :

−∑

βλβ γαβ + µ = −γxα (∀α)

βλβ = 1

Toujours en notant avec l’indice O la solution de ce systeme, la Variancede Krigeage devient :

σ2O

= λαOγαx − µ

O

Ce krigeage intrinseque sans derive est lui-aussi appele KrigeageOrdinaire dans la litterature.

3.3.4. Quelques commentaires

Il est clair que, formellement, les deux derniers systemes obtenuspresentent exactement la meme structure. C’est, on peut le supposer,cette quasi-identite qui justifie cette terminologie unique de KrigeageOrdinaire. Bien entendu, cette convergence n’a rien de fortuit.Un sujet

de reflexion.

Cependant, au risque de paraıtre puriste, nous pensons qu’il n’est passouhaitable de faire l’amalgame entre les deux modeles. S’il est vrai en

Page 89: g é o Statistique

[6] – Estimations 87

effet que, dans les deux cas, la contrainte qui apparaıt a exactementla meme expression, il n’en demeure pas moins que sa signification esttout a fait differente : contrainte d’Universalite dans un cas, contrainted’Autorisation dans l’autre.

Cette difference reapparaıtra ulterieurement et eclairera sans doute ladouble approche des phenomenes non stationnaires. Pour le moment,contentons-nous de remarquer que si la structure des deux systemes deKrigeage Ordinaire est la meme, ce n’est pas le cas en ce qui concerneleur contenu : la filiere Krigeage Stationnaire a moyenne inconnue,fondee sur un modele aleatoire stationnaire, n’accepte comme fonctionsstructurales que des covariances ; au contraire, le Krigeage Intrinsequesans derive ouvre la porte aux variogrammes, c’est-a-dire a une gammeplus vaste de modeles structuraux. Naturellement, si dans ce dernier casle modele de variogramme possede un palier, on peut alors interpreter leKrigeage Intrinseque sans derive comme un Krigeage Stationnairea moyenne inconnue : en quelque sorte, qui peut le plus peut lemoins, et l’approche intrinseque semble plus riche et prometteuse quel’approche stationnaire + derive.

Ces remarques prendront toute leur importance lors de la doubleapproche — Krigeage Universel, Krigeage Intrinseque — de la Chapitres 7 et 8.

Geostatistique Non-Stationnaire. Pour l’instant, contentons-nous dereaffirmer avec force l’interet de bien poser la hierarchie des contraintesL.A.U.O. , methode qui garantit de toute erreur lors de laconstruction d’un systeme de Krigeage quel qu’il soit.

3.4. Proprietes du systeme de KrigeageNous n’insisterons pas sur les proprietes algebriques du systeme deKrigeage, en particulier sur les conditions necessaires et suffisantesd’unicite de la solution. Du reste, ce probleme mathematique devraitetre formule en toute generalite dans le cas continu, c’est-a-dire queles inconnues du probleme ne seraient desormais plus un jeu fini deponderateurs, mais des mesures. Le Krigeage n’est plus alors un systemede Cramer, mais un systeme d’equations fonctionnelles, qui requiertde raisonner en termes d’espaces de Hilbert. Le Krigeage peut ainsi Matheron 1969.

s’exprimer en termes de projections. Nous renvoyons a la bibliographiepour cette approche mathematique. Journel, 1977.

3.4.1. Le Krigeage, interpolateur exact

Nous nous placerons desormais, sauf cas particuliers dument mentionnes,dans l’hypothese ou le systeme de Krigeage est regulier. C’est unesituation bien agreable — heureusement tres courante ! — puisqu’alors,si nous savons exhiber — par quelque moyen que ce soit— UNE solution J J J

du systeme de Krigeage, nous savons que c’est LA solution.

C’est ainsi par exemple que l’on peut s’assurer que le Krigeage ponctuelest un interpolateur exact : pour l’instant, on entend par la que si lepoint a estimer est confondu avec l’un des points de donnees, l’estimateurde Krigeage est identique a la valeur de la donnee en ce point. Auniveau des ponderateurs de Krigeage, cela veut donc dire que si le pointa estimer x est confondu avec un point α de donnee, la solution duKrigeage est λα = 1, et λβ = 0 pour β 6= α.

Il est immediat de verifier l’affirmation precedente, sur chacun dessystemes construits jusqu’ici. Dans chaque cas, on constate que le jeu decoefficients λα = 1, et λβ = 0 pour β 6= α constitue UNE solution dusysteme de Krigeage : c’est donc LA solution, en vertu de l’unicite duKrigeage. Le Krigeage est bien un interpolateur exact.

Notons seulement qu’une demonstration fondee sur les projectionssur un espace de Hilbert serait surement plus elegante. Cependant,la verification proposee ici constitue une demonstration — peut-etreinesthetique, mais parfaitement rigoureuse.

Page 90: g é o Statistique

88 Aide-Memoire de geostatistique lineaire :

3.4.2. Superposition des figures de Krigeage

Nous nous sommes bornes jusqu’ici a proposer des systemes d’estimationponctuelle. Mais, nous le savons, la Geostatistique Lineaire nous autorisel’estimation de toute fonctionnelle lineaire de la Fonction Aleatoireetudiee. Il est alors immediat de verifier — donc de demontrer — que,grace a la linearite des equations, et a la reserve expresse d’utiliser lesmemes donnees pour tous les Krigeages concernes, le Krigeage d’unecombinaison lineaire est la combinaison lineaire des Krigeages, soit :

(aQ+ bR)∗ = aQ∗ + bR∗

ou :

— Q et R sont des fonctionnelles lineaires quelconques de la FonctionAleatoire etudiee ;

— a et b sont des coefficients quelconques ;

le signe ∗ designant l’operateur d’estimation par Krigeage.

Cette propriete est connue sous le nom de theoreme de superposition

I I II I I

des figures de Krigeage, et peut s’exprimer plus synthetiquement :sous reserve d’utiliser toujours le meme domaine pour formerl’estimateur, les figures de Krigeage se superposent lineairement.

Quelques exemples :

• le Krigeage de la quantite de metal sur deux panneaux est la sommedes Krigeages sur chacun des panneaux (pourvu essentiellement queces krigeages soient realises avec les memes donnees !) ;

• la teneur moyenne krigee sur un bloc n’est autre que la moyenne desKrigeages ponctuels sur ce bloc ;

• le Krigeage d’une convoluee n’est autre que la convoluee desKrigeages ponctuels :

[∫

p(dx)Z(X)

]2

=

p(dx)Z∗(x)

On peut encore aller plus loin et, par exemple (sous reserve de donnerun sens aux derivations) :

• le Krigeage de la derivee est la derivee du Krigeage ;

• le Krigeage du gradient est le gradient du Krigeage, etc.

C’est la raison pour laquelle dans un expose qui se veut plutotmethodologique, nous n’accorderons pas d’attention particuliere auxsystemes de Krigeage non ponctuel puisque, in fine, tout peut seramener a des estimations ponctuelles.

3.4.3. Relation d’orthogonalite et de lissage

Il est communement admis que l’estimateur du Krigeage lisse lafonction etudiee. On entend par la que la Variable Regionalisee z∗(x)presente moins d’asperites et de fluctuations que la Variable Regionaliseevraie z(x). Il est possible de donner un sens precis a cette affirmationpragmatique dans le cadre d’un modele stationnaire de moyenne nulle.

Dans ce dernier cas en effet, l’estimateur du Krigeage Simple s’ecrit :Paragraphe 3.3.1.

Z∗(x) = λαS(x)Zα

avecλβ

S(x)Kαβ = Kαx (∀α)

ou encore(

λβS(x)Kαβ −Kαx

)

= 0 (∀α)

Page 91: g é o Statistique

[6] – Estimations 89

Mais sous cette forme, ce jeu d’equations peut s’ecrire

Cov[

λβS(x)Zβ − Zx, Zα

]

= 0 (∀α)

Autrement dit, l’erreur de Krigeage Simple est orthogonale a chacune desdonnees. Par linearite, on en deduit immediatement que cette erreur estorthogonale a toute combinaison lineaire des donnees, donc en particuliera l’estimateur du KS lui-meme, qui n’est autre que la combinaisonlineaire λα

S(x)Zα. Ainsi,

Cov [Z(x) − Z∗(x), Z∗(x)] = 0

ou encoreCov [Z(x), Z∗(x)] = Var [Z∗(x)]

Mais alors,

σ2S(x) = Var [Z(x) − Z∗(x)]

= Var [Z(x)] + Var [Z∗(x)] − 2 Cov [Z(x), Z∗(x)]

= Var [Z(x)] − Var [Z∗(x)]

= K(0) − Var [Z∗(x)]

ce qui s’ecrit encore :

K(0) = Var [Z∗(x)] + σ2S(x)

On montre ainsi que

Var [Z∗(x)] ≤ K(0)

c’est-a-dire que la variance de la valeur estimee est strictement inferieurea la variance a priori , sauf dans le cas particulier ou σ2

S(x) = 0

(estimation d’un point de donnee). C’est la une expression precise dela notion vague : le krigeage lisse.

Incidemment, on notera que l’estimateur de Krigeage Simple n’est passtationnaire d’ordre 2. Il est bien vrai que son moment d’ordre 1 eststationnaire, puisque

E [Z∗(x)] = 0

qui ne depend pas de x. En revanche, de la relation de lissage, on tire

Var [Z∗(x)] = K(0) − σ2S(x)

qui depend de x par l’intermediaire de σ2S(x) : le moment d’ordre 2 n’est

pas stationnaire.

3.5. Evaluation optimale de l’esperance mathematiqueNous avons envisage au §3.3.2. le cas d’un modele a esperancemathematique inconnue. On peut se demander si la demarcheL.A.U.O. peut servir a une evaluation optimale de l’esperancemathematique m, dans le cadre de ce modele.

Nous utilisons a dessein le mot neutre et mal defini d’ evaluation.En toute rigueur en effet, nous ne sommes pas fondes a parlerd’estimation de m, puisque l’esperance mathematique n’est pas uneGrandeur Regionale, mais seulement un parametre conventionnel dumodele. Cela dit, un tel purisme n’est sans doute pas indispensable, etle lecteur ne sera pas surpris de voir ecrit, dans la plupart des ouvrages

Page 92: g é o Statistique

90 Aide-Memoire de geostatistique lineaire :

de Geostatistique, estimation optimale de la derive. Du reste, onrejoint ici la notion d’estimation de la Statistique classique.

Quoiqu’il en soit, il est parfaitement possible de suivre les quatre etapesmaintenant classiques :

• Linearite : on forme une expression M∗ = λα Zα. L’Erreurd’Estimation :

λα Zα −m

est bien une combinaison lineaire des donnees, m etant un simpleparametre (en l’occurrence deterministe).

• Autorisation : dans le present modele (en l’occurrence, stationnaire aesperance inconnue), toutes les combinaisons lineaires sont autorisees.

• Universalite : on veut E [λα Zα −m] = 0 ; et comme E [Zα] = mU

L

E & C, p78

A

(∀α) , cela impose :

m

(

α

λα − 1

)

= 0

quel que soit m. Par consequent,

α

λα = 1

• Optimalite : conditionnellement aux contraintes precedentes, nousOvoulons minimiser Var [λα Zα] −m, qui se developpe en :

λα Kαβ λβ

(avec les notations deja adoptees au §3.3.2.

Nous devons donc annuler les derivees partielles de :

λα Kαβ λβ + 2 µ

(

α

λα − 1

)

ce qui, tous calculs desormais classiques faits, donne :

βλβ Kαβ + µ = 0 (∀α)

βλβ = 1

Si l’on designe par λαM

et µM

les solutions de ce systeme, la variance decette estimation devient :

σ2M

= −µM

La demarche L.A.U.O. peut donc parfaitement s’adapter a

Voir ci-dessous quelquesremarques sur les

notations, et enparticulier la definition

du Multiplicateurde Lagrange.

l’estimation du Parametre Conventionnel m. On notera d’ailleurs quele premier membre du systeme ainsi obtenu est identique a celui duKrigeage (§3.3.2).

Nous reservons a plus tard l’examen du lien existant entre estimation aAnnexe 2.

moyenne connue, a moyenne inconnue, et estimation de la derive.

Page 93: g é o Statistique

[6] – Estimations 91

Nous avons releve au §3.3.1 un probleme de notation : en effet,la designation de la Covariance Stationnaire (K) fait double emploiavec celle du Covariogramme Geometrique rencontre en GeostatistiqueTransitive. Les risques de confusion sont minimes pour un utilisateurattentif, et ne justifient probablement pas de bouleverser les notationstraditionnelles que l’on peut rencontrer dans les differentes referencesbibliographiques.

Nous aurions pu en revanche adopter, pour la duree de ce chapitre,l’ecriture σ pour designer la Covariance Stationnaire, comme il est faitdans certaines references. C’est de propos delibere que nous avons adoptela notation K, anticipant ainsi sur ce qui sera ulterieurement l’ecritureusuelle des Covariances Generalisees. Par ce clin d’œil au Chapitre 8,nous souhaitons simplement annoncer — avec un peu d’avance — quele formalisme stationnaire n’est finalement qu’un cas particulier dela Geostatistique Intrinseque. Il serait donc superflu de multiplier lesnotations pour des etres mathematiques qui, fondamentalement, sont dememe nature.

Par ailleurs, il est d’usage dans certains documents de faire figurer le

Notations

Fasc. 5.

Fasc. 5.

Multiplicateur de Lagrange dans le membre de droite du systeme. Ainsipar exemple, l’estimation de la Derive s’ecrit :

βλβ Kαβ = µ (∀α)

βλβ = 1

Les inconnues d’interet, c’est-a-dire les ponderateurs λβ , sont ainsiclairement isolees.

Nous avons prefere ici regrouper les inconnues (les λα et µ), ce quipar ailleurs facilite l’ecriture matricielle. Bien sur, il en resulte uneconsequence desagreable, puisque la Variance d’Estimation de la Derives’ecrit avec un signe − : σ2

M= −µ

M. Mais cet inconvenient n’est

apres tout qu’au niveau de l’esthetique : cela prouve tout simplementque µ

Mest toujours negatif !

Nous admettons pour l’instant etre dans de bonnes conditions, qui Commentaires

assurent la regularite du systeme de Krigeage. L’explicitation de cesconditions sera proposee ulterieurement, et les premiers systemes quenous avons envisages ici n’apparaıtront que comme des cas particuliersde mecanismes plus generaux. Mais il est bon de savoir deja que la regle Chapitre 8.

L.A.U.O. sera, elle, immuable.

En ce qui concerne l’historique et l’interet du Krigeage, le mieux est derenvoyer a la bibliographie, en particulier le Fascicule 5, pages 117-121,ainsi que la fin du chapitre XII de

• Les Variables Regionalisees et leur estimation,Matheron, 1965.

Naturellement, nos propos optimistes : il n’y a qu’un seul Krigeagene doivent pas faire illusion. La pratique nous permet de rencontrer deschausse-trappes d’une grande variete !

Page 94: g é o Statistique

92 Aide-Memoire de geostatistique lineaire :

Et enfin, il convient de refuter une opinion helas assez repandue : laGeostatistique ne se borne pas au seul Krigeage. . .

Se reporter, en deuxieme partie du document, au chapitreAnnexe

• Formalisme de l’esperance conditionnelle.

pour eclairer le calcul des variances d’estimation globales. Par ailleurs,dans un cadre plus large que les hypotheses actuelles, le chapitre

• Complements sur le theoreme d’addivite.

propose un tour d’horizon sur les relations existant entre differentskrigeages et les estimations de derives.

Page 95: g é o Statistique

Chapitre 7

Vers les modelesnon stationnaires

Presentation

Il n’est pas rare que les modeles stationnaire ou intrinseque serevelent insuffisants pour rendre compte d’un phenomene un peucomplexe. Il faut alors elargir les hypotheses sur les caracteres destationnarite de la Variable Regionalisee etudiee, et par consequentde la Fonction Aleatoire associee.

Au premier paragraphe, on revient sur la double significationde la stationnarite, suivant que l’on se place au niveau VariableRegionalisee ou Fonction Aleatoire, et on degage les deuxapproches usuelles d’une Geostatistique Non Stationnaire.

Le second paragraphe developpe succinctement les techniquespropres a la premiere de ces approches : le Krigeage Universel.

Au troisieme paragraphe, on examine les problemes souleves parla notion faussement intuitive de Derive, et on justifie le recours aune seconde approche.

Ces problemes sont encore detailles au quatrieme paragraphe,ou l’on s’attache cette fois particulierement a l’interpretation descoefficients de la derive.

Le cinquieme paragraphe developpe, dans le cadre du KrigeageUniversel, quelques generalisations des formules d’additivite dejarencontrees au chapitre precedent.

Le sixieme paragraphe, enfin, evoque les etapes et les difficultesd’une Analyse Variographique en vue d’un Krigeage Universel.

1. Introduction a la non-stationnarite

1.1. Rappel sur le role d’une hypothese stationnaireRemarque prealable : Nous avons deja souligne qu’il fallait distinguerles modeles locaux et globaux de la stationnarite. Pour des raisons desimplicite, et aussi parce que les problemes globaux peuvent egalementtrouver une voie de solution par les methodes transitives, nous nousbornerons ici a reflechir sur les modeles locaux de non-stationnarite.Le lecteur soucieux d’examiner les modeles globaux non stationnairespourra se reporter a la bibliographie. E & C, p140-146.

Revenons donc aux problemes locaux. Le maıtre-mot de ce cadre detravail est voisinage glissant : le modele que nous allons elaborer n’aura Chapitre 1,

paragraphe 1.2.de validite physique qu’a l’echelle de ce voisinage. C’est la une restrictionque nous devons garder a l’esprit, car une expression mathematique nepresente en general pas de garde-fou : rien n’interdit mathematiquementde calculer la valeur d’un modele de covariance pour des distancesbien superieures a l’echelle de travail. Mais quelle signification objectiveaccorder au resultat ? Nous retrouvons donc une premiere distinction defond entre les deux points de vue : Fonction Aleatoire (mathematique)et Variable Regionalisee (physique).

Page 96: g é o Statistique

94 Aide-Memoire de geostatistique lineaire :

Il y a plus. La notion meme de stationnarite n’est pas identique dansles deux cas. Une Fonction Aleatoire est, ou n’est pas, stationnaire :son statut ne saurait souffrir aucune ambiguıte. La stationnarite estdans ce cas une propriete purement mathematique (et rappelons aupassage que cette propriete n’est par exemple nullement indispensablepour construire les equations du Krigeage). A l’oppose, la stationnariteeventuelle de la Variable Regionalisee est une notion empirique, sujette aapproximations, et qui fait essentiellement reference a l’echelle de travail.

Le probleme de fond n’est pas la mise en œuvre elle-meme d’un modelemathematique. Le probleme essentiel est que ce modele mathematiquepuisse assurer dans de bonnes conditions le parallele avec le modelephysique, autrement dit que les operations mathematiques realisees surla Fonction Aleatoire correspondent a des operations physiques realisees

Chapitre 1,paragraphes 3.4-3.6.

sur la Variable Regionalisee. Soyons plus precis encore : il faut, puisquenous travaillons a l’ordre 2, que Esperances et Variances exprimees surla Fonction Aleatoire correspondent a des manipulations precises surla Variable Regionalisee. En modele local, ces manipulations sont desmoyennes glissantes, et cette correspondance ne peut etre assuree quemoyennant la reintroduction d’une certaine forme de stationnarite — etd’ergodicite : mais ceci, nous le supposerons acquis une fois pour toutes.D’ou le principe directeur suivant :

1.2. Idee directrice de la Geostatistique Non StationnaireEn depit de notre ambition de traiter des phenomenes non stationnaires,nous chercherons toujours a revenir a quelque chose de stationnaire.

De facon un peu provocante, et qui ne permet pas de prevoircertaines reelles difficultes qui nous attendent, nous pourrions dire queles methodes non stationnaires consistent a appliquer les methodesstationnaires classiques a des objets nouveaux. Ces objets nouveauxsont le quelque chose a extraire d’un phenomene globalement nonstationnaire. Les deux approches que nous allons detailler maintenant nedivergent que par le choix de la methode utilisee pour mettre en evidencece quelque chose.

• Premier cas : on propose une dichotomie du phenomene. On essaiede separer la Variable Regionalisee (et parallelement la FonctionAleatoire) en deux composantes, dont l’une sera eventuellementtraitee a part, et l’autre satisfera a de bonnes conditions destationnarite. Problemes subsequents : cette dichotomie est-elleunique ? Est-elle operatoire ? Est-elle pertinente ? Cette optiqueconduit a la technique du Krigeage Universel (KU).

• Second cas : on construit une transformation du phenomene.Chapitre 8.

On applique un certain operateur a la Variable Regionalisee(a la Fonction Aleatoire) afin que le resultat satisfasse auxbonnes conditions de stationnarite. Probleme subsequent : cettetransformation est-elle reversible ? Cette optique conduit a lageostatistique intrinseque, et aux modeles des FAI-k (FonctionsAleatoires Intrinseques d’ordre k).

Nous aurons en conclusion a examiner les convergences des deuxmethodes, et nous pourrons faire apparaıtre la premiere approche commecas particulier de la seconde.

1.3. Comment tester la non-stationnarite ?On peut deja raisonnablement prevoir que les modeles non stationnairesapporteront quelque complication aux methodes deja connues. C’estpourquoi il semble bon de ne pas se lancer a la legere dans des modelestrop riches : il faut pouvoir s’assurer de la necessite d’adopter l’approchenon stationnaire.

Rappelons encore une fois avec force qu’une Variable Regionaliseen’est pas, en elle-meme, stationnaire ou non. Il faut dire, pour etre

Page 97: g é o Statistique

[7] – Vers les modeles non stationnaires 95

precis, que telle Variable Regionalisee, pour un domaine fixe, pour uneechelle de travail donnee, peut raisonnablement etre — ou ne pas etre— modelisee par une Fonction Aleatoire stationnaire. Et, encore unefois, soulignons que le mot raisonnablement, qui peut choquer parexemple les Statisticiens, pourrait sans doute etre pris comme la pierreangulaire de la demarche du Geostatisticien. Ainsi, dans le cas precisqui nous interesse, il n’y a pas de vraie reponse a la questionstationnaire ou non stationnaire, mais plutot un engagement prispar le Geostatisticien, en connaissance de cause, en meilleur accordpossible avec les donnees, en suivant toujours le Principe d’Economie, eten sachant que de toute facon in fine, il subsistera toujours un risque.

Le present expose ne peut en aucun cas fournir de regle immuable

Chapitre 1,paragraphes 4.2.

Beaucoup de repetitions,certes. Mais ces ideessont fondamentalesen geostatistique, etmeritent cette insistance.

permettant de resoudre a coup sur le probleme de la stationnaritedu modele. Mentionnons cependant que deux types d’analyse peuventetre envisagees :

• une approche naturaliste : la non-stationnarite du modele peutetre souhaitee pour rendre compte de phenomenes physiques parailleurs connus. C’est ainsi que nous pourrons rencontrer lesnotions de tendance, regionale, ou encore de composantebasse frequence. Notons que, dans l’optique geostatistique, rienn’interdit au praticien de forcer la main au modele pour tenterde caracteriser une non stationnarite hypothetique : la demarche n’arien d’anormal, des lors que l’on en prend la responsabilite, et quel’on accepte d’en subir les consequences ;

• une approche numerique : nous renvoyons a titre d’exemple auChapitre 6, §3.6. Si la quantite d’information le permet, on peuttester directement la stationnarite empirique de la moyenne sur desvoisinages glissants. D’autre part, le comportement aux grandesdistances (grandes par rapport a l’echelle de travail) du variogrammeest un bon identificateur de la stationnarite empirique.

Dans toute la suite du chapitre, nous supposerons bien sur que noussommes dans le cas ou les modeles stationnaires sont insuffisants. Deplus, nous nous placerons au niveau du modele Fonction Aleatoire,c’est-a-dire que nous nous interesserons ici seulement aux techniquesmathematiques.

2. Le Krigeage Universel

2.1. La dichotomieDans le modele probabiliste qui nous interesse ici, on suppose quela Fonction Aleatoire Z(x) etudiee peut etre consideree comme lasuperposition de deux composantes :

• une derive m(x), fonction qui sera pour le moment considereecomme deterministe dans le modele ;

• un residu Y (x), parfois appele plus precisement residu vrai, qui ale statut d’une Fonction Aleatoire.

Donc :Z(x) = Y (x) + m(x)

Cette dichotomie n’a rien d’innocent, et appelle deja plusieurscommentaires.

2.1.1. Les donnees disponibles

Naturellement, lorsque l’on transpose ce modele au niveau de la VariableRegionalisee, on suppose que seules sont accessibles des mesures de z(x).

Page 98: g é o Statistique

96 Aide-Memoire de geostatistique lineaire :

Le probleme n’aurait pas de raison d’etre si, par un moyen ou un autre,on pouvait acceder experimentalement aux valeurs de y(x) : il suffiraitde faire l’etude geostatistique sur y plutot que z : ce ne serait alorsqu’une generalisation (triviale) de ce que nous avons rencontre lors duKrigeage a moyenne connue.

Pour reprendre la terminologie en usage en Geostatistique, ou bien cetteE & C, p78.

dichotomie est une operation conventionnelle, ou bien le probleme n’apas reellement de raison d’etre et peut, moyennant une transformationphysique sur les donnees, etre resolu par les methodes deja connues.

2.1.2. Contrainte au niveau de la Variable Regionalisee

Il faut cependant apporter une importante nuance a la constatationprecedente. Au niveau physique, on espere en general une significationnaturaliste a cette dichotomie. A tout le moins, on souhaitera separer :

• une composante regionale, reguliere, lisse, une tendance,correspondant aux basses frequences du phenomene

et

• une composante residuelle, irreguliere, erratique, representant desanomalies, correspondant aux hautes frequences.

Donc, physiquement, la dichotomie n’aura de pertinence et d’interet quesi elle separe des phenomenes d’echelles differentes. De fait, dans bien descas, le souhait du praticien va encore plus loin : on voudra que les deuxcomposantes correspondent a des phenomenes de natures differentes, degenese differente. En bref, on attendra de la dichotomie qu’elle puisse etreinterpretee physiquement, voire meme qu’elle ait une vertu explicative.Ce qui est beaucoup demander, sans doute trop. . .

2.1.3. Contrainte au niveau de la Fonction Aleatoire

Au niveau mathematique, ce que l’on attend de la dichotomie

Z(x) = Y (x) + m(x)

est d’une nature totalement differente. On souhaite avant tout que Y (x),le residu vrai, possede les bonnes proprietes de stationnarite d’ordre 2qui permettront de le traiter par les methodes deja connues de laGeostatistique Stationnaire. Cette exigence procede elle-meme d’ailleursde deux raisons distinctes :

• on souhaite pouvoir mettre en œuvre, par exemple, les methodesdu Krigeage. Mais a vrai dire, cette exigence se contenterait del’existence de la variance de Y (x), et pourrait se passer de sastationnarite ;

• mais on souhaite aussi pouvoir realiser l’Analyse Variographique deY (x). Et, cette fois, une contrainte de stationnarite sur Y (x) sembleSauf peut-etre dans

certains cas particuliersde phenomenes

spatio-temporels.

a peu pres incontournable.

2.1.4. Structure de la Derive

Observons d’abord que les deux exigences que l’on vient de formuler, auxniveaux de la Variable Regionalisee puis de la Fonction Aleatoire, n’ontpas de raison en general de coıncider. Et comme il nous faut bien fairetourner le modele, c’est d’abord a la recherche d’une stationnaritesous-jacente — c’est-a-dire relative au Residu Vrai — que nous nousattacherons. Mais alors, ce ne sera qu’un hasard heureux si la dichotomieUn hasard heureux,

voire miraculeux. Oualors, suspect. . . ainsi etablie peut en meme temps etre interpretee physiquement au

niveau de la Variable Regionalisee.

Notons au passage que si le Praticien souhaite a toute force donnerune signification naturaliste a la Derive, il incombe au Geostatisticiend’exiger une definition operatoire de celle-ci, comme par exemple :moyenne ponderee par telle fonction, calculee sur tel support, etc. .

Page 99: g é o Statistique

[7] – Vers les modeles non stationnaires 97

Mais alors, nous ne sommes plus dans le cadre du Krigeage Universel,et le mot de Derive devient en l’occurrence inadequat.

Revenons a notre observation initiale, et temperons-en le pessimisme.Nous pouvons aider le modele mathematique a exprimer que la Derivem(x) represente les basses frequences. Pour cela, nous allons poser :

m(x) =∑

l

al fl(x)

ou :

• les f l(x) — souvent notes plus simplement f lx — sont un jeu de

fonctions de base, jeu de fonctions simples et arbitrairement fixeesdes coordonnees. A premiere vue, ces fonctions sembleraient pouvoiretre quelconques. En realite, pour des raisons profondes, le choix enest assez limite. Disons simplement ici que, dans la quasi-totalitedes cas, il s’agit de monomes 1, x, x2, y, . . . Nous imposerons entout cas toujours que la premiere fonction de base soit constante ; J J J

on affecte traditionnellement cette fonction de l’indice 0, et ainsi :

f0x = 1

• la somme porte sur un nombre d’indices l en general assez limite,de sorte que m(x) comporte seulement un petit nombre de termes ;

• les al sont des coefficients numeriques — inconnus dans le modele,sinon, il n’y aurait plus de probleme !

Ainsi modelisee, la Derive peut preter a deux interpretations. Laplus intuitive consiste a dire que, a l’echelle de travail, la Derive aeffectivement une forme analytique simple. On se rapproche en sommede l’optique trend surface analysis. On court alors probablementle risque d’accorder trop de sens a ce qui n’est qu’une forme algebriquecommode — le plus souvent polynomiale — qui n’est en general porteused’aucun message naturaliste.

L’autre interpretation, qui sans doute presente moins de risques, consisteen ceci : on considere que la Derive est un phenomene suffisammentregulier pour pouvoir — raisonnablement — etre approche, al’echelle de travail, par les premiers termes d’un developpement selonun certain jeu de fonctions simples. L’accent est mis cette fois non passur la forme de la Derive, mais sur son degre de regularite. Cette vision,plus proche des mathematiques, nous garde mieux a l’abri de possiblesextrapolations interpretatives. On se rapproche, cette fois, des methodesde type frequentiel : ce que nous appelons Derive est alors associeaux basses frequences, sans prejuger aucunement ni de leur origine ni deleur signification physique.

2.1.5. Hypotheses communes aux differents modeles de KU

Nous nous proposons maintenant d’examiner les developpements de latechnique du KU , dans le cadre d’un petit nombre d’hypotheses destationnarite. Nous partons pour cela de quelques hypotheses communes,qui se resument en la formule suivante :

Z(x) = Y (x) + al flx

ou :

• Z(x) est la Fonction Aleatoire brute. Les donnees disponibles,qui seront notees classiquement zα, sont considerees comme lesRealisations de Z(x) aux points xα ;

• dans la Derive m(x) = al flx, le nombre de termes du

developpement est suppose connu, les fonctions f lx sont donnees,

et on suppose que f0x = 1 ;

Page 100: g é o Statistique

98 Aide-Memoire de geostatistique lineaire :

• les coefficients al sont, jusqu’a explicitation contraire, deterministesdans le modele, et inconnus ;

• les differentes hypotheses sur la stationnarite portent sur le residuvrai Y (x). Toute caracteristique relative a ce residu (vrai) seraqualifiee de sous-jacente.

Dans les developpements ci-dessous, nous supposerons connus levariogramme ou la covariance Sous-Jacente. Naturellement, il se poseravite en pratique le probleme de la modelisation de ces fonctionsstructurales, c’est-a-dire simplement de l’Analyse Variographique ; maispour le moment, nous voulons seulement montrer que nous sommestheoriquement capables de mener a bien les calculs d’estimation dansle cadre de ces hypotheses. La demarche de ces calculs sera du resteimmuable, et respectera les quatre etapes L.A.U.O. : c’estChapitre 6,

paragraphe 3.2.7.pourquoi nous consacrerons de moins en moins de lignes a l’aspectpurement technique de l’estimation.

2.2. KU a modele sous-jacent stationnaire d’ordre 2

2.2.1. Signification du modele

Dans la decomposition :

Z(x) = Y (x) + al flx

le residu est suppose admettre une variance finie (et, de surcroıt,stationnaire). Cela signifie donc que le phenomene global n’oscille jamaisde facon excessive autour de la Derive : tout se passe comme s’ilexistait une force de rappel qui contraigne le phenomene a revenir aun comportement d’ensemble regulier, en depit de fluctuations locales.

On pressent d’emblee qu’un tel modele est exigeant, et qu’il contient enlui-meme une forte part d’interpretation naturaliste du phenomene. Il estevidemment peu probable que tout phenomene non stationnaire puisseetre represente par un schema aussi strict ; en revanche, si cette approcheest licite, la dichotomie semble parfaitement justifiee, et repondre a desmecanismes profonds de la genese du phenomene.

Nous supposerons enfin que Y (x) est d’esperance nulle. Si tel n’est pas lecas, ou bien cette esperance est connue et il suffit de la soustraire a Y (x),Peu vraisemblable :

comment peut-on connaıtre

une esperance ?

ou bien elle est inconnue et on l’inclut dans la Derive (elle contribue auterme a0 puisque f0 ≡ 1). Alors :

E [Y (x)] = 0

E [Z(x)] = al flx

Cov [Y (x), Y (y)] = Cov [Z(x), Z(y)] = Kxy

2.2.2. Estimation

Bornons-nous a construire le systeme de Krigeage ponctuel. L’Erreurd’Estimation est de la forme :L

λα Zα = Zx

Il n’y a pas de contrainte d’autorisation, puisque dans le modele, toutesAles combinaisons lineaires admettent esperance et variance. La presenced’une Derive, deterministe, ne change rien a cet etat de fait.

Page 101: g é o Statistique

[7] – Vers les modeles non stationnaires 99

La contrainte d’universalite : U

E [λα Zα − Zx] = 0

se developpe compte-tenu de l’expression de E [Z(x)], et, en mettant lescoefficients al en facteur, on obtient finalement :

al

(

λα f lα − f l

x

)

= 0

etant entendu qu’il s’agit bien d’une sommation sur l’indice l.

Cette contrainte doit etre satisfaite, alors meme que les coefficients al

sont inconnus. La seule solution est donc que chacune des expressionsaffectee a un al soit nulle separement, soit :

∀l λα f lα − f l

x = 0

Il s’agit la d’un jeu de plusieurs contraintes sur les λα — les inconnuesdu problemes — en nombre egal au nombre de fonctions de base f l.

Il reste maintenant a minimiser, sous les contraintes precedentes, la Ovariance de l’erreur :

σ2 = Var [λα Zα − Zx]

= λα Kαβ λβ − 2λαKαx +Kxx

Comme nous en avons desormais l’habitude, nous utiliserons la methodedes multiplicateurs de Lagrange. Il y aura cette fois autant demultiplicateurs µl que de conditions d’universalite, c’est-a-dire que defonctions de base. Nous devons donc exprimer la nullite des deriveespartielles, par rapport aux λα et µl, de l’expression :

λα Kαβ λβ − 2λαKαx + Kxx + 2µl

(

α

λα f lα − f l

x

)

Bien entendu, les derivees par rapport aux µl restituent les conditionsd’universalite. Les equations supplementaires, appelees par commoditeconditions d’optimalite, s’ecrivent :

λβ Kαβ + µl flα = Kαx ∀α

et il y en a autant que de points de donnees xα.

Designons par λαU

et µU l les solutions du systeme ainsi construit. La

Variance d’Estimation σ2 devient, apres simplifications :

σ2U

= Kxx − λαUKαx − µ

U l flx

2.2.3. Presentation matricielle

Le systeme de Krigeage Universel se resume sous la forme matricielle :

(

Kαβ f lα

f lα 0

)(

λβ

µl

)

=

(

Kαx

f lx

)

Page 102: g é o Statistique

100 Aide-Memoire de geostatistique lineaire :

La matrice du systeme est une matrice carree, symetrique, constituee parla sous-matrice carree des covariances sur les donnees et completee parle vecteur des fonctions de base sur ces memes donnees. Les proprietesde regularite de cette matrice seront examinees ulterieurement, dansun cadre plus general ; dans la pratique, on supposera toujours que cesysteme est regulier.

2.3. KU a modele sous-jacent intrinseque strict

2.3.1. Particularite de ce modele

Supposons maintenant que le modele Sous-Jacent soit seulementintrinseque strict. Seules donc admettent une esperance et une varianceles combinaisons lineaires du residu ayant un poids total nul. Il en seraevidemment de meme en ce qui concerne la Fonction Aleatoire globale,puisque l’addition de la quantite deterministe al f

lx ne change rien en ce

qui concerne l’existence des moments.

Rappelons aussi que nous avons convenu de ne travailler que sur des

Chapitre 8,paragraphes 3.3.

Chapitre 5,paragraphes 1.2.

Fonctions Aleatoires Intrinseques sans Derive, c’est-a-dire telles quetoute CLA soit d’esperance nulle. Alors :

E [Y (x+ h) − Y (x)] = 0

Var [Y (x + h) − Y (x)] = Var [Z(x+ h) − Z(x)] = 2γ(h)

Mais nous n’avons pas le droit de parler separement de l’esperance ou deI I I

la variance de Y (x) — ou de Z(x) — parce que ces quantites n’existentpas dans le modele probabiliste ou, pour etre moins brutal, n’ont parhypothese pas de statut defini dans ce modele.

Une derniere remarque, appelee a etre developpee ulterieurement. Nousnous fondons bien sur toujours sur la dichotomie :

Z(x) = Y (x) + al flx

mais cette fois, seules sont autorisees dans le formalisme probabiliste lesChapitre 5,paragraphe 1.2.

combinaisons d’accroissements de la forme :

Z(x) − Z(y) = Y (x) − Y (y) + al

(

f lx − f l

y

)

Or on se souvient que f0 ≡ 1. Dans l’expression de l’accroissement de laDerive, le terme correspondant a l’indice l = 0 s’annule, et le coefficienta0 disparaıt completement des expressions autorisees. Le terme constanta0 est en quelque sorte invisible dans le modele intrinseque. D’avance,on sait que deux Fonctions Aleatoires ne differant que d’une constanteconduiront exactement aux memes equations : on voit deja se dessinerles mecanismes d’une indetermination mathematique.

2.3.2. Estimation

• Linearite :LZ∗(x) = λα Zα

• Autorisation : l’erreur d’estimation doit etre de poids total nul, soit :A

α

λα − 1 = 0

Page 103: g é o Statistique

[7] – Vers les modeles non stationnaires 101

• Universalite : conditionnellement aux contraintes precedentes, on veutgarantir que :

E [λα Zα − Zx] = 0

Cette ecriture est licite puisque, lorsqu’on est arrive a cette etape, ontravaille desormais conditionnellement a la contrainte d’autorisation.D’apres la decomposition de Z, on peut aussi ecrire :

0 = E[

λα Yα − Yx + al

(

λα f lα − f l

x

)]

= al

(

λα f lα − f l

x

)

=∑

l6=0

al

(

λα f lα − f l

x

)

En effet, la combinaison sur Y est autorisee par hypothese, et donc

U

d’esperance nulle puisque Y est intrinseque sans Derive. Quant a l’autreexpression, etant deterministe, elle s’identifie a sa Derive. Et, nousl’avons vu, le terme correspondant a a0 disparaıt de la sommation.

Donc, sachant deja que∑

λα − 1 = 0, on trouve comme conditionssupplementaires :

λα f lα − f l

x = 0 (∀l 6= 0)

• Optimalite : sous les contraintes d’autorisation et d’universalite, il faut Omaintenant minimiser :

Var [λα Zα − Zx] = −λα γαβ λβ + 2λα γαx

cette expression s’obtenant par le calcul habituel des variances de CLA.Nous devrons introduire un multiplicateur de Lagrangeµ0 pour lacontrainte d’autorisation, et des multiplicateurs µl — ou l 6= 0 — pourchaque contrainte d’universalite.

Tous calculs (desormais classiques) faits, le systeme s’ecrit :

−∑

βλβ γαβ + µo +

l6=0 µl flα = −γαx (∀α)

βλβ = 1

βλβ f l

β = f lx (∀l 6= 0)

Et, avec nos notations habituelles :

σ2U

= λαUγαx − µ

U0 − µU l f

lx (l 6= 0)

2.3.3. Presentation matricielle

Le systeme de Krigeage se resume en :

−γαβ 1 f lα

1 0 0

f lβ 0 0

λβ

µ0

µl

=

−γαx

1

f lx

ou l 6= 0.

Page 104: g é o Statistique

102 Aide-Memoire de geostatistique lineaire :

2.3.4. Plaidoyer pour une demarche rigoureuse

Evidemment, dans les ecritures precedentes, il peut paraıtre superflud’introduire cette distinction entre le cas l = 0 et les autres. Il est clairen particulier que la condition :

α

λα − 1 = 0

n’est autre que la version, pour l = 0, de :

β

λβ f lβ − f l

x = 0

Dans ces conditions, il paraıtrait excusable de ne pas s’embarrasserde trop de subtilites, et de simplement construire le KU en modeleintrinseque a partir du KU en modele stationnaire, en remplacant Kpar −γ : le resultat, au moins, serait correct.

Il nous semble pourtant important de souligner la nature originalede la premiere contrainte, et le role essentiel qu’elle joue. Car aprestout, si une contrainte d’universalite est de simple bon sens, elle n’estmathematiquement pas indispensable ; la contrainte d’autorisation enrevanche est incontournable pour donner une legitimite et un sens auxexpressions mathematiques.

Il y a peut-etre plus profond encore. L’injection de la contrainteI I I

d’autorisation nous autorise ipso facto a travailler sur des modeles sansvariance a priori : avec des variogrammes sans palier. Cela signifie quele phenomene peut s’ecarter considerablement de sa Derive : il n’y a plusde force de rappel. De fait, une Fonction Aleatoire Intrinseque (memesans Derive) fait apparaıtre des comportements locaux qui s’apparententa des Derives — et qui pourtant sont essentiellement aleatoires dansle modele. Mais alors, la dichotomie demeure-t-elle pertinente dans cemodele ? A vrai dire, le modele : dichotomie avec modele Sous-Jacentintrinseque strict apparaıt finalement hybride et ambigu.

Et puis, il est deja temps de poser une question purement mathematique.Puisque la contrainte

α λα − 1 = 0 a par elle-meme ouvert la voie a

un elargissement des modeles structuraux theoriquement licites (passagede K a −γ), les autres contraintes λα f l

α − f lx = 0 n’autoriseraient-

elles pas a leur tour une extension des modeles structuraux a une familleI I I

encore plus riche ? Et que signifieraient ces nouveaux modeles ?

2.4. Proprietes du Krigeage Universel

2.4.1. Proprietes generales

Nous retrouvons pour le Krigeage Universel, que le modele Sous-Jacentsoit stationnaire ou intrinseque, les memes proprietes que pour le KS oule KO en ce qui concerne :

• le fait que le Krigeage (ponctuel) est un interpolateur exact ;Chapitre 6,paragraphe 3.4.1.

• la superposition des figures de Krigeage.Chapitre 6,paragraphe 3.4.2.

2.4.2. Independance lineaire des fonctions de base

Nous n’etudierons pas encore en detail les conditions de regularite dusysteme de Krigeage. Cependant, si nous examinons la structure generalede ce systeme (ecrit en incorporant la fonction f 0 a l’ensemble desfonctions de base) :

(

Kαβ f lα

f lα 0

)

ou

(

−γαβ f lα

f lα 0

)

Page 105: g é o Statistique

[7] – Vers les modeles non stationnaires 103

nous voyons que les (k + 1) dernieres lignes sont de la forme :

f01 f0

2 . . . f0N 0 . . . 0

f11 f1

2 . . . f1N 0 . . . 0

......

......

...

fk1 fk

2 . . . fkN 0 . . . 0

en supposant qu’il y ait N points de donnees et (k + 1) fonctions debase. Il suffit alors que l’on puisse trouver un jeu de coefficients non tousnuls cl, tels que :

cl flα = 0 (∀α = 1, . . . , N)

pour qu’alors existe une combinaison lineaire a coefficients non tous nulsdes (k+1) dernieres lignes du systeme qui soit identiquement nulle. Celasignifie que les k + 1 vecteurs a N + k + 1 dimensions :

f01

f02...

f0N

0...

0

f11

f12...

f1N

0...

0

. . .

fk1

fk2...

fkN

0...

0

ne sont pas lineairement independants, donc que le systeme est singulier.

Nous avons ainsi etabli une condition necessaire de regularite du systeme Une condition suffisantede singularite donc,par contraposition,une conditionnecessaire de regularite.

de Krigeage: il faut que, si un jeu de coefficients cl verifie cl flα = 0 sur

toutes les donnees, alors les cl soient tous nuls :

(cl flα = 0 ∀α) =⇒ ∀l : cl = 0

Cette condition est appelee independance lineaire des fonctions debase sur les donnees.

2.4.3. Une invariance des ponderateurs du KU

Soit le systeme de Krigeage Universel Ce paragraphe estpresente avec desnotations en termesde covariance. Il estimmediat de verifier que laconclusion serait identiqueavec un variogramme.

(

Kαβ f lα

f lβ 0

)(

λβ

µl

)

=

(

Kαx

f lx

)

Ce systeme sera suppose regulier.

Supposons maintenant que la fonction structurale ne soit plus K, maisωK, ou ω est un coefficient numerique positif quelconque. Le systemedevient alors

(

ωKαβ f lα

f lβ 0

)(

λβ

µl

)

=

(

ωKαx

f lx

)

ce qui peut aussi s’ecrire

(

ωKαx

f lx

)

=

(

ωKαβ f lα

f lβ 0

)(

λβ

ω (µl/ω)

)

=

(

ωKαβ ωf lα

f lβ 0

)(

λβ

µl/ω

)

Page 106: g é o Statistique

104 Aide-Memoire de geostatistique lineaire :

c’est-a-dire, apres simplification par ω,

(

Kαβ f lα

f lβ 0

)(

λβ

µl/ω

)

=

(

Kαx

f lx

)

Et, le systeme etant suppose regulier, on en deduit

(

λβ

µl

)

=

(

λβ

µl/ω

)

.

En particulier, on voit que λβ = λβ , ce qui signifie que l’estimateur duKU n’est pas modifie par une multiplication de la fonction structuraleI I I

par une constante ω ; cette conclusion reste evidemment valable pourles estimateurs du Krigeage Simple ou du Krigeage Ordinaire. Onpourrait verifier en revanche que la Variance de Krigeage est quant aUn exercice elementaire.

elle multipliee par ce meme facteur ω.

2.4.4. Proprietes d’orthogonalite

Multiplions les premieres equations du systeme de KU1 par un coefficienta priori quelconque ϕα, et sommons en α. On peut ecrire le resultatsous la forme :

ϕα(

λβ Kαβ −Kαx

)

= −µl ϕα f l

α

Mais, par ailleurs,

λβ Kαβ −Kαx = Cov[

λβ Zβ − Zx, Zα

]

et, finalement :

− µl ϕα f l

α = Cov[

λβ Zβ − Zx, ϕα Zα

]

Ainsi le membre de droite de cette egalite represente-t-il la covariancede l’Erreur de Krigeage Universel

(

λβ Zβ − Zx

)

et de la combinaisonlineaire des donnees ϕα Zα.

Si de plus cette derniere combinaison lineaire satisfait aux contraintes(∀l) : ϕα f l

α = 0, alors cette covariance est nulle. En resume, nous avonsla propriete d’orthogonalite exprimee par le theoreme :

L’Erreur de Krigeage Universel ponctuel estorthogonale a toute combinaison lineaire desdonnees ϕα Zα qui filtre la famille des fonctionsde base, c’est-a-dire toute combinaison lineaireverifiant (∀l) :

α ϕα f l

α = 0.

Dans le cas particulier du Krigeage Ordinaire — pour lequel la seulefonction de base f l est la constante f0 = 1 — ce theoreme s’exprimesous la forme simplifiee :

1Cette fois encore, par commodite, le systeme est exprime en covariance. Cela

n’affecte en rien la conclusion, qui s’etablirait de facon similaire — pour un modele

Sous-Jacent intrinseque — en appliquant la Regle de Substitution habituelle.

Page 107: g é o Statistique

[7] – Vers les modeles non stationnaires 105

L’Erreur de Krigeage Ordinaire ponctuelest orthogonale a toute combinaison lineaire desdonnees de poids total nul.

Enfin, en ce qui concerne le Krigeage Simple , le resultat est encoreplus . . . simple :

L’Erreur de Krigeage Simple ponctuel estorthogonale a toute combinaison lineaire desdonnees.

Mentionnons que cette derniere propriete joue un role decisif dans le Voir tout documentd’introductionaux SimulationsConditionnelles.

processus de conditionnement des modeles numeriques (SimulationsConditionnelles).

3. Le statut de la Derive

3.1. IntroductionDans le formalisme du paragraphe precedent, la Derive a ete en grandepartie escamotee : on lui a attribue un statut deterministe, et on a deplus admis que le modele Sous-Jacent etait connu.

Cette situation est evidemment utopique. Nous devons bien sur supposerla Derive inconnue — sinon, il n’y aurait plus de probleme ; ce quientraıne que le residu non plus n’est pas connu. Mais alors, commentacceder experimentalement a la fonction structurale de ce residu ?

D’autre part, nous avons pleinement utilise la propriete de la Derived’etre deterministe (dans le modele) : le developpement al f

lx peut etre

extrait de l’expression des esperances, et disparaıt des variances. Maisne sommes-nous pas alles trop loin ? De quel droit associons-nous quasi-instinctivement la notion de regularite spatiale qui fonde la Derive etcelle de determinisme ? En realite, il est parfaitement possible d’elaborerun modele mathematique de Derive aleatoire et rien meme n’interdit quecette Derive soit correlee avec le residu.

Mais cette demarche est purement mathematique ; si nous avons travailleavec une Derive deterministe, c’est parce que nous y sommes contraintspar la pratique. Comment en effet, sur un phenomene donne, pourrions-nous decider ce qui, dans son comportement basse frequence, doit etreconsidere comme deterministe et ce qui doit etre considere commeRealisation d’une fonction aleatoire ? Puisque de toute facon la Derivedemeurera un Parametre Conventionnel, attachons-nous au moins arespecter au mieux le principe d’economie.

Les deux questions :

• comment faire l’Analyse Variographique ?

• quel statut pour la Derive ?

sont tres loin d’etre independantes. Ce n’est malheureusement qu’al’experience que l’on finit par percevoir les reelles difficultes qu’elles fontsurgir dans la mise en œuvre du Krigeage Universel. Aussi renvoyons-nous a la bibliographie. Dans le present expose, nous ne ferons que Matheron, 1969 (d) ;

Chauvet, 1982.donner les grandes lignes de l’analyse variographique ; le probleme d’uneDerive aleatoire ne sera qu’effleure.

3.2. Evaluation optimale de la Derive : idee directriceUne evaluation de la Derive peut repondre a deux buts bien distincts.D’une part, tout simplement, se faire une representation plausible de la

Page 108: g é o Statistique

106 Aide-Memoire de geostatistique lineaire :

composante basses frequences du phenomene global, avec d’ailleurstous les risques de sur-interpretation que cela fait courir. D’autre part —et c’est a ce second point seulement que nous nous attacherons ici — onpeut souhaiter evaluer les residus en vue d’une Analyse Variographique.

Si, comme dans toute la Geostatistique Lineaire, nous adoptons les

Attention a nepas franchir le

seuil de realisme !

variances comme critere de qualite d’une evaluation, nous nous heurtonsI I I

d’emblee a un paradoxe. Car la variance de toute quantite autoriseerequiert la connaissance de la fonction structurale, connaissance qui estprecisement notre but ultime. Il y a cercle vicieux. . .

C’est la une des difficultes methodologiques majeures du KrigeageUniversel. Dans notre developpement, de nature plutot mathematique,nous allons encore etre obliges de supposer le modele Sous-Jacent connu.Inutile de dire que, dans le cours d’une etude reelle, il faudra s’affranchirde cette hypothese irrealiste. Mais pour l’instant, nous nous proposonsun double but :

• montrer que nous saurions, munis de la fonction structurale,proposer une evaluation optimale de la Derive ;

• mais montrer aussi que, meme dans ces conditions utopiques, ilsubsiste de reelles difficultes.

La demarche est maintenant bien connue. Nous ne supposons accessibles(dans le modele) que des valeurs Zα, et nous voulons evaluer la Deriveen un point x a l’aide d’une combinaison lineaire de ces Zα :

M∗(x) = λα Zα

Nous garderons par commodite le vocabulaire estimateur en depitChapitre 6,paragraphe 3.5.

de son caractere inadequat. Nous adoptons comme notation un M∗

majuscule pour rappeler que, dans le modele, cet estimateur est unequantite aleatoire (alors que, dans le modele, la quantite a estimerest deterministe). Les etapes de l’estimation sont immuables —L.A.U.O. — et ne necessitent plus d’explication.

3.3. Modele sous-jacent stationnairePas de contrainte d’autorisation. La contrainte d’Universalite :

E [λα Zα −mx] = 0

donne apres developpement :L A U

al

(

λα f lα − f l

x

)

= 0

soit finalement :λα f l

α − f lx = 0 (∀l)

La variance d’estimation vaut :

Var [λα Zα −mx] = Var [λα Zα] = λαKα β λβ

dont le minimum sous contraintes conduit aux conditions d’optimalite :O

λβ Kα β + µl flα = 0

Le systeme ainsi obtenu :

βλβ Kαβ + µl f

lα = 0 (∀α)

βλβ f l

β = f lx (∀l)

Page 109: g é o Statistique

[7] – Vers les modeles non stationnaires 107

s’ecrit matriciellement :(

Kαβ f lα

f lβ 0

)(

λβ

µl

)

=

(

0

f lx

)

et, en notant λβD

et µDl les solutions de ce systeme, la variance

d’estimation est :σ2

D= −µ

Dl flx

3.4. Retour sur l’independance lineaire des fonctions de baseNotons tout d’abord que la structure du systeme est la meme que pourle Krigeage Universel : les conditions de regularite sont donc les memes.

Cette constatation permet peut-etre d’interpreter plus aisement lacondition d’independance lineaire des fonctions de base sur les donnees,condition necessaire pour assurer la regularite du systeme. Si en effet il Paragraphe 2.4.

existe une combinaison lineaire des fonctions de base, non identiquementnulle, qui s’annule sur toutes les donnees, cela signifie que les points demesure sont tous situes sur une (hyper)courbe de degre k alors que k designe le

degre de la Derivel’estimation de la Derive cherche a ajuster une (hyper)surface de degrek sur ces memes donnees : le probleme est indetermine, et conduit a unsysteme singulier.

Ainsi par exemple dans R2 :

• pour une Derive de degre 2 : si tous les points sont sur unmeme cercle, on peut trouver une infinite de spheres passant parces donnees ; s’ils sont sur deux droites paralleles, une infinite decylindres ; sur deux droites concourantes, une infinite de cones. . .

• pour une Derive de degre 1 : si tous les points sont alignes, on peuttrouver une infinite de plans passant par ces points.

3.5. Modele sous-jacent intrinseque strictRevenons a l’expression de l’estimateur, cette fois pour un modeleintrinseque strict. Il existe donc dans ce cas une condition d’autorisation :l’expression

λα Zα − mα

doit avoir un poids total nul. Rappelons que mx n’est qu’un parametre L Adeterministe du modele : l’autorisation se traduit donc par :

α

λα = 0

Conditionnellement a cette relation, la contrainte d’universalite : U

E [λα Zα −mx] = 0

se developpe (en sortant de l’esperance les quantites deterministes) :

E [λα Yα] + λα al flα − al f

lx = 0

Mais :

• λα Yα etant une CLA et Y etant supposee intrinseque sans Derive,

E [λα Yα] = 0

• comme∑

α λα = 0, et comme f0

α = 1 :

λα al flα = a0

α

λα +∑

l≥1

al λα f l

α

=∑

l≥1

al λα f l

α

Ainsi le coefficient a0 a-t-il disparu du second terme.

Page 110: g é o Statistique

108 Aide-Memoire de geostatistique lineaire :

Par ces deux simplifications, la contrainte d’universalite s’ecrit :

0 = λα al flα − al f

lx =

l≥1

al

(

λα f lα − f l

x

)

− a0

Rappelons que cette contrainte, qui est relative aux ponderateurs λα,devrait etre satisfaite quels que soient les coefficients al (l ≥ 0)inconnus : elle est donc impossible a satisfaire.

Le mecanisme de cette impossibilite se situe dans la conditiond’autorisation

α λα = 0, qui a isole le coefficient a0 issu de la vraie

Derive en x.

Autrement dit :

En modele intrinseque strict, l’estimation optimale de laDerive est impossible parce que conditions d’autorisationet d’universalite sont incompatibles.

3.6. Vers un travail en accroissementsNous faisons apparaıtre ici l’importance de la distinction entre conditionsd’autorisation et d’universalite. Il est interessant de noter que cetteParagraphe 2.3.4.

distinction, qui semblait de peu d’interet au niveau du Krigeage, devientcapitale au niveau de la Derive.

En fait, cela ne devrait pas trop nous surprendre. Car nous savons quela condition d’autorisation nous entraıne a travailler a une constanteParagraphe 2.3.1.

additive pres. Cette constante n’est autre que le terme a0 de la Derive :ce coefficient semble bien a jamais invisible pour le modele. Quant a ceque nous avions dit sur le caractere hybride du modele de la dichotomie,nous en obtenons ici une illustration exemplaire : dans le developpement(d’apparence si naturelle) de la Derive al f

lx, le premier des termes, a0,

n’a pas le meme statut que les autres puisqu’il est affecte par la partieprobabiliste du modele (il n’a pas le meme sens selon que le modeleSous-Jacent est stationnaire ou intrinseque).

Pour lever cette difficulte, une methode simple consiste a travaillersur des accroissements. Nous savons en effet que les accroissementsChapitre 5,

paragraphe 1.2.sont les plus simples des CLA dans le modele intrinseque strict : ilsadmettent donc esperance et variance, et les mecanismes de calcul sontalors connus. De fait, nous sommes ramenes au calcul en covariance duChapitre 5,

paragraphe 1.3.§3.3. La nouveaute est que nous avons change d’objet d’etude, puisquece n’est plus la fonction Z elle-meme (definie dans l’espace euclidien)qui est traitee, mais ses accroissements (definis dans le produit del’espace euclidien par lui-meme : l’espace des couples de points). Le termeconstant a0 est cette fois definitivement filtre du formalisme. Les calculsFasc. 5, p149-151 ;

Chauvet, 1982,paragraphe 3.3. sont alors sans mystere. . .

4. Les coefficients de la DeriveTechniquement, le passage aux accroissements est la reponse adequateaux difficultes rencontrees dans le modele intrinseque strict. Cetteoperation, d’ailleurs, nous guidera bientot pour une generalisation desnotions de stationnarite.

Il est peut-etre interessant cependant d’examiner plus en detail lasignification de ces problemes. Pour cela, nous n’insisterons pas surles details de calculs, et nous degagerons surtout les etapes de cettereflexion. Le present paragraphe n’est donc qu’un guide pour la lectureFasc. 5, p151-155 ;

Chauvet, 1982, chapitre 4.de documents plus complets.

Page 111: g é o Statistique

[7] – Vers les modeles non stationnaires 109

4.1. Evaluation des coefficients : modele stationnaireDe meme que nous avons pose le systeme d’estimation de la Derivedans son ensemble, nous pouvons de la meme facon ecrire les equationsL.A.U.O. exprimant l’estimation de chacun des coefficients al.

Il n’y a, en modele Sous-Jacent stationnaire d’ordre 2, aucune difficultea construire cette estimation. Toutefois, il est peut-etre plus elegant de En guise d’ exercice...

proceder par identification en remarquant que les ponderateurs λαD

sont Paragraphe 3.3.

des combinaisons lineaires des f lα, de sorte qu’il en est de meme de :

M∗x = λα

DZα

L’estimateur M∗x est donc de la forme :

M∗x = A∗

l flα

ou : Fasc. 5, p151 ;Chauvet, 1982, Chapitre2, paragraphe 2.4.A∗

l = λαl Zα

le coefficient λαl etant solution d’un systeme analogue a celui de

l’estimation de la Derive globale :

(∀l)

βλβ

l Kαβ +∑

s µl s fsα = 0 (∀α)

βλβ

l fsβ = δs

l (∀s)

Ce qui est interessant, c’est que chaque coefficient pris separementpeut faire l’objet d’une estimation optimale, affectee d’une varianced’estimation, et que les conditions de regularite du systeme sont lesmemes pour tous les coefficients, et les memes que pour le Krigeage.

La matrice de covariances des estimateurs A∗l se calcule facilement :

Cov [A∗t , A

∗l ] = Cov

α

λαt Zα,

β

λβl Zβ

=∑

α,β

λαt λ

βl Kαβ

(1)= −

α

λαt

s

µlsfsα

(2)= −

s

µls δst

(1) : d’apres les equations d’optimalite de l’estimation des al ;

(2) : d’apres les equations d’universalite de cette estimation.

D’ou finalementCov [A∗

t , A∗l ] = −µtl

4.2. Evaluation des coefficients : modele intrinsequePar une approche directe, c’est-a-dire en suivant pour chaque coefficientpris separement les etapes L.A.U.O. , ce probleme ne reserveaucune surprise : l’estimation des coefficients al (l 6= 0) se realisesans encombres, et celle de a0 est impossible, parce qu’il y a alorsincompatibilite entre autorisation et universalite. Rien que de tres

Page 112: g é o Statistique

110 Aide-Memoire de geostatistique lineaire :

previsible donc : nous savions que toutes les difficultes seraient focaliseessur le coefficient a0.

Il se presente pourtant une circonstance troublante. Si nous procedons acette estimation par identification, comme dans le paragraphe precedent,nous aboutissons a un formalisme unique pour l’estimation de tous lesal (l 6= 0) : seuls changent les seconds membres, qui dependent seulsde l’indice l du coefficient a estimer.

Plus precisement (cf. bibliographie), on peut montrer que :

A∗l = λα

l Zα (l 6= 0)

avec :

(∀l 6= 0)

−∑

βλβ

l γαβ +∑

s µl s fsα = 0 (∀α)

βλβ

l fsβ = δs

l (∀s)

etCov [A∗

t , A∗l ] = −µtl pour t 6= 0 et l 6= 0

Mais alors, d’un point de vue purement algebrique, il est parfaitement

Fasc. 5, p152.

Chauvet, 1982,paragraphes 3.4.2 & 3.4.3.

possible d’etendre ces systemes au cas de l’indice l = 0 : le nouveausysteme sera en effet tout aussi regulier que les autres, et l’on pourra doncconstruire une combinaison lineaire (que l’on pourra — abusivement —noter A∗

0) :A∗

0 = λα0 Zα

Il n’y a qu’un probleme, mais methodologiquement considerable : d’apresles conditions d’universalite,

α λα0 = 1 et donc A∗

0 n’est pas uneCombinaison Lineaire Autorisee. Quel sens est-il alors possible de luiI I I

donner dans le modele probabiliste ?

4.3. Le probleme du terme constantL’interpretation de ce pseudo-estimateur du terme constant a0 —ou mieux encore : de cet estimateur non autorise — necessite undetour methodologique assez important, dont nous n’esquisserons queles etapes. Pour les details de calcul, nous renvoyons au Fascicule 5.Fasc. 5, p176-186.

Le plan propose ici, quant a lui, suit pas a pas les etapes d’un coursChauvet, 1982,paragraphe 4.2.

precedent (cf. bibliographie).

4.3.1. Modele de Derive aleatoire

Jusqu’a present, nous avons astreint la Derive a etre deterministe dansle modele, pour anticiper les conditions d’une etude reelle.

Rien cependant dans la theorie n’impose un tel choix. Nous pouvonsdonc adopter un modele de dichotomie :

Z(x) = Y (x) + M(x)

ou, cette fois, M(x) soit une fonction aleatoire a qui nous n’imposonsmeme pas d’etre independante de Y (x). En revanche, nous exigeonstoujours de M(x) un certain caractere de regularite, suffisant memepour que la covariance croisee de Y et de M accepte un developpementlimite selon une famille de fonctions de base f l. On se place donc icidans le cadre d’un modele Sous-Jacent stationnaire.

4.3.2. Estimation d’une Derive aleatoire

Grace a ces hypotheses de regularite, il est possible de construire unsysteme d’estimation optimale d’une telle derive aleatoire. L’interet

Page 113: g é o Statistique

[7] – Vers les modeles non stationnaires 111

de ce calcul, par ailleurs tres simple, est de montrer la puissance desconditions d’universalite :

λα f lα = f l

x

qui a elles-seules filtrent tout ce qui ne releve pas du seul modele Sous-Jacent, c’est-a-dire tout ce qui dans le modele depend d’autre chose quede la Fonction Aleatoire Y .

Conclusion : sous reserve seulement de certaines conditions de regularite,nous savons estimer une Derive aleatoire pour un modele Sous-Jacentadmettant une covariance.

4.3.3. Premiere estimation d’une moyenne mobile

Soit maintenant une fonction aleatoire Z, strictement intrinseque sans Donc, Z n’admet pas decovariance dans le modele.

Derive. Soit par ailleurs une fonction de ponderation p, de poids total1, ayant les proprietes de regularite requises. Posons :

M(x) = Z ∗ p

Y (x) = Z(x) −M(x)

On admettra que M(x) ait les proprietes de regularite exigees au §4.3.2,et on la considerera donc comme une Derive aleatoire. Quant a Y (x),c’est une CLA (son poids total est nul), donc elle admet une covariance.Nous sommes donc dans les conditions de calcul prevues au §4.3.2 pourestimer M(x) en tant que Derive aleatoire.

On etablit que, dans cette perspective, l’estimateur de M(x) ne depend J J J

pas de p, c’est-a-dire que, les conditions de regularite etant suffisantes,p n’intervient pas sur le resultat. En fait, seule la Variance d’Estimationde M depend de p, et encore la contribution de p est-elle focalisee surla variance du terme constant A0.

4.3.4. Seconde estimation d’une moyenne mobile

Mais on peut aussi simplement considerer M(x) comme une convolueede Z, et l’estimer par Krigeage, a l’aide du theoreme sur la superpositiondes figures de Krigeage. Il n’y a plus alors de conditions d’universalite,mais il apparaıt une condition d’autorisation, parce que Z estpar hypothese intrinseque stricte. Quant a la solution, elle dependevidemment cette fois de la fonction de regularisation p, toujours d’apresla superposition des figures de Krigeage.

4.3.5. Element de reflexion

Nous renvoyons a la bibliographie pour une critique parallele des deux Voir Chauvet 1982,ou a titre d’exercicede reflexionsystemes obtenus aux deux paragraphes precedent.

Soulignons seulement que nous nous trouvons dans une situationexemplaire, ou un meme etre mathematique peut conduire a desestimations fondamentalement differentes, selon la perspective adoptee.Or, il faut bien se garder de voir la un piege, ou une devinette du typequel est le bon point de vue ?. C’est une situation normale, quin’appelle pas une reponse toute faite, mais qui requiert d’abord le senscritique et la responsabilite du Geostatisticien.

4.3.6. Retour au coefficient a0

Soit de nouveau le modele de la dichotomie :

Z(x) = Y1(x) + m1(x)

Page 114: g é o Statistique

112 Aide-Memoire de geostatistique lineaire :

ou Y1(x) est intrinseque strict et m1(x) deterministe. Cette secondecondition n’est pas indispensable, mais on retrouve ainsi les conditionsexactes des §3.5 et 4.2.

Soit encore une fonction de ponderation p, de poids total 1, et ayant debonnes proprietes de regularite. On peut ecrire :

Z(x) = Y (x) + M(x)

avec :Y = Y1 − Y1 ∗ p

M = m1 + Y1 ∗ p

et :M(x) = Al f

lx

(cette derniere expression grace aux bonnes proprietes de p).

Alors, Y a une covariance, parce que c’est une CLA. On peut construirel’estimateur optimal de tous les coefficients de la Derive Al, et constaterA titre d’exercice...

que ces estimateurs ne dependent pas de la fonction de ponderationp. Bien plus, ces systemes d’estimation sont tres exactement ceux quel’on aurait obtenus en estimant les coefficients de la Derive m1, apresaddition du systeme correspondant au terme constant ao.

Exprimons ce resultat a l’envers. Nous avons reussi a donner un sens al’operation — purement algebrique et a priori scabreuse — consistantParagraphe 4.2.

a etendre a l’indice l = 0 les systemes d’estimation des al en modeleintrinseque strict. Le A∗

0 ainsi construit a donc le sens d’une moyenneponderee, de structure reguliere, mais sans que l’on connaisse exactementla forme de la ponderation : ce qui n’est d’ailleurs pas tres important,puisque le resultat ne depend pas de cette ponderation, et que seule savariance en est affectee. L’estimateur non autorise A∗

0 peut donc etreinterprete et, dans une etude reelle, on est desormais fonde a le calculer.

4.3.7. Dernier regard sur la Derive

Voila tout de meme bien des detours pour arriver a resoudre un problemeque nous aurions prefere ne pas voir se poser. Car enfin, le praticiensait bien empiriquement distinguer entre deux Variables Regionaliseesdifferant d’une constante, et il aurait des raisons d’etre perplexe devantdes etres mathematiques qui, eux, ne savent pas faire cette distinction.

Quant a mettre en jeu tant de subtilites pour en conclure que la constantede la Derive — qui n’existe pas dans le modele — a le sens d’une moyenneponderee locale, cela peut sembler superflu.

Nous pensons quant a nous plutot voir dans ces difficultes uneconsequence ineluctable de la dichotomie qui nous a servi de pointde depart. Le paragraphe precedent est tres clair sur ce point : unememe Fonction Aleatoire peut etre cassee en deux de maintes faconsdifferentes, et les modeles correspondants peuvent egalement etre tresdivers — voire contradictoires. La cesure entre ce qui serait aleatoire etce qui serait deterministe n’est en general pas pertinente. C’est pourquoiil semble preferable de tenter une autre approche des phenomenes nonstationnaires, ce que nous ferons dans le prochain chapitre.

5. Complement sur les systemes du Krigeage Universel

5.1. Hypothese et notationsDans toute la suite du chapitre, nous supposerons la matrice du KrigeageUniversel reguliere. Par ailleurs, nous nous placerons ici dans le cadre

Page 115: g é o Statistique

[7] – Vers les modeles non stationnaires 113

d’un modele Sous-Jacent stationnaire, c’est-a-dire que nous supposeronsl’existence d’une matrice de covariance K.

Soit alors le systeme general :

βλβ Kαβ + µs f

sβ = 0 (∀α)

βλβ f l

β = Rl (∀l)

ou (Rl ) est un vecteur libre quelconque. Ce systeme, dont le systemeest identique au systeme de KU, est regulier par hypothese.

5.2. Matrice inverse du Krigeage UniverselDe l’ecriture matricielle

(

Kαβ fsα

f lβ 0

)(

λβ

µs

)

=

(

0

Rl

)

on peut deduire

(

λβ

µs

)

=

(

Bεβ cβt

cεs νst

)(

0

Rt

)

ou encore :λβ = cβt R

t

µs = νstRt

ou les matrices [B], [c] et [ν] sont caracterisees par le systeme

(

Kαβ fsα

f lβ 0

)(

Bεβ cβt

cεs νst

)

= I

soit explicitement :

Bεβ Kαβ + cεs fsα = δε

α (∀ε, ∀α) [1]

cβt Kαβ + νst fsα = 0 (∀t, ∀α) [2]

Bεβ f lβ = 0 (∀ε, ∀l) [3]

cβt flβ = δl

t (∀l, ∀t) [4]

On remarque alors que le jeu des equations [2] et [4], qui peut s’ecrirematriciellement (∀t)

(

Kαβ fsα

f lβ 0

)(

cβt

νst

)

=

(

0

δlt

)

n’est autre que le systeme d’estimation du coefficient at de la derive. Etcomme ce systeme est regulier, on verifie bien

cβt = λβt

νst = µst

avec les notations du §4.1. Cequi permet ainsi de preciser la compositionde la matrice inverse du KU :

(

Kαβ fsα

f lβ 0

)−1

=

(

Bεβ λβt

λεs µst

)

Page 116: g é o Statistique

114 Aide-Memoire de geostatistique lineaire :

5.3. Consequence : additivite des estimationsAppliquons cette expression de la matrice inverse au Krigeage Universelproprement dit :

Z∗U(x) = λβ

U(x)Zβ

avec(

Kεβ fsε

f tβ 0

)(

λβU(x)

µU s(x)

)

=

(

Kεx

f tx

)

On a doncλβ

U(x) = Bεβ Kεx + λβ

t ftx

et

Z∗U(x) = Zβ

(

Bεβ Kεx

)

+ Zβ λβt f

tx

= Zβ

(

Bεβ Kεx

)

+ A∗t f

tx

en reprenant les notations de l’estimation des at. Alors,

Z∗U(x) −A∗

t ftx = Zβ B

εβ Kεx

(1)= Zβ B

εβ(

λαS(x)Kαε

)

(2)= λα

S(x)Zβ

(

δβα − λβ

s fsα

)

= λαS(x)Zα − λα

S(x) fs

α A∗s

= λαS(x)(

Zα −A∗s f

)

(1) : d’apres les equations du Krigeage Simple ;Chapitre 6,paragraphe 3.3.1.

(2) : d’apres les equations [1] et l’egalite cβt = λβt .

En resume,

Z∗U(x) −M∗

x = λαS(x)(

Zα −M∗α

)

[5]

ce qui peut s’exprimer de facon encore plus concise : on a le droit dekriger (au sens du Krigeage Simple) les residus estimes optimaux commes’il s’agissait des residus vrais.

Remarque : il est evident que cette propriete d’additivite disparaıt si onI I I

utilise pour l’estimation de la derive m(x) un estimateur non optimal(moindres carres, splines, etc. ).

Enfin, en explicitant les estimationsM∗(x) etM∗α, cette premiere partie

du theoreme d’additivite peut encore s’ecrire :

Z∗U(x) = Z∗

S(x) +

l

A∗l

(

f lx −

α

λαS(x)f l

α

)

Page 117: g é o Statistique

[7] – Vers les modeles non stationnaires 115

5.4. Correction de Derive

PosonsZ

∆(x) = Z∗

U(x) − Z∗

S(x) [6]

Comme Z∗S(x) = λα

S(x)Zα, on deduit de [5]

Z∆(x) = M∗(x) − λα

S(x)M∗

α

Cette quantite est appelee terme de correction de derive. On note que,comme difference des estimateurs du KU et du KS, ce terme est unecombinaison lineaire des donnees :

Z∆(x) =

(

λαU(x) − λα

S(x))

Si alors on pose λα∆

= λαU− λα

S, il est immediat de verifier que les λα

∆ Un exercice elementaire,qui s’apparente a lasuperposition des figuresde Krigeage,Chapitre 6,paragraphe 3.4.2.

satisfont le systeme

(

Kαβ fsα

f lβ 0

)(

λβ∆

µ∆s

)

=

(

0

f lx − λε

S(x) f l

ε

)

systeme qui, a l’expression des fonctions du second membre pres, aexactement la structure d’un systeme d’estimation de la Derive. Cesysteme est ici par hypothese regulier, et donc caracterise le vecteur(

λβ∆

µ∆s

)

. Plus explicitement, on peut conclure, en se reportant aux

systemes d’estimation des coefficients de la derive : Paragraphe 4.1.

λβ∆(x) =

l

λβl

(

f lx −

α

λαS(x)f l

α

)

µ∆s(x) =

l

µls

(

f lx −

α

λαS(x)f l

α

)

et on retrouve ainsi

Z∆(x) =

β

λβ∆(x)Zβ =

l

A∗l

(

f lx −

α

λαS(x)f l

α

)

[7]

5.5. Additivite des variances

De [6], qui s’ecrit aussi Z∗U(x) = Z∆(x) + Z∗

S(x) , on tire

immediatement

Var[

Z∗U(x) − Zx

]

= Var[

Z∗S(x) − Zx + Z∆

]

= Var[

Z∗S(x) − Zx

]

+ Var [Z∆] + 2Cov

[

Z∗S(x) − Zx, Z∆

]

Mais les proprietes d’orthogonalite du Krigeage entraınent que l’Erreur Paragraphe 2.4.4.

de Krigeage Simple est de covariance nulle avec toute combinaisonlineaire des donnees, et donc en particulier avec Z

∆. Finalement,

Var[

Z∗U(x) − Zx

]

= Var[

Z∗S(x) − Zx

]

+ Var [Z∆]

Page 118: g é o Statistique

116 Aide-Memoire de geostatistique lineaire :

ou plus simplement, avec les notations usuelles :

σ2U(x) = σ2

S(x) + Var [Z∆ ]

ce qui prouve au passage que

σ2U(x) ≥ σ2

S(x)

En explicitant Z∆ par [7], on obtient pour developpement de

Var [Z∆] = Var

[

l

A∗l

(

f lx −

α

λαS(x)f l

α

)

]

la somme double

l,s

(

(

f lx −

α

λαS(x)f l

α

)

)

Cov [A∗l , A

∗s ]

(

(

fsx −

β

λβS(x)fs

β

)

)

c’est-a-dire, d’apres l’expression de la matrice de covariance desParagraphe 4.1.

estimateurs A∗l :

Var [Z∆] = −

l,s

(

f lx −

α

λαS(x)f l

α

)

µls

(

fsx −

β

λβS(x)fs

β

)

et donc finalement

σ2U

= σ2S

−∑

l,s

(

f lx −

α

λαS(x)f l

α

)

µls

(

fsx −

β

λβS(x)fs

β

)

ce qui constitue, en termes de variances, la seconde partie de l’enoncedu theoreme d’additivite.

5.6. CommentairesOn pourra s’assurer que ce theoreme d’additivite susbsiste dans le casVoir annexe en seconde

partie de document.intrinseque strict.

Par ailleurs, il ne faut evidemment pas croire que ce theoreme autorisel’economie d’un systeme de type Krigeage Universel. Car l’estimationde M∗ requiert de toute facon un tel systeme, de dimension egale ala somme nombre de donnees + nombre de fonctions de base. Ilserait bien sur faux de proceder a une estimation ad hoc de la derive,puis ensuite de se contenter d’un Krigeage Simple sur les residus (nonoptimaux) ainsi construits. Autrement dit, ce theoreme d’additivite nesemble pas presenter d’interet pratique. En revanche, il peut eclairercertaines approches theoriques, comme on le verra par exemple lors del’etude de l’equivalence Splines-Krigeage.

6. Etapes et problemes de l’Analyse VariographiqueNous avons jusqu’a present admis que le modele structural etait connu.Nous savons que c’est la une situation utopique, puisqu’il n’est pas

Page 119: g é o Statistique

[7] – Vers les modeles non stationnaires 117

possible de connaıtre la vraie Derive, ni meme d’en avoir l’estimateuroptimal. Force nous est de nous rabattre sur des estimateurs moinsperformants. Encore faudra-t-il ensuite etablir quelles sont les relationsentre le modele Sous-Jacent — ideal inaccessible — et la fonctionstructurale de ces residus estimes.

6.1. L’estimateur des moindres carres

Commencons par proposer un estimateur classique que l’on peutenvisager pour la Derive. L’estimateur des moindres carres de al f

lx

est de la forme :

M∗(x) = a∗l flx

avec des a∗l qui realisent le minimum de la forme quadratique :

Vraie dans lemodele, et encore !...

Fasc. 5, p62-167.

α

(

zα − a∗l flα

)2

On en deduit immediatement (∀s):

a∗l

(

α

fsα f

)

=∑

α

fsα zα

Il faut evidemment choisir des fonctions de base telles que la matrice :

T sl =

(

α

fsα f

)

admette un inverse Ssl. Alors :

a∗l = Ssl

(

α

fsα zα

)

ou encore :a∗l =

α

zα (Ssl fsα)

Placons-nous pour simplifier dans le cas ou Z(x) admet une covariance.Dans le modele probabiliste, cette expression de a∗l se transpose en

A∗l = λα

l Zα

avec :λα

l = Sls fsα

Alors :

λαl f

tα =

α

Sls fsα f

tα = Sls T

st = δtl

— la seconde egalite par definition de la matrice T , et la troisieme parceque T est inverse de S. Ainsi, les λα

l construits par les moindres carressatisfont aux conditions d’universalite.

Il s’ensuit immediatement que si on designe par al les vrais coefficients dela Derive — c’est-a-dire si nous avons dans le modele E [Z(x)] = al f

lx,

alors :E [A∗

l ] = al

Page 120: g é o Statistique

118 Aide-Memoire de geostatistique lineaire :

L’estimateur des moindres carres est donc un estimateur sans biais dela Derive. Il n’est en revanche en general pas optimal2 .

Nous venons donc de fournir un exemple de construction d’un estimateuruniversel non optimal. Une telle construction, par nature, n’a pas besoinde connaıtre la fonction structurale, donc permet de rompre le cerclevicieux rencontre jusqu’ici.

6.2. Le variogramme des residusSupposons maintenant que nous disposions d’un certain estimateuruniversel, en general non optimal, de la Derive A∗

l flx. Ipso facto, nous

disposons d’un estimateur des residus :

R∗(x) = Z(x) − A∗l f

lx

dont nous pouvons exprimer le variogramme (ou eventuellement lacovariance). La question fondamentale est d’etablir le lien existant entrece variogramme des residus, et le Variogramme Sous-Jacent.

Cette comparaison est la pierre angulaire d’une Analyse Variographique.Car d’une part, il y a le modele Sous-Jacent, inaccessible, mais qui estrequis par les equations du Krigeage. Et d’autre part, le Variogrammedes Residus, qui est accessible experimentalement puisque, des lors quenous disposons d’un algorithme quelconque d’estimation universelle dela Derive, nous savons construire des residus experimentaux (ou plutotdes residus estimes).

Une observation elementaire doit nous rendre a priori pessimistes quantI I I

a la possibilite de legitimer une identification entre Variogramme desResidus et Variogramme Sous-Jacent. Supposons en effet que le modeleSous-Jacent soit intrinseque strict, donc sans covariance. Soit par ailleursun estimateur de la Derive A∗

l flx avec

A∗l = λα

l Zα et λαl f

tα = δt

l

a cela pres quelconque : on verifie alors immediatement que le residuestime R∗(x) est une combinaison lineaire autorisee, donc admet unecovariance. Il y a donc a priori loin des proprietes des residus vrais auxproprietes des residus estimes.

6.3. Problemes de biaisPlacons-nous dans le cas le moins restrictif du modele Sous-Jacentintrinseque. Nous renvoyons a la bibliographie pour le calcul detaille duVariogramme des Residus. Ce calcul est sans difficulte, mais necessiteFasc. 5, p155-157 ;

Matheron 1970.cependant une remarque.

N’oublions pas que l’estimation de la Derive est une operation locale.Les donnees Zα utilisees pour estimer M∗(x) sont prises dans uncertain voisinage de x. Pour chaque jeu de donnees, regroupees en unvoisinage, on dispose d’un estimateur de la Derive, donc d’un jeu deresidus experimentaux, sur lesquels on peut calculer un VariogrammeExperimental local. Puis on procede par Voisinages Glissants et on faitsur l’ensemble du Champ la moyenne des variogrammes locaux. C’estcette moyenne que nous souhaitons comparer au modele Sous-Jacent.

Nous devons a priori nous attendre a un probleme au cours de cetteI I I

comparaison puisque dans le variogramme des residus apparaıt unparametre — le voisinage utilise pour l’estimation de la Derive — qui esttotalement absent du modele Sous-Jacent. Et de fait, des calculs sansdifficulte aboutissent a un resultat peremptoire : dans tous les cas, le

2On demontre cependant qu’il est optimal dans le cas particulier d’un phenomene

Sous-Jacent pepitique pur (bruit blanc).

Page 121: g é o Statistique

[7] – Vers les modeles non stationnaires 119

Variogramme des Residus presente un biais systematique par rapportau Variogramme Sous-Jacent : le Variogramme des Residus est toujoursinferieur au Variogramme Sous-Jacent.

Ajoutons immediatement que cette situation subsisterait meme si, parmiracle, nous pouvions proposer l’estimateur optimal de la Derive.Autrement dit, le mal n’est pas du a ce que la Derive estimee n’estpas la meilleure possible, mais simplement a ce que l’on a recours aune estimation. Il s’agit ici veritablement d’une difficulte fondamentale,essentielle et insurmontable.

Le danger pour un neophyte est d’autant plus grand que ce biais va dans

J J J

le sens d’une apparente destructuration. Nous avions deja releve qu’il faitapparaıtre un palier, meme si le modele Sous-Jacent n’en a pas. Maisbien plus, l’experience montre que le Variogramme des Residus presentetoujours une portee tres courte : il s’agit la d’un pur artefact, puisquece resultat est bien plus revelateur de la taille du voisinage de travailque de la structure profonde du phenomene. Le danger est reel, si onne presente pas assez d’esprit critique, de conclure que le phenomenese reduit a la somme d’une Derive et d’un bruit de fond. Quelles quesoient les tailles de voisinage utilisees, on aura l’impression fallacieuseque la dichotomie proposee a l’Analyse Variographique est satisfaisante :le modele du Krigeage Universel estauto-justifiant. J J J

6.4. Problemes d’indeterminationLe biais est si considerable que, du modele Sous-Jacent, seul subsiste lecomportement a l’origine au niveau du Variogramme des Residus.

Cela pourrait n’etre pas trop grave si au moins on connaissait laregle de transformation permettant de passer de l’un a l’autre de cesvariogrammes. Du reste, cette regle existe en partie : il est, en effet,facile d’exprimer le Variogramme des Residus a l’aide du VariogrammeSous-Jacent ; la relation figure dans la formule du biais. Matheron 1970.

Malheureusement, cette relation n’est pas une bijection : il existe touteune classe de modeles Sous-Jacents admissibles differents correspondanta un Variogramme des Residus donne. Or, bien sur, c’est dans ce sens-laque la relation nous aurait interesses en pratique ; nous aurions voulupouvoir associer, par un algorithme direct, un et un seul VariogrammeSous-Jacent a un Variogramme des Residus donne, mais cela est doncsans espoir : nous nous heurtons a une indetermination fondamentale.Nous renverrons une nouvelle fois a la bibliographie pour une analyse Matheron 1970.

theorique fine de cette indetermination.

6.5. Conclusion provisoireTout ou presque reste a faire finalement pour une mise en pratiquedu Krigeage Universel, du moins en ce qui concerne la Variographie.Non seulement nous n’avons pas reellement trouve de reponse au cerclevicieux du Krigeage Universel, mais nous avons meme etabli que pouvoirresoudre cette question ne serait pas suffisant. Une nouvelle fois, c’est leparti-pris de dichotomie qui est en cause.

Cependant, ce pessimisme doit etre un peu tempere. On pourras’en assurer en parcourant la bibliographie, qui temoigne d’etudeseffectivement conduites en Krigeage Universel. Ce que nous voulonsplaider ici, c’est que le Krigeage Universel — en depit de sa presentationassez naturelle — demande en fait une reelle subtilite pour sa mise enœuvre, et offre de nombreuses chausse-trappes a l’utilisateur imprudent.Et nous n’arrivons pas a imaginer un programme informatique dequelque generalite qui pourrait proposer une Analyse Variographiquesure dans la perspective d’un Krigeage Universel.

Nous aimerions que toutes ces remarques soient prises dans un sensconstructif. D’abord parce que la reflexion sur le Krigeage Universel

Page 122: g é o Statistique

120 Aide-Memoire de geostatistique lineaire :

constitue une bonne gymnastique du sens critique. Ensuite parce quec’est la volonte de surmonter ces difficultes qui a conduit a proposer uneautre approche des phenomenes non stationnaires ; et la GeostatistiqueIntrinseque, presentee au chapitre suivant, ne doit pas etre ressentiecomme une negation du Krigeage Universel, mais au contraire commeune generalisation qui permet du meme coup de progresser dans laresolution — ou au moins la comprehension — des problemes.

Les developpements theoriques du formalisme du Krigeage UniverselCommentaires

sont particulierement riches, et nous avons volontairement laisse de coteun certain nombre de resultats interessants, mais dont l’accumulation denotations aurait peut-etre deroute pour une premiere lecture.

C’est ainsi que nous n’avons pas demontre ce resultat, pourtant essentielpour le travail en Voisinage Glissant, que les estimateurs optimauxse transforment comme les vrais coefficients lors d’une transformationFasc. 5, p153-155.

lineaire reguliere sur les fonctions de base : ce qui signifie que l’estimationCe theoreme n’estevidemment plus vrailorsqu’il s’agit d’unetransformation non

bijective, comme parexemple une projection.

de la Derive n’est pas affectee par une telle operation lineaire. Cettepropriete est capitale, puiqu’elle a pour consequence que la separationestimee Derive–Residus est independante de cet element arbitraireque constitue le choix du repere des coordonnees.

L’examen du Krigeage comme interpolateur est renvoye au chapitresuivant, ainsi que la comparaison a l’estimateur du maximum devraisemblance. Nous reservons egalement a plus tard (chapitre 9) letravail multivariable, qui en particulier se repercute sur la conditiond’independance lineaire des fonctions de base.

En conclusion de ce chapitre, nous souhaiterions avant tout que le lecteurConclusionseulement partielle !

ne se laisse pas rebuter par les difficultes techniques reelles rencontreesen theorie et pratique du Krigeage Universel, et ne s’imagine pas que lesdiscussions esquissees ici ne sont que subtilites d’esthetes. Les problemesde fond sont reels, existent, et le praticien ne manquera pas de lesrencontrer un jour ou l’autre sur son chemin. Libre a chacun, alors,de juger ces questions superflues ; une telle attitude peut peut-etrerassurer le neophyte, voire attirer le client. Mais, pour le scientifique oule pedagogue, force est de constater que nier un probleme n’est jamaissynonyme de le resoudre. . .

Il n’est pas necessaire pour ce chapitre de multiplier les citationsBibliographie

bibliographiques. La premiere reference qui s’impose est bien sur leChapitre 4 du Fascicule 5. Rappelons toutefois que les notations ydifferent parfois de celles du present expose, en particulier en ce quiconcerne la definition des multiplicateurs de Lagrange qui apparaissentdans les systemes de krigeage.

L’ensemble des equations rencontrees dans ce chapitre a ete consignedans un cours de Krigeage Universel (qui reprend le programme d’uneEcole d’Ete en 1982) :

• Universal Kriging, P. Chauvet & A. Galli, 1982.

texte en anglais qui ne rajoute rien a la reference precedente, maisdont nous avons a peu pres suivi le plan dans le present chapitre. Parailleurs, ce document detaille les mecanismes d’estimation pour une

Page 123: g é o Statistique

[7] – Vers les modeles non stationnaires 121

Derive aleatoire, et precise l’expression du biais dans le Variogrammedes Residus.

Enfin, pour une approche plus complete, nous renvoyons a :

• Le Krigeage Universel, G. Matheron, 1969.

plus developpe au niveau theorique (espaces de Hilbert), mais quiegalement consacre tout un chapitre a l’estimation des parametres etau controle des hypotheses.

Se reporter, en deuxieme partie du document, aux chapitres Annexe

• Complements sur le theoreme d’additivite.

• Aspect dual du Krigeage Universel.

Page 124: g é o Statistique

122 Aide-Memoire de geostatistique lineaire :

Page 125: g é o Statistique

Chapitre 8

Geostatistique Intrinseque

Presentation

Nous allons maintenant elargir l’acception du mot intrinseque,de facon a regrouper les differents modeles rencontres jusqu’ici enun formalisme unique.

Au premier paragraphe, on explicite la seconde approche possibledes phenomenes non stationnaires. C’est la notion fondamentalede Representation qui permet de faire le lien entre le modeleprobabiliste et le modele primaire.

Le second paragraphe, tres bref parce que sans demonstration,enonce le theoreme fondamental de la Geostatistique Intrinseque.

Au troisieme paragraphe, le Krigeage Intrinseque se presente toutnaturellement, selon la demarche desormais habituelle. C’est icil’occasion d’exprimer en toute generalite les conditions necessaireset suffisantes de regularite du systeme.

La presentation duale du krigeage autorise au quatriemeparagraphe une approche non probabiliste des formulationsprecedentes et permet d’etablir l’equivalence splines–krigeage.

1. Introduction aux FAI-k

1.1. Idee directriceRevenons au choix propose au chapitre precedent pour l’examen des Chapitre 7,

paragraphe 1.2.phenomenes non stationnaires. Nous cherchons cette fois une alternativeau modele de la dichotomie, et l’idee directrice est de proposerune transformation de la Variable Regionalisee (respectivement : dela Fonction Aleatoire) qui puisse nous ramener a quelque chosede stationnaire. L’arriere-pensee est evidemment de resoudre — oud’esquiver — les reelles difficultes que nous avons rencontrees dans lemodele de la dichotomie.

En fait, on peut se convaincre que cette idee de transformer les donneesn’a rien de nouveau. C’est exactement ce que nous avons deja fait enpassant du modele stationnaire d’ordre 2 au modele intrinseque : au lieude travailler sur les variables Z(x) elles-memes, qui sont des variablesdefinies en chaque point de l’espace euclidien E de reference, nous noussommes interesses a des accroissements Z(x)−Z(y), variables definiescette fois sur des paires de points de l’espace E ou, mieux encore,variables definies en tout point de l’espace abstrait E × E. Ce quenous voulons dire surtout, c’est que pour pouvoir etudier une gammeplus large de phenomenes (des Fonctions Aleatoires sans variances, enl’occurrence), nous avons du changer l’objet meme de l’etude. Est-ilpossible de generaliser cette demarche ? Pour la suite de

cet expose, voirMatheron, 1971.

1.2. Vers des Combinaisons Lineaires AutoriseesEn realite, dans la demarche de la Geostatistique Lineaire, ce qui nousinteresse est de pouvoir acceder a la variance d’une expression lineairede la Fonction Aleatoire.

Page 126: g é o Statistique

124 Aide-Memoire de geostatistique lineaire :

Dans le modele stationnaire, aucune contrainte ne se presente, et toutecombinaison lineaire admet une variance :

Var[

λi Zi

]

= λi Kij λj

L’outil elementaire est la covariance K, dont l’expression ci-dessuspourrait d’ailleurs fournir une definition operationnelle, mais qui estI I I

plus classiquement definie par :

Kij = Cov [Zi, Zj ]

Dans le modele intrinseque strict, nous sommes astreints a ne travailler

Rappelons que nous avonschoisi de ne pas parler desproblemes de convergencerencontres eventuellement

pour des mesures asupport non borne.

que sur des combinaisons lineaires de poids total nul : λi Zi = 0, c’est-a-dire sur un sous-ensemble des CLA du modele stationnaire. Alors :

Var[

λi Zi

]

= −λi γij λj

ou par ailleurs γ est defini par :

γij =1

2Var [Zi − Zj ]

L’outil ainsi caracterise permet bien le calcul des variances des CLA.Mais a l’inverse, on a vu qu’il serait possible de prendre pour definitiondu variogramme toute fonction qui assurerait l’egalite :

Var[

λi Zi

]

= −λi γij λj

et qu’alors, une certaine indetermination affecterait γ, sans d’ailleursI I I

en affaiblir l’efficacite operatoire.

La question de la generalisation du modele intrinseque strict se posealors ainsi : peut-on trouver des familles plus exigeantes encore de CLAtelles que, pour toute mesure λi appartenant a ces familles, il existe unefonction structurale K assurant que :

Var[

λi Zi

]

1) existe,

2) et s’exprime par : λi Kij λj

Et comme de toute facon, au niveau de l’Analyse Variographique, nous

I I I

serons amenes a faire une hypothese de stationnarite sur les CLA, nouspouvons tout de suite contraindre cette super fonction structuraleK a verifier :

Kij = K(| xi − xj |)

En resume :

On voudrait retrouver tous les attributs de lastationnarite d’ordre 2, mais sur une classe plusreduite de combinaisons lineaires.

1.3. Definition des CLAkAinsi, non seulement on exige que ces (futures) CLA aient une variance,mais on veut de plus qu’elles soient stationnaires d’ordre 2.

Cette contrainte est lourde de consequences. Car la stationnarited’ordre 2 implique que les deux premiers moments soient invariantspar translation, ce qui suppose deja que le translate d’une CLA soit

Page 127: g é o Statistique

[8] – Geostatistique Intrinseque 125

encore une CLA. Precisons ce point : soit une mesure λ, c’est-a-direpour simplifier un systeme de poids λi associes a des points xi, et soit

la combinaison lineaire autorisee notee Z :

Z(λ) = λi Z(xi)

Pour pouvoir definir une stationnarite d’ordre 2, c’est-a-dire pour assurerl’equivalence1

Z(λ) ≡ Z(τhλ) (∀h)

encore faut-il que Z(τhλ), fonction aleatoire en h definie par la

La simplification tientau nombre fini de pointsd’appui. Le passage aucontinu ne poserait pasde probleme particulierde comprehension.

combinaison lineaire λi Z(xi + h), soit egalement une CLA — ce quin’a rien d’evident.

De fait, on exige une propriete non triviale : la stabilite par translation J J J

de la famille des CLA. On peut montrer que cette condition entraıne queles mesures λ soient telles que :

λi f li = 0 (ou, en notation continue :

λ(dt) f l(t) = 0)

ou l’ensemble des f l constitue une famille complete d’exponentielles-polynomes, c’est-a-dire :

• soit des polynomes — en pratique, ce sera une famille complete demonomes de degres inferieurs a une valeur fixee ;

• soit des exponentielles, eventuellement complexes, de formeslineaires sur les coordonnees ;

• soit une combinaison lineaire de produits des deux famillesprecedentes.

On retrouve exactement la structure des contraintes rencontrees dansle Krigeage Universel ; la nouveaute essentielle est que cette fois, cescontraintes ont le sens de conditions d’AUTORISATION . J J J

Dans la pratique, on prendra presque toujours comme fonctions debase la famille complete de monomes de degre inferieur a un degre k.Les Combinaisons Lineaires Autorisees associees a cette famille serontappelees Combinaisons Lineaires Autorisees d’ordre k (CLA-k).Dans certains cas beaucoup plus rares, on pourrait aussi prendre unefamille complete (i.e. : globalement stable par translation) de fonctionstrigonometriques.

La notion de CLA-k est independante de toute interpretationprobabiliste : par exemple, si z∗(x) est l’estimateur des moindres carresde z(x) par un polynome de degre k, l’erreur z∗(x) − z(x) est uneCombinaison Lineaire Autorisee d’ordre k. Une verification facile,

proposee a titre d’exercice

1.4. FAI-k et representation

1.4.1. Notations

Nous designerons par Λk l’ensemble (qui a une structure d’espacevectoriel) des Combinaisons Lineaires Autorisees d’ordre k :

λ ∈ Λkdef.⇐⇒

λ(dt) f l(t) = 0

1 Equivalence signifiant ici : existence et egalite des deux premiers moments de

chacun des termes de la relation.

Page 128: g é o Statistique

126 Aide-Memoire de geostatistique lineaire :

ou, en notation discrete :

λ ∈ Λkdef.⇐⇒ λi f l

i = 0

f l designant ici un monome de degre ≤ k.

Nous respecterons une distinction de notations entre la FonctionAleatoire Z(x), definie sur l’espace euclidien de travail (l’espace

geographique usuel), et la Fonction Aleatoire Z(λ), definie surl’espace Λk, et reliee a Z(x) par :

Z(λ) = λi Zi =∑

i

λi Z(xi)

Alors, selon que l’on se refere a Z ou a Z, deux definitions peuvent etredonnees pour une Fonction Aleatoire Intrinseque d’ordre k. (FAI-k).

1.4.2. Premiere definition

On peut d’abord appeler Fonction Aleatoire Intrinseque d’ordre k uneFonction Aleatoire non stationnaire Z(x) telle que, pour toute mesureautorisee λ ∈ Λk, la combinaison lineaire λi Z(xi +h) soit stationnaired’ordre 2 en h. Cette definition presente l’avantage de garder lecontact avec la variable z(x) etudiee.

Remarque : on supposera toujours que l’esperance d’une CLA-k estI I I

nulle. On peut verifier tres facilement que si tel n’etait pas le cas, ilsuffirait de passer a l’ordre (k + 1).

1.4.3. Deuxieme definition

On peut aussi appeler FAI-k une application lineaire Z d’un espace Λk

de CLA-k dans un espace de Hilbert de Variables Aleatoires d’esperance

nulle, avec Z(τhλ) stationnaire en h.

1.4.4. Representation d’une FAI-k : definition

C’est a des objets de natures differentes que se referent les deuxdefinitions precedentes, aussi convient-il de faire un choix pour evitertoute ambiguıte. Pour cela, nous allons changer de denomination dans lapremiere definition, et dire qu’une Fonction Aleatoire (non stationnaire)

Z(x) est une representation d’une FAI-k Z siFAI-k est donc prisici au sens de la

deuxieme definition.

∀λ ∈ Λk : Z(λ) =

λ(dx)Z(x)

Si une telle relation peut etre etablie, l’interet pratique en sera grand,Nous ne sommes pasencore surs que cette

construction soit possible. puisque le pont sera etabli entre l’etre mathematique abstrait Z, objetdes etudes theoriques futures, et la Fonction Aleatoire non stationnaireZ(x) censee modeliser la Variable Regionalisee. Il nous faut donc etablirl’equivalence entre les deux definitions.

1.4.5. Equivalence entre les deux definitions de FAI-k

Il est immediat que la premiere entraıne la seconde. En effet, si pourtoute λ ∈ Λk la combinaison λi Z(xi+h) est par hypothese stationnaire

d’ordre 2 en h, on peut constater immediatement que Z, la FonctionAleatoire definie par :

Z(τhλ) = λi Z(xi + h)

satisfait tres exactement a la seconde definition.

La reciproque consisterait a savoir comment associer a toute FAI-k Z uneFonction Aleatoire non stationnaire satisfaisant a la premiere definition

Page 129: g é o Statistique

[8] – Geostatistique Intrinseque 127

— c’est-a-dire une Representation de Z. Mais il est en fait possible defaire mieux, et de donner la caracterisation de toutes les Representations

de Z : ce theoreme des Representations achevera la demonstration del’equivalence des deux definitions.

1.4.6. Theoreme des representations : enonce

Theoreme :

• Toute FAI-k Z admet des Representations.

• Si Z(x) est une de ces Representations, la classe de toutesles autres Representations Z1(x) est donnee par :

Z1(x) = Z(x) +Al fl(x)

ou les Al sont des Variables Aleatoires quelconques.

La demonstration de ce theoreme est donnee en annexe, et comporte les Voir deuxiemepartie du document.

etapes suivantes :

• existence — autrement dit, l’ensemble des Representations d’uneFAI-k donnee n’est pas vide : on construit une Representation

particuliere d’une FAI-k Z ;

• on montre que si Z est une Representation, la Fonction Aleatoiredefinie par Z1 = Z +Al f

lx en est aussi une ;

• puis on montre que siZ etZ1 sont deux Representationsd’une memeFAI-k, alors Z − Z1 = Al f

lx.

Ce theoreme permet de definir une relation d’equivalence sur l’espace desFonctions Aleatoires non stationnaires : deux FA non stationnaires serontdites equivalentes si elles different d’un polynome de degre k (lequelpolynome peut eventuellement etre aleatoire). Deux FA distinctes, maisequivalentes, ont ainsi le statut de deux Representations differentes dela meme FAI-k. Plus synthetiquement encore :

Une FAI-k s’identifie a la classe d’equivalencede ses Representations.

1.4.7. Application : caracteristiques intrinseques

Le lien entre Variable Regionalisee et modele probabiliste estdesormais etabli dans le cadre de la Geostatistique Intrinseque : uneVariable Regionalisee z(x) sera consideree comme Realisation d’UNE J J J

Representation Z(x) d’une FAI-k Z.

On appellera caracteristique intrinseque tout parametre du modeleprobabiliste qui ne depend que de la FAI-k et pas de celle de sesRepresentations dont la Realisation est l’objet de l’etude.

De facon un peu imagee, on peut dire que le traitement probabiliste estpurge de tout ce qui n’est pas Caracteristique Intrinseque. Autrementdit, il est vain (ou a tout le moins risque) de mener une etude sur unparametre du modele qui n’est pas Caracteristique Intrinseque puisque,pour pouvoir mener a bien cette etude, on va etre contraint d’utiliserdes informations hors-modele. L’exemple le plus eclatant peut etredonne en revenant a l’optique Krigeage Universel : la Derive est, de Rappelons que dans

le cadre du KU, cesconditions peuventavoir le sens deconditions d’universalite.

par sa nature meme, non-intrinseque ; elle est automatiquement filtreepar les conditions d’autorisation, et se trouve exclue ipso facto dudeveloppement probabiliste.

Page 130: g é o Statistique

128 Aide-Memoire de geostatistique lineaire :

1.4.8. Un exemple

Nous sommes maintenant en mesure d’interpreter la demarche duKrigeage Universel en termes de Geostatistique Intrinseque. A titred’illustration, examinons la figure ci-apres en fin de chapitre. A1 dimension, nous disposons de quatre Variables Regionalisees, que nouspouvons interpreter comme Realisations de quatre Fonctions Aleatoiresdifferentes. Les courbes (1) et (2) different d’une constante : elles sontindiscernables en termes de Fonctions Aleatoires Intrinseques Strictes,puisque le travail sur les accroissements filtre les constantes.

C’est ici le moment d’observer que l’approche intrinseque stricte asa place toute trouvee dans l’optique de la Geostatistique Intrinseque :une FA intrinseque stricte n’est autre qu’une Representation de FAI-0,et les CLA rencontrees dans le modele intrinseque strict (

i λi = 0)

sont des CLA-0.

Ainsi, les courbes (1) et (2) sont Realisations de deux Representationsdifferentes de la meme FAI-0. Les courbes (3) et (4) se deduisent de (1)par addition d’un polynome du 1er degre : ce sont donc des Realisationsde Representation de FAI-0 differentes, mais d’une meme FAI-1. Si l’onrevient a la notion de classe d’equivalence, on peut dire que la FAI-1 estce qu’il y a de commun aux quatre courbes presentees ici.

La courbe (4) possede un interet supplementaire : elle represente desresidus universels, pour une derive du premier degre, de la courbe (1).Ce sont tout aussi

bien des residus descourbes (2) ou (3). C’est la un resultat tout a fait general, qui eclaire d’un jour nouveau

la demarche du Krigeage Universel : la courbe initiale, et la courbedes residus universels par rapport a UNE derive de degre k, sontRealisations de differentes Representations d’une meme FAI-k. Commeessentiellement la demarche de la Geostatistique Intrinseque metdans le meme sac toutes les Representations, on comprend lesindeterminations rencontrees dans le Krigeage Universel, et on s’attenda les retrouver ici ; mais en revanche, les biais ne sont-ils pas evitables ?

1.4.9. Commentaire sur les CLA-k

Il peut sembler deroutant au debut de mettre en œuvre le modeleprobabiliste sur des etres aussi abstraits que les CLA-k. Mais aprestout, il n’y a rien la de bien nouveau : on oublie trop souvent que, enoperant sur des accroissements, les methodes intrinseques strictesavaient deja franchi le pas. On pourrait dire approximativement quel’on va travailler maintenant sur des accroissements generalises ; cetteterminologie est d’ailleurs totalement correcte dans le cadre d’un travaila 1 dimension, et illustre la similitude d’approche entre FAI-k et certainesVoir peut-etre

Chauvet, 1987 (b).methodes de series chronologiques.

Continuons cette interpretation peu rigoureuse. Accroissement esta rapprocher de derivee. Schematiquement, on pourrait dire qu’une

Fonction Aleatoire Z(x), Representation d’une FAI-k Z, n’est autrequ’une Fonction Aleatoire dont les derivees partielles d’ordre total(k + 1) sont toutes stationnaires. Les coefficients Al des polynomesegaux a la difference entre deux Representations d’une meme FAI-k, ontdonc la signification de constantes d’integration.

2. Covariances Generalisees : theoreme fondamentalRemarquons d’abord qu’une Combinaison Lineaire Autorisee d’ordre(k + 1) satisfait a fortiori les conditions d’une Combinaison LineaireAutorisee d’ordre k. On a donc l’inclusion :

Λk+1 ⊂ Λk

Ainsi, une fonction aleatoire Z stationnaire sur Λk sera a fortiori

stationnaire sur Λk+1 :

Page 131: g é o Statistique

[8] – Geostatistique Intrinseque 129

Une Fonction Aleatoire Intrinseque d’ordre kest aussi une Fonction Aleatoire Intrinsequed’ordre (k + 1)

et bien sur, par recurrence, elle est egalement une Fonction AleatoireIntrinseque de tous ordres superieurs.

2.1. Derive d’une FAI-kPar definition des FAI-k, toute CLA-k a ses deux premiers momentsstationnaires. Dans la definition, nous avons meme suppose quel’esperance etait nulle : nous travaillons sur des FAI-k sans derive. Paragraphe 1.4.3.

Affranchissons-nous pour un instant de cette contrainte. On demontre

alors que pour toute Representation de Z, sa projection sur l’espace Matheron, 1971, p15-17.

des invariants par translation est un polynome de degre au plus egal ak + 1. De plus, les termes de degre au plus egal a k dependent de laRepresentation : ce ne sont pas des Caracteristiques Intrinseques. Enrevanche, le polynome homogene de degre (k+ 1) est commun a toutesles Representations : c’est donc une Caracterisqique Intrinseque, appeleepar definition derive de la FAI-k, et c’est lui seul qui determine la valeurde l’esperance de toute Combinaison Lineaire Autorisee d’ordre k. Maisegalement, du fait qu’il est de degre (k + 1), il sera filtre par touteCombinaison Lineaire Autorisee d’ordre (k + 1). D’ou le resultat :

Toute FAI-k est une FAI-(k+1) sans derive.

ce qui justifie que nous ne travaillions que sur des FAI-k sans derive.

2.2. Covariance Generalisee : definitionDesignons par R

n l’espace de definition de la Variable Regionalisee z(x)

associee a la Fonction Aleatoire Intrinseque d’ordre k Z :

Une fonction K(h) definie sur Rn est UNE Covariance Generalisee

pour la Fonction Aleatoire Intrinseque d’ordre k notee Z, si

• ∀λ ∈ Λk : Var[

Z(λ)]

=

∫ ∫

λ(dx)K(x − y)λ(dy)

• K(h) = K(−h)

Si une telle fonction existe, elle complete l’arsenal dont nous avons besoin Mais pour le moment,nous ne savons pas sicette fonction existe.pour travailler a l’ordre 2 sur les FAI-k. Comme nous avons en effet

suppose que nous nous ramenons a des FAI-k sans derive, toutes lesesperances de CLA-k sont nulles ; et la definition ci-dessus permet lecalcul de toutes les covariances, puisqu’on peut en deduire aisement :

∀λ , µ ∈ Λk Cov[

Z(λ), Z(µ)]

=

∫ ∫

λ(dx)K(x− y)µ(dy)

Notons, toujours parce que Z est sans derive, que cette formule generalepeut s’ecrire indifferemment :

∀λ , µ ∈ Λk E[

Z(λ).Z(µ)]

=

∫ ∫

λ(dx)K(x − y)µ(dy)

Page 132: g é o Statistique

130 Aide-Memoire de geostatistique lineaire :

ce qui laisse pressentir ce que sera la demarche d’Analyse Variographiqueen FAI-k, par l’association usuelle entre esperance mathematique etlimite de moyenne spatiale.

2.3. Theoreme d’existence et d’unicite

Le theoreme fondamental de la Geostatistique Intrinseque s’enonce alorscomme suit :

Theoreme :

• Toute FAI-k admet au moins une Covariance Generalisee.

• La classe de toutes ses Covariances Generalisees s’obtienten ajoutant a l’une quelconque d’entre elles un polynomepair de degre ≤ 2k.

Ce theoreme est assez difficile a demontrer, et demande a mettre enœuvre la theorie des distributions ou les methodes d’analyse spectrale.Deux complications surgissent pour l’enoncer en toute generalite : le casmultidimensionnel est beaucoup plus difficile que le cas de R

1, et le casd’une FAI-k non differentiable est plus difficile que le cas differentiable.Nous renvoyons a la bibliographie pour l’examen de cette demonstration.Matheron, 1971

(b), p20-35.

Un resultat intermediaire est important en pratique. On demontre enMatheron, 1971(b), p32-33.

effet que le comportement de K(h) a l’infini est au plus en | h |2k+2.Mieux encore, la condition :

limh→∞

K(h)

| h |2k+2= 0

est necessaire et suffisante pour que la FAI-k Z soit sans derive. OnChapitre 5,paragraphe 1.4.

retrouve ici une generalisation d’un resultat connu en modele intrinsequestrict — modele qui, rappelons-le, correspond a k = 0.

2.4. Fonctions de type positif conditionnel

La definition de la Covariance Generalisee exprime une variance, doncune quantite toujours positive ou nulle. Ainsi :

∀λ ∈ Λk

∫ ∫

λ(dx)K(x − y)λ(dy) ≥ 0

Une fonction symetrique verifiant cette propriete est dite de type positifconditionnel. L’adjectif conditionnel se refere au fait que cetterelation n’est vraie que pour une gamme restreinte de mesures λ. Etcomme Λk+1 ⊂ Λk, il s’ensuit qu’une fonction de type positif a l’ordrek l’est a fortiori a l’ordre k + 1 : on retrouve tout simplement laJustification de la notation

K adoptee dans leschapitres precedents. generalisation du passage de la Covariance stationnaire K a −γ.

Remarque : notons au passage le caractere un peu hybride duvariogramme puisque, en l’occurrence, c’est −γ (et non γ lui-meme)qui s’insere dans la famille des fonctions de type positif conditionnel.

Nous avons vu que toute Covariance Generalisee est de type positifI I I

conditionnel. Inversement, pour toute fonction symetrique de type positifconditionnel K, on peut construire une Fonction Aleatoire Intrinsequed’ordre k dont K soit une Covariance Generalisee. Il y a identificationMatheron, 1971

(b), p19-20entre les Covariances Generalisees d’ordre k, et les fonctions de typepositif conditionnel d’ordre k.

Page 133: g é o Statistique

[8] – Geostatistique Intrinseque 131

Enfin, une fonction de type positif conditionnel K sera dite de typepositif conditionnel strict si et seulement si :

∀λ ∈ Λk

∫ ∫

λ(dx)K(x − y)λ(dy) = 0 ⇒ λ = 0

c’est-a-dire si la variance de Z(λ) ne s’annule que pour la mesure λidentiquement nulle.

On pourra verifier que pour tout polynome pair P de degre ≤ 2k :

∀λ ∈ Λk

∫ ∫

λ(dx)P (x − y)λ(dy) = 0

et on demontre que seuls parmi les fonctions continues et symetriques, Matheron, 1971(b), p20-23.

A titre d’exercice...

les polynomes pairs verifient cette propriete.

Enfin, la forme generale des fonctions de type positif conditionnel estdonnee dans la bibliographie. Il est naturellement evident, puisque Matheron, 1971

(b), p38-43.Λk+1 ⊂ Λk, que l’ensemble des fonctions de type positif conditionnela l’ordre (k + 1) est un sur-ensemble des fonctions de type positifconditionnel a l’ordre k. Aussi, lorsque l’ordre k augmente, on augmente Une dialectique courante

en Geostatistique.la gamme des modeles structuraux autorises.

3. Le Krigeage IntrinsequeTout est en place desormais pour exprimer le Krigeage dans le cadredu modele FAI-k : le krigeage intrinseque. Il s’agira cette fois d’uneexpression synthetique dans laquelle le polynome pair d’indeterminationest entierement transparent. Quant a la demarche de constructiondu systeme de Krigeage, elle est immuable. Nous nous bornerons, ici Chapitre 6,

paragraphe 3.2.7.encore, au cas du Krigeage ponctuel.

3.1. L.A.U.O.

• Linearite : l’Erreur d’Estimation Z∗(x) − Z(x) doit etre une Lcombinaison lineaire des donnees, donc

Z∗(x) = λα Zα

• Autorisation : cette combinaison lineaire qui attribue : A

→ les poids λα aux points xα

→ le poids −1 au point x

doit verifier les conditions d’autorisation a l’ordre k — la valeur de ketant supposee donnee — soit :

λα f lα − f l

x = 0 (∀l ≤ k)

Notation : si on designe par δx(dt) — ou, pour alleger l’ecriture,simplement par δx — la mesure de Dirac en un point x quelconque,la Configuration d’Estimation est decrite par la mesure

λα δα − δx

La condition d’autorisation peut s’ecrire, de facon un peu plus abstraite :

λα δα − δx ∈ Λk

Page 134: g é o Statistique

132 Aide-Memoire de geostatistique lineaire :

et, puisque Z est une Fonction Aleatoire Intrinseque d’ordre k, l’Erreurd’Estimation peut s’exprimer sous la forme :

Z∗(x) − Z(x) = Z [λα δα − δx]

• Universalite : comme on travaille en modele FAI-k sans derive, touteCombinaison Lineaire Autorisee d’ordre k est d’esperance nulle. Il n’y adonc pas de condition d’universalite.

• Optimalite : conditionnellement aux contraintes precedentes, on veutminimiser la quantite :

σ2 = Var [λα Zα − Zx]

On developpe ce calcul en revenant a la definition-meme de la CovarianceGeneralisee et au theoreme d’existence et d’unicite. En effet :

σ2 = Var[

Z [λα δα − δx]]

et donc :

U

O

σ2 =

∫ ∫ (

λα δα(dt)− δx(dt)

)

K(t−u)

(

λβ δβ(du)− δx(du)

)

ce qui, tous calculs faits, donne

σ2 = λα Kαβ λβ − 2 λαKαx + Kxx

Mais il est encore beaucoup plus simple de remarquer que, pour touteCombinaison Lineaire Autorisee, la variance se calcule COMME SI ilRegle de substitution,

analogue a celledu Chapitre 5,paragraphe 1.3.

y avait une Covariance Stationnaire, mais en remplacant formellementcelle-ci par la Covariance Generalisee.

L’optimisation sous contrainte conduit alors sans difficulte auxconditions d’optimalite :

λβ Kαβ + µl flα = Kαx ∀α

3.2. Le systeme de Krigeage IntrinsequeOn obtient finalement le systeme :

βλβ Kαβ + µl f

lα = Kαx (∀α)

βλβ f l

β = f lx (∀l)

et la variance :

σ2I

= Kxx − λαIKαx − µ

I l flx

ou l’indice I rappelle qu’il s’agit du Krigeage Intrinseque, et que lesponderateurs λ

Iet multiplicateurs de Lagrangeµ

Isont les solutions

de ce systeme de Krigeage Intrinseque.

Sous forme matricielle :

(

Kαβ f lα

f lβ 0

)(

λβ

µl

)

=

(

Kαx

f lx

)

Page 135: g é o Statistique

[8] – Geostatistique Intrinseque 133

On reconnaıt exactement la structure du systeme de Krigeage Universel.Mais cette remarque doit etre completee par les deux points suivants,extremement importants :

• les conditions λβ f lβ = f l

x ont cette fois le sens de conditionsd’autorisation ;

• la gamme des modeles structuraux autorises est plus riche que lafamille (au signe pres) des variogrammes. A ce propos, il nous semblesouhaitable de renvoyer a certaines remarques precedentes sur leKrigeage Universel.

3.3. Proprietes du systeme de Krigeage IntrinsequeL’ensemble des proprietes (superposition des figures de Krigeage,

J J J

Chapitre 7,paragraphe 2.3.4.

orthogonalite et lissage) rencontrees dans le cadre stationnaire strict Chapitre 6,paragraphe 3.4.3.

peuvent trouver leur expression la plus generale dans le formalisme dela Geostatistique Intrinseque :

3.3.1. Superposition des figures de KrigeageSoient en effet λβ

I(x) et µ

I l(x) les solutions du systeme de Krigeageponctuel intrinseque :

βλβ(x)Kαβ + µl(x) f

lα = Kαx (∀α)

βλβ(x) f l

β = f lx (∀l)

et soit Φ un certain operateur lineaire :

Φ(Z) =

Z(x) Φ(dx)

Sous la reserve expresse que l’on utilise toujours le meme ensemble de J J J

donnees, la linearite du systeme de Krigeage nous permet de verifierimmediatement :

Φ∗(Z) = Φ [Z∗]

ou, plus explicitement :

Φ∗(Z) =∑

β

λβΦ Zβ

avec

λβΦ =

λβI(x) Φ(dx)

(La demonstration se fait trivialement par verification, ce qui constitueune preuve si on suppose le systeme regulier).

3.3.2. OrthogonaliteSoit par ailleurs une Combinaison Lineaire Autorisee quelconque ν :∑

β ναZα, avec

α ναf l

α = 0 (∀l). Calculons la covariance de l’erreur

de Krigeage Intrinseque et de∑

β ναZα :

Cov [Z(x) − Z∗(x) , να Zα] = Cov[

Z(x) − λβIZβ , ν

α Zα

]

(1)= νβ Kxβ − να λβ

IKαβ

(2)= νβ

(

µI l(x) f

)

(3)= 0

Page 136: g é o Statistique

134 Aide-Memoire de geostatistique lineaire :

(1) : par bilinearite de la covariance ;

(2) : par les equations d’optimalite du Krigeage Intrinseque ;

(3) : en considerant la sommation en β, et parce que ν est une CLAd’ordre k.

Telle est la generalisation de la propriete d’orthogonalite enoncee jusqu’apresent au niveau des seuls Krigeages simple et ordinaire :

L’Erreur d’Estimation en Krigeage Intrinsequeest de covariance nulle avec toute CombinaisonLineaire Autorisee des donnees

et par linearite, il en sera de meme de l’erreur d’estimation de touteforme lineaire Φ(Z) :

Cov [Φ(Z) − Φ∗(Z) , να Zα] = 0

3.3.3. Lissage

Pour generaliser enfin la propriete de lissage, il faut d’abord noter qu’enmodele intrinseque, on n’a plus le droit de parler de la variance de Z∗(x)— non plus bien sur que de la variance de Z(x) — parce que l’erreur dekrigeage Z(x)−Z∗(x) etant une CLA, Z∗(x) ne peut l’etre. On doitI I I

donc se limiter a l’examen de formes lineaires Φ(Z), selon les notations

ci-dessus, ou de plus

f l(t)Φ(dt) = 0.

Notons alors σ2Φ la variance d’estimation de Φ(Z), soit :

σ2Φ = Var [Φ(Z) − Φ∗(Z)]

L’erreur d’estimation Φ(Z) − Φ∗(Z) est une CLA par construction ;Φ(Z) est une CLA par hypothese ; donc, Φ∗(Z) est aussi une CLA.Rappelons que l’ensemble

des CLA est unespace vectoriel. Alors, on a le droit d’ecrire :

σ2Φ = Var [Φ(Z)] + Var [Φ∗(Z)] − 2 Cov [Φ(Z) , Φ∗(Z)]

D’apres la propriete d’orthogonalite, l’erreur Φ(Z) − Φ∗(Z) est decovariance nulle avec toute CLA des donnees, donc en particulier avecΦ∗(Z) elle-meme. Ainsi,

Cov [Φ(Z) − Φ∗(Z) , Φ∗(Z)] = 0

ce qui s’ecrit aussi

Cov [Φ(Z),Φ∗(Z)] = Var [Φ∗(Z)]

et, en reportant cette egalite dans l’expression de σ2Φ, on obtient la

simplification

σ2Φ = Var [Φ(Z)] − Var [Φ∗(Z)]

ce qui impliqueVar [Φ∗(Z)] ≤ Var [Φ(Z)]

Un examen plus detaille, sans difficulte, montrerait de plus que lavariance de l’estimateur Φ∗(Z) n’est pas stationnaire — c’est-a-diren’est pas invariante pour une translation de la mesure Φ.

Page 137: g é o Statistique

[8] – Geostatistique Intrinseque 135

3.4. Conditions de regularite du systeme de KrigeageExprimons maintenant le theoreme relatif a la regularite du systemede Krigeage Intrinseque. Il est bien sur clair que cet enonce pourra setransposer sans peine au cas du Krigeage Universel.

Theoreme :

Le systeme de Krigeage Intrinseque est regulier si etseulement si :

• la sous-matrice K est positive conditionnelle stricte ;

• Les fonctions de base sont lineairement independantessur les donnees.

Rappelons les definitions de ces proprietes :

• positivite conditionnelle stricte :

∀λ ∈ Λk : λαKαβ λβ ≥ 0

et λα Kαβ λβ = 0 =⇒ λ = 0

• independance lineaire des fonctions de base sur les donnees :

(

cl flα = 0 ∀α

)

=⇒ cl = 0 (∀l)

La demonstration du theoreme est donnee en annexe. Nous supposeronsces conditions verifiees dans le paragraphe suivant. Classiquement,on verifie alors immediatement que le Krigeage Intrinseque est unInterpolateur Exact.

4. Presentation duale du KrigeageDans tout ce paragraphe, nous supposerons essentiellement le systemede Krigeage Intrinseque regulier, et le jeu de donnees fixe.

4.1. Le Krigeage comme interpolateurConsiderons le systeme de Krigeage Intrinseque ponctuel d’un point xquelconque. Les solutions λ et µ de ce systeme :

βλβ Kαβ + µl f

lα = Kαx (∀α)

βλβ f l

β = f lx (∀l)

sont evidemment des fonctions λα(x) et µl(x) du point x a estimer.

De plus, ces fonctions sont des combinaisons lineaires des expressionsKαx et f l

x. Par suite, l’estimateur :

z∗(x) = λβ(x) zβ

est aussi une combinaison lineaire de ces memes Kαx et f lx, et on peut

donc ecrire :z∗(x) = bαKαx + cl f

lx

Telle est l’expression duale du Krigeage, volontairement enoncee entermes de Variable Regionalisee : le Krigeage Intrinseque apparaıt

Page 138: g é o Statistique

136 Aide-Memoire de geostatistique lineaire :

ainsi comme un interpolateur, sans connotation probabiliste, auquel onimpose d’etre une combinaison lineaire des fonctions Kα• et f l

•.

4.2. Systeme de Krigeage dual

Remplacons, dans l’expression duale, les fonctions K et f par leursformulations issues du systeme direct. On obtient ainsi une identite entredes fonctions de x :

λβ(x) zβ ≡ z∗(x) ≡ bα(

λβ(x)Kαβ + µl(x) flα

)

+ cl λβ(x) f l

β

et par identification :

αbαKβα + cl f

lβ = zβ (∀β)

αbα f l

α = 0 (∀l)

Les coefficients bα et cl sont donc solutions d’un systeme par hypotheseregulier. Ce systeme dual, en effet, presente le meme membre de gaucheque le systeme direct, donc les memes caracteres de regularite.

Nous pouvons donc definir le Krigeage par :

z∗(x) = bαKαx + cl flx

ou les bα et cl sont caracterises par le systeme dual. On perd touteinterpretation probabiliste, en particulier la notion de variance.

L’interet de cette formulation apparaıt en cartographie. Pour un jeu fixede donnees, il y a un seul systeme a resoudre, et donc peu de coefficientsa garder en memoire, et ceci pour le calcul d’autant de z∗(x) que l’onveut. On dispose de plus d’une equation implicite des courbes de niveau.Les caracteres (analytiques) de regularite des courbes de niveau sont desconsequences immediates de l’expression des fonctions Kαx.

4.3. Interpretation des equations duales

4.3.1. Recherche d’un nouvel interpolateur

Cherchons a construire un interpolateur z∗(x) satisfaisant aux troisconditions suivantes :

• on veut que z∗(x) soit combinaison lineaire des fonctions de x ,

Kαx et f lx :

z∗(x) = bαKαx + cl flx

• on veut que z∗(x) soit un interpolateur exact, c’est-a-dire tel que :

∀xβ : z∗(xβ) = zβ

soit encore, compte-tenu de la premiere condition :

∀xβ : bαKαβ + cl flβ = zβ

• enfin, on souhaite que l’interpolateur z∗(x) soit compatible avec

les derives f lx en ce sens que si toutes les donnees zα ont la valeur

fsα, alors, z∗(x) ≡ fs(x).

Page 139: g é o Statistique

[8] – Geostatistique Intrinseque 137

4.3.2. Role des contraintes bα f lα = 0

On remarque que, compte-tenu des deux premieres conditions, cettepropriete de compatibilite de l’interpolateur avec les derives est assureepar la condition bα f l

α = 0. En effet, pour s fixe, si zβ = fsβ et

bα fsα = 0, la condition d’interpolation exacte donne :

bαKαβ bβ + cl f

lβ b

β = zβ bβ = fs

β bβ = 0

soit encore bαKαβ bβ = 0 d’ou, la matriceKαβ etant supposee positive

conditionnelle stricte, bα = 0. Par suite, cl = δsl , et donc :

z∗(x) = fsx

Ainsi, la condition bα fsα = 0 est une condition suffisante pour qu’un

interpolateur exact de la forme bαKαx + cl flx soit Compatible avec

les Derives f lx.

4.3.3. Caracterisation du systeme dual

Rien n’assure que la condition bα fsα = 0 soit necessaire pour garantir

la propriete de compatibilite avec les derives. Autrement dit, il n’estpas certain que les trois conditions ci-dessus permettent de definir uninterpolateur unique.

En revanche, un interpolateur z∗(x)

• de la forme z∗(x) = bαKαx + cl flx ,

• qui soit un interpolateur exact,

• et qui satisfasse de plus aux conditions bα fsα = 0 ,

verifie necessairement les equations

αbαKβα + cl f

lβ = zβ (∀β)

αbα f l

α = f lx (∀l)

c’est-a-dire les equations du Krigeage Dual.

Or nous avons suppose ce systeme regulier. Ces trois nouvelles conditionscaracterisent donc un interpolateur, lequel coıncide avec le KrigeageDual. Et bien sur, cet interpolateur satisfait aux conditions duparagraphe 4.3.1.

4.4. Equivalence splines–krigeageLa presentation du Krigeage Intrinseque comme un interpolateur,hors de toute interpretation probabiliste, souleve la question de lacomparaison du Krigeage a d’autres techniques d’interpolation.

Une methode classique d’interpolation est le formalisme des Splines :sous sa forme la plus generale, on peut dire que l’interpolation par Splinesconsiste a minimiser l’integrale d’espace du carre d’un certain operateurlineaire (differentiel par exemple), tout en respectant les valeurs auxpoints de donnees.

Un theoreme, dont la conclusion pourrait sans doute paraıtre inattendue,etablit alors qu’il y a stricte equivalence entre Spline et Krigeage : tout Matheron, 1980.

probleme de Spline peut etre exprime en terme de Krigeage (ce qui nesignifie nullement qu’il soit facile de trouver la Covariance Generaliseecorrespondante !), et a tout Krigeage correspond une Spline — et trouverl’operateur correspondant est encore plus difficile.

La demonstration de ce theoreme n’est pas aisee. Nous ne proposonsen annexe que l’examen du cas fini. Ce resultat en tout cas est assezetonnant dans la mesure ou il traduit l’equivalence theorique entreune demarche qui privilegie les contraintes amont (c’est-a-dire le

Page 140: g é o Statistique

138 Aide-Memoire de geostatistique lineaire :

respect des donnees initiales : c’est le krigeage) et une demarche quiprivilegie les contraintes aval (c’est-a-dire les proprietes futures del’interpolateur : ce sont les splines) : cette convergence n’allait pas desoi a priori .

La theorie des FAI-k, en toute generalite, peut sembler difficile sur leBibliographie

plan theorique. Cela apparaıt des le document initial :

• La theorie des Fonctions Aleatoires Generalisees,Matheron, 1971.

C’est pourquoi, dans l’esprit de cet expose, nous ne pouvons que suggererune presentation simplifiee, en particulier celle de :

• Les Fonctions Aleatoires Intrinseques d’ordre k,Delfiner & Matheron, 1980.

Ce document ouvre egalement la voie a l’aspect pratique de laGeostatistique Intrinseque. Il est bon par ailleurs, une fois achevee laprise de contact avec les FAI-k, de reprendre la bibliographie consacreeau Krigeage Universel a la lumiere de cette theorie plus generale.

La presentation proposee ici du Krigeage Dual et de l’equivalenceSplines–Krigeage est inspiree de cours oraux. On se reportera cependantavec profit a des documents plus rigoureux et plus complets :

• Splines et Krigeage : leur equivalence formelle,Matheron, 1980.

• Remarques sur le Krigeage et son dual, Matheron,1981.

De meme, on pourra completer cette premiere approche des FAI-k parun examen des Fonctions Aleatoires Intrinseques Generalisees (FAIG) :

• Comment translater les catastrophes ou la structuredes Fonctions Aleatoires Intrinseques Generales,Matheron, 1979.

Dans un autre esprit, mentionnons une abondante bibliographieconsacree aux aspects pratiques de la Geostatistique Intrinseque, et enparticulier de l’Analyse Variographique. Ces references sont la plupartdu temps axees sur les algorithmes mis en œuvre dans le logiciel ISATIS.

Enfin, les developpements theoriques ne manquent pas, dans lesdirections les plus diverses, par exemple :

Krigeage sous contrainte d’inegalite :

• Estimation sous contraintes d’inegalites, Langlais,1990.

Krigeage de variables reliees par des equations :

• Estimation geostatistique de phenomenes regis par desequations aux derivees partielles, Dong, 1990.

Page 141: g é o Statistique

[8] – Geostatistique Intrinseque 139

Krigeage Trigonometrique :

• Geostatistique des phenomenes a tendance periodique,Seguret, 1991.

Se reporter, en deuxieme partie du document, aux chapitres Annexe

• Demonstration du theoreme des Representations.

• Equivalence Spline-Krigeage.

• Etude de la bathymetrie sur le site du “Titanic”.

Page 142: g é o Statistique

140 Aide-Memoire de geostatistique lineaire :

Figure 1

Page 143: g é o Statistique

Chapitre 9

Introductiona la Geostatistique

Multivariable

Presentation

Dans l’optique d’une simple revision des principes generaux de laGeostatistique Lineaire, nous conclurons cette partie du document parquelques elements de Geostatistique Multivariable. Conformement al’esprit de cet Aide-Memoire, il s’agit surtout de poser des jalons,et d’indiquer au cas par cas les references indispensables a unapprofondissement du sujet.

Au premier paragraphe, on examine la necessite du recours aune technique qui s’annonce plus compliquee que la Geostatistiquemonovariable, et on en definit les principales hypotheses et notations.

Le second paragraphe est consacre au modele structural multivariable :on presente les principales proprietes des covariances croisees, en ensoulignant certaines nouveautes par rapport au cas monovariable, eton justifie l’abandon, dans la suite du chapitre, du modele intrinseque.

Dans le cas le plus simple de FASt-2 d’esperances nulles, onpose au troisieme paragraphe les premieres equations d’estimationmultivariable. Les proprietes essentielles du cokrigeage, ainsi quequelques reflexions generales, sont exposees une fois pour toutes.

Le quatrieme paragraphe generalise le precedent, lorsqu’il existe desderives (cokrigeage universel et coestimation optimale des coefficientsdes derives). Sans innovation theorique, ce paragraphe — qui met enevidence la complexite des notations – est plutot un recueil de formules,mais souligne aussi combien la pratique du cokrigeage peut etre lourde.

Il faut donc envisager des simplifications au systeme de cokrigeage.Au paragraphe cinq, le modele lineaire de coregionalisation n’estqu’un exemple (restrictif) de telles simplifications, mais est l’occasiond’expliciter quelques regles de transformations des donnees. La notiond’autokrigeabilite est introduite en conclusion, comme generalisationde ce modele trop particulier.

L’analyse krigeante, seulement evoquee au paragraphe six, est uncas d’application du modele lineaire de coregionalisation. On metsurtout en evidence les risques, dans une approche qui comporte desindeterminations mathematiques, de trop solliciter le modele et defranchir le seuil de realisme.

Au septieme paragraphe enfin, la technique de la derive externe estsommairement presentee comme alternative possible au cokrigeage.

1. Position du probleme et notations

1.1. Remarque preliminaire

Etrangement, il n’est peut-etre pas aussi facile que l’on pourraitcroire de definir la frontiere entre etudes mono- et multivariable. Ainsi

Page 144: g é o Statistique

142 Aide-Memoire de geostatistique lineaire :

par exemple, il est tres frequent que le variogramme experimental γd’une Variable Regionalisee z unique soit modelise par une fonctionqui apparaisse comme la somme d’un certain nombre de modeles elementaires γ

i, — soit, ∀h,

γ(h) =∑

i

γi(h)

ou en general ces modeles elementaires γi

revelent des structuresd’echelles differentes : γ(h) est ce que l’on appelle classiquement unmodele gigogne.

La decomposition du variogramme modelise γ est un simple choix censepertinent au cours de l’Analyse Variographique, et l’on pourrait en resterla. Mais il est possible de chercher a interpreter une telle decomposition :on peut par exemple envisager que la Fonction Aleatoire Z dont z estrealisation soit la somme de Fonctions Aleatoires Z

iindependantes, de

variogrammes respectifs γi. D’ou le modele

Z(x) =∑

i

Zi(x)

avec

γi(h) =

1

2Var [Z

i(x+ h) − Z

i(x)]

et Zi

et Zj

independantes si i 6= j.

Notons tout d’abord, ce qui est essentiel, que ce modele n’est pas leseul possible : tout au plus est-il COMPATIBLE avec la decompositionI I I

du variogramme γ, ce qui est bien la moindre des choses pour realiserun travail pertinent sur z. Mais bien d’autres modeles de FonctionsAleatoires, moins simples, pourraient etre proposes. . .

Cela dit, si l’on admet cette decomposition de Z, donc de z, onpeut se demander si l’on est encore dans un cadre monovariable.Rien en effet n’interdit alors, tout au moins dans le modele, d’etudierindividuellement les composantes Z

i: cette technique, appelee analyse

krigeante, sera brievement presentee ulterieurement. Pour l’instant,notons que, bien que les composantes Z

in’aient a l’evidence pas le

statut de Grandeurs Regionales et ne se pretent donc pas a une phaseChapitre 1,paragraphe 4.3.

de Reconstruction Operatoire, les developpements theoriques peuventquant a eux parfaitement relever d’un travail multivariable, quand bienmeme la realite z est strictement monovariable. . .

Autre exemple : nous avons vu qu’il etait possible, avec beaucoup deChapitre 7,paragraphe 6.2.

precautions, de travailler sur des residus estimes (non optimaux) enretirant a la Fonction Aleatoire Z un estimateur universel de la Derive.Placons-nous pour simplifier dans le cas k = 0 : cet estimateur de laDerive sera alors une simple moyenne glissante de la forme Z(v

x), et on

pourra realiser l’etude de

R∗(x) = Z(x) − Z(vx)

Cette fois encore, partant d’une Variable Regionalisee unique, on faitapparaıtre une problematique multivariable, la particularite etant icique les deux Fonctions Aleatoires en jeu, Z et Z, sont liees par unetransformation algebrique clairement identifiee : il s’agit d’un mecanismede Changement de Support. Naturellement, dans ce cas, il est evidentChapitre 5,

paragraphe 3.2.que Z et Z sont fortement correlees ; par ailleurs, Z est cette foisune Grandeur Regionale. Quoi qu’il en soit, une etude variographiquetheorique du residu R∗ exige de connaıtre la structure conjointe de lapaire de variables (Z, Z), c’est-a-dire d’utiliser un modele bivariable. . .

Page 145: g é o Statistique

[9] – Introduction a la Geostatistique Multivariable 143

Bien sur, ces deux exemples — qui peut-etre ne viennent pasimmediatement a l’esprit, mais n’ont pourtant rien d’artificiel — nesauraient faire oublier le cas multivariable le plus simple : celui oul’on dispose de donnees sur differentes variables. Et cette fois, il ya plethore d’exemples : environnement (sites a pollutions multiples),gisements polymetalliques, donnees minieres etudiees par le tripletteneur–puissance–accumulation, recherche petroliere (donnees aux puitset campagnes geophysiques), meteorologie (vent, pression, temperature,etc. ). Selon les cas, ces differentes variables sont simplement correlees(par exemple, les teneurs Pb–Zn–Ag—. . . dans un gisement), oucouplees par des relations physiques simples (puissances partielleset totale dans une structure sedimentaire. . . ) ou moins simples(radioactivite et teneur dans un gisement d’uranium. . . ) , ou relieespar des equations aux derivees partielles (debit–charge–permeabilite enhydrogeologie. . . ) : la combinatoire est immense, ce qui laisse presagerles difficultes (au moins pratiques) du traitement multivariable, et la tresgrand variete de problemes a resoudre.

Mais dans cet incroyable fouillis de cas de figures possibles, deuxexigences permanentes apparaissent, communes a la quasi-totalite dessituations envisageables :

• la plupart du temps, nous devons etre capables de manipulerdes multiplets de donnees, c’est-a-dire des variables de naturesdifferentes, connues eventuellement sur des domaines distincts. Nousdevons pouvoir utiliser une information diversifiee, tant en ce quiconcerne la nature des variables que leur echantillonnage ;

• comme exemple banal d’une telle manipulation, nous rencontreronsnaturellement des problemes d’estimation d’une variable a l’aidede plusieurs variables de natures differentes. Ces problemes serontrepertories sous le terme generique de cokrigeage ;

• et, dans tous les cas, nous devons pouvoir proposer un modelestructural multivariable decrivant non seulement l’organisationspatiale de chacune des variables considerees separement, maisencore leur organisation conjointe — en d’autres termes leurcoregionalisation. On devine que cette etape sera decisive pourtoute etude multivariable, et que c’est a ce niveau que sepresenteront a la fois les nouveautes theoriques, et les principalesdifficultes d’application.

Comme il s’agit d’un prerequis a tout traitement multivariable, nousexaminerons d’abord le probleme de la modelisation. Et parce qu’il estprevisible que nous rencontrerons des difficultes nouvelles, d’inferencestatistique comme de formalisation theorique, nous devons plus quejamais nous preoccuper du Seuil de Realisme de nos manipulations, et Chapitre 1,

paragraphe 1.3.garder en permanence a l’esprit le Principe d’Economie. Chapitre 1,

paragraphe 4.2.

En fait, tout simplement, la premiere question a se poser est celle del’opportunite de mettre en œuvre une approche plus lourde que celle quenous avons utilisee jusqu’ici, compte-tenu des indeniables complicationsque l’on peut pressentir a priori .

1.2. Necessite d’un modele multivariable : un exemple simplisteLe maıtre mot qui doit nous guider dans notre reflexion est celui decoherence1 . L’adequation de nos modeles a la realite physique est affaire J J J

1Il n’y a naturellement rien la de nouveau. Le respect de la coherence interne de la

modelisation est une condition necessaire de validite de tout travail geostatistique.

Le cadre multivariable est simplement plus spectaculaire, et offre une plus grande

variete de chausse-trappes que ce qui a ete vu jusqu’ici. Mais sur le fond, rappelons

que ce chapitre ne constitue en realite qu’une revision. . .

Page 146: g é o Statistique

144 Aide-Memoire de geostatistique lineaire :

d’approximation, d’empirisme, voire de subjectivite ; en revanche, lacoherence interne du modele — quelle que soit par ailleurs l’aptitudede ce modele a rendre compte de la realite — est une exigence dontaucun pragmatisme mal compris ne saurait justifier la transgression.

L’incoherence la plus banale, deja rencontree, consiste a utiliser unmodele structural non autorise, c’est-a-dire ne satisfaisant pas auxexigences de positivite (eventuellement conditionnelle) ; le prix a payerpour cette faute est alors le risque de voir surgir des variances negativesen cours de calcul. En multivariable, on peut imaginer des incoherencesplus subtiles, la plus nouvelle consistant justement a ne pas utiliser demodele multivariable et a traiter les variables separement ; l’exempleci-apres illustre, dans une situation des plus simplistes, ce type d’erreur.

On se place pour simplifier dans le cadre FASt-2 d’esperances nulles,et on considere deux Fonctions Aleatoires A(x) et B(x), de covariancesrespectives K

Aet K

B. On suppose, pour simplifier encore davantage,

que ces deux Fonctions Aleatoires sont independantes, ce qui entraıneque la covariance K

A+Bde la somme verifie

KA+B

= KA

+ KB

Au point x + h, on construit, par trois krigeages monovariables, lesestimateurs A∗

(x+h), B∗(x+h) et (A+ B)∗(x+h) a l’aide des donnees

au point x : A(x),B(x) et (A+B)(x). Il s’agit donc, selon la terminologieconsacree, de trois Krigeages Simples, realises en resolvant troissystemes de krigeage independants construits avec les fonctions deEn l’occurrence, dans ce

cas simpliste, il s’agitde trois equations a

une seule inconnue. . .Voir Chapitre 6,

paragraphe 3.3.1.

covariances respectives KA

, KB

et KA+B

. Les solutions, immediates,s’ecrivent :

A∗(x+h) =

KA

(h)

KA

(0)A(x)

B∗(x+h) =

KB

(h)

KB

(0)B(x)

(A+B)∗ (x+h) =K

A+B(h)

KA+B

(0)(A+B)(x)

Il est alors trivial de constater que, en general, ∀h 6= 0,Il ne s’agit pas d’uneinterdiction absolue : on

peut imaginer des modelesparticuliers de covariancesmonovariables qui assurent

la coherence entre lesestimateurs de krigeages

(voir paragraphe 5.8).

(A+B)∗ (x+h) 6≡ (A)∗ (x+h) + (B)∗ (x+h)

Naturellement, ce resultat n’est nullement en contradiction avec leI I I

Theoreme de Superposition des Figures de Krigeage, bien au contrairepourrait-on dire. Car ce theoreme stipule que tous les krigeages qu’ilChapitre 6,

paragraphe 3.4.2.mentionne doivent etre realises avec le meme jeu de donnees : c’est tresexactement le contraire que nous avons fait ici, ou A∗ n’est construitqu’a l’aide de donnees de A (et B est ignoree), B∗ a l’aide de B (et Aest ignoree) , et (A + B)∗ a l’aide de la somme (A + B) (et les deuxcomposantes ne sont jamais connues que par leur somme).

Nous venons de mettre en evidence une incoherence d’un type nouveau.Car, sous reserve naturellement que les deux covariances K

Aet

Page 147: g é o Statistique

[9] – Introduction a la Geostatistique Multivariable 145

KB

soient des modeles (separement) autorises, chacune des variablesconsideree isolement a ete traitee dans les regles de l’art. Et pourtant,les trois variables considerees dans leur ensemble conduisent a un resultatnon satisfaisant : le couplage entre ces variables (ce couplage existe,a la fois par le biais des fonctions de covariance et par le jeu desdonnees utilisees) se revele insuffisant pour garantir la relation souhaiteeestimateur de la somme = somme des estimateurs.

Ainsi, meme dans cet exemple extremement simple, il apparaıtqu’il est indispensable de proposer un modele global — un modelede Coregionalisation — meme si, comme on peut le prevoir,les developpements theoriques en seront un peu compliques. Bienevidemment, il n’aurait pas ete difficile de corroborer cette propositionpar des exemples plus realistes, peut-etre plus probants, et surement plusdifficiles. . .

1.3. Deux considerations generales sur le multivariable

Avant d’entreprendre quelques developpements techniques dans le cadremultivariable, il semble utile de faire encore deux remarques, de caracteretout-a-fait general.

Et d’abord, avec un peu de provocation, on pourrait affirmer que lesproblemes multivariables n’existent pas, qu’ils ne sont que des problemesmonovariables relatifs a des Fonctions Aleatoires vectorielles. Cetteremarque n’est generalement pas tres operatoire, parce que bien souventtoutes les variables ne sont pas connues en les memes points. Ainsi, si l’onconsidere que l’objet d’etude est une Fonction Aleatoire vectorielle, celle-ci n’est souvent connue que sur un ensemble de points tres reduit, parfoisvide : l’ensemble des points ou toutes les composantes de la FonctionAleatoire sont connues. A l’inverse, on se prive d’une information certespartielle, mais souvent tres abondante : celle qui concerne les points oune sont connues que quelques-unes des composantes.

Pourtant, ce point de vue abstrait n’est pas depourvu d’enseignements :

• d’une part, il est parfaitement operatoire lorsque toutes les variablessont connues aux memes points (ce cas de figure est connu sous lenom d’isotopie) ; Matheron, 1982.

• on confirmera, incidemment, que la frontiere entre mono- etmultivariable n’est decidement pas aussi nette qu’on aurait pu lecroire. Que penser en effet d’une Variable Regionaliee complexe ?Faut-il la traiter comme realisation d’une unique Fonction Aleatoirecomplexe, ou d’une paire de Fonctions Aleatoires reelles ? Notons Ch. Lajaunie &

R. Bejaoui, 1991.d’ailleurs qu’au plan theorique, les deux points de vue se revelentn’etre pas equivalents. . .

• dans le cas d’une heterotopie, c’est-a-dire lorsque toutes lesvariables ne sont pas connues aux memes points, il est d’ailleurspossible d’inverser le point de vue, et de considerer que l’on disposed’une Variable Regionalisee unique, mais definie sur un espace Matheron, 1982, p10.

abstrait, produit de l’espace geographique par l’espace desindices qui definissent les variables. On est ainsi ramene une nouvellefois a un point de vue monovariable, scalaire de surcroıt ;

• dans tous les cas, la reference a un point de vue monovariable faciliteles notations. Il est commode de se laisser porter par les ecrituresetablies dans les chapitres precedents en remplacant seulement,lorsque c’est necessaire, des indices scalaires par des indicesvectoriels, ou en se rappelant la nouvelle definition de l’espace detravail. Cette transposition de formalismes devenus classiques enGeostatistique monovariable peut s’averer d’une grande utilite.

Page 148: g é o Statistique

146 Aide-Memoire de geostatistique lineaire :

Car — et c’est la seconde consideration qu’il est souhaitable d’enoncer ici— le probleme des notations peut rapidement occulter les questions defond. Autant dire les choses avec humour : Du point de vue conceptuel,il n’apparaıt aucun element nouveau, comme on le verra. Toutes lesdifficultes (qui sont reelles) proviennent des notations2 , necessairementplus complexes — citation que l’on est fonde a considerer comme uneuphemisme. . .

C’est pourquoi il est bon, dans la mesure du possible, de se laisser guiderpar les habitudes de notations acquises dans les chapitres precedents, afinde mieux mettre en relief les nouveautes qui risquent d’introduire descomplications specifiques.

1.4. Notations

On conserve naturellement l’ecriture Z pour designer la Fonction

Fasc. 5, p187.

I I I

Aleatoire etudiee (et z pour la Variable Regionalisee associee). Maiscette fois se pose le probleme du domaine de definition de cette FA.

Dans une premiere optique, on peut considerer que l’on travaille sur unensemble de d Fonctions Aleatoires, en general non independantes,definies sur un meme espace geographique. On dispose donc d’unefamille de fonctions

Zi(x) ou x ∈ R

n

i ∈ D[1]

n etant la dimension de l’espace geographique, et D l’ensemble1, 2, . . . , d des indices designant les variables.

Dans les memes conditions, on pourra comme alternative choisir deconsiderer que l’on dispose d’une Fonction Aleatoire unique, definie surl’espace produit R

n ×D :

Z(x, i) ou (x, i) ∈ Rn × [2]

La description des ensembles de donnees obeit a la meme dualite :

• dans le premier point de vue, on designera par Si

l’ensemble despoints de l’espace geographique ou est connue la variable z

i.

Pour adopter des notations rigoureuses, on a alors

Si

=

x ∈ Rn : z

iest connue au point x

[3]

et bien sur, Si⊂ R

n. Sauf dans le cas Isotopique, les Si

(qui sontdonc au nombre de d) sont distincts ;

• de l’autre point de vue, il y a une seule Variable Regionalisee z,donc un seul ensemble S ou elle est connue. Soit :

S =

(x, i) ∈ Rn ×D : z est connue au point (x, i)

[4]

et cette fois, S est un sous-ensemble de Rn ×D.

2Souligne par G. Matheron.

Page 149: g é o Statistique

[9] – Introduction a la Geostatistique Multivariable 147

Ce second point de vue se revelera bien adapte, dans le formalisme duKrigeage Universel, pour la description du developpement de la Derive.

Aussi, quelle que soit l’ecriture de celle-ci, que ce soit

mi(x) = E [Z

i(x)] [5]

oum(x, i) = E [Z(x, i)] [6]

nous aurons dans le cas general tout avantage a la developper selon unseul indice l, c’est-a-dire a ecrire

mi(x) = m(x, i) =

l

alf l(x, i) [7]

En ce qui concerne les covariances, nous adopterons une notation unique :les variables figureront en indice, et les points d’appuis figureront commeles variables de la fonction ; soit

Kij

(x, y) = Cov[

Zi(x), Z

j(y)]

= Cov [Z(x, i), Z(y, j)] [8]

ce qui constitue la definition de la covariance croisee, dont on supposeici l’existence.

Les autres notations, d’emploi moins general, seront introduites au fur

Pour des raisons quiapparaıtront tres vite,nous ferons peu usagedes variogrammesdans ce chapitre.

et a mesure. Conformement a l’usage, on adoptera les notations du Fasc. 5, p187.

cas continu pour les ponderateurs, afin d’eviter les accumulations desystemes d’indices dans les ecritures. La combinaison lineaire la plusgenerale portant sur la Fonction Aleatoire Z (respectivement : sur lafamille des d Fonctions Aleatoires Z

i) s’ecrira ainsi :

i

R n

λi(dx)Z(x, i)

(

respectivement :∑

i

R n

λi(dx)Zi(x)

)

2. Mise en place de la fonction structurale

2.1. Le modele FASt-2 d’esperance nulleDe facon synthetique, l’hypothese de stationnarite d’ordre 2 impliqueque toutes les combinaisons lineaires telles qu’elles sont definiesau paragraphe precedent sont des CLA. Autrement dit, toutes cescombinaisons lineaires admettent des moments d’ordre 1 et 2. De plus,la condition d’esperance nulle implique que toutes ces CLA sontd’esperance nulle ; en particulier, en adoptant par exemple l’ecriture [6],

m(x, i) = E [Z(x, i)] = 0 ( ∀i ∈ D, ∀x ∈ Rn ) [9]

L’existence des moments d’ordre 2 implique que les fonctions deCovariances et Covariances Croisees, definies par la formule [8], existenttoujours dans ce modele. De plus, la propriete de stationnarite entraıneque toutes ces (co)variances3 sont invariantes par translation dansl’espace geographique, de sorte que, ∀x, ∀y, ∀h,

Kij

(x, x+ h) = Kij

(y, y + h)

3Il est evident que la condition de stationnarite sur chacune des variables

prises isolement n’est pas une condition suffisante pour garantir la stationnarite

multivariable. Plus inattendu peut-etre, ce n’est une condition ni necessaire,

ni suffisante, pour garantir la stationnarite des Covariances Croisees (voir un

exemple simpliste en complement, en fin de chapitre).

Page 150: g é o Statistique

148 Aide-Memoire de geostatistique lineaire :

fonctions qui ne dependent donc que de h, quels que soient i et j. Onpourra alors adopter l’ecriture simplifiee :

Cov [Z(x, i), Z(x+ h, j)] = Kij

(h) [10]

en rappelant que dans cette ecriture Kij

(h), c’est bien la variabled’indice i qui se trouve a l’origine du vecteur h et la variable d’indicej a son extremite.

2.2. Proprietes elementaires des covariances croisees

Pour simplifier, on supposera toujours que nous travaillons sur desFA reelles, ce qui est d’ailleurs le cas dans la tres grande majoritedes etudes. En particulier, la notation | | representera une valeurabsolue, plutot qu’un module. Les proprietes des Covariances Croiseesstationnaires se presentent alors comme une generalisation de celles decovariances monovariables, et c’est surtout aux nouveautes qu’il faudrapreter attention :

• pour i = j, la fonction de Covariance Croisee se reduit a unecovariance monovariable, dont elle a par consequent toutes lesChapitre 3,

paragraphe 2.3.proprietes theoriques ;

• si les Fonctions Aleatoires Zi(x) et Z

j(y) (en tant que fonctions

sur l’espace geographique Rn , a i et j fixes) sont independantes,

leur fonction de Covariance CroiseeKij

(h) est identiquement nulle :

Kij

(h) ≡ 0

Cette propriete sera tres sollicitee lors de la mise en œuvre destechniques d’Analyse Krigeante ;

I I I

Paragraphe 6.

• en general,I I I

I I IK

ij(h) 6≡ K

ij(−h) pour i 6= j

ce qui explique l’appel a la prudence du paragraphe precedent dansParagraphe 2.1.

l’utilisation de notations simplifiees.

Cette absence de symetrie ne doit pas surprendre. Si l’on supposea titre d’exemple que les variables i et j designent des polluantsde solubilites differentes et que la covariance est calculee dans ladirection d’un courant, il est naturel que la covariance entre deuxEn fait, les exemples

ne manquent pas. Enparticulier, des que le

facteur temps intervient,il est naturel d’observer

une dissymetrie entrecauses et effets. . .

mesures ne soit pas la meme selon que c’est le produit le plus ou lemoins soluble qui est mesure en amont. On fait ainsi apparaıtre unenotion de decalage — ou dephasage — entre variables qui, bienloin d’etre un handicap, est a l’evidence un outil supplementaire dedescription d’une (co)regionalisation.

Cela dit, cette absence de symetrie ne procede pas d’une interdictiontheorique, et au contraire certains modeles particuliers impliquentla symetrie4 ; mais il est vrai que d’autres au contraire entraınentl’antisymetrie5 . . . Et naturellement, la symetrie est assuree pouri = j ! En revanche, ce qui est toujours vrai, c’est la relation

Kij

(h) ≡ Kji

(−h)

4A 1 dimension, on pourra citer le modele de coregionalisation entre une FA et

sa derivee seconde — sous reserve naturellement que celle-ci existe, au sens de la

moyenne quadratique.5

Encore a 1 dimension, la covariance croisee entre une FA et sa derivee.

Page 151: g é o Statistique

[9] – Introduction a la Geostatistique Multivariable 149

qui s’etablit instantanement en utilisant la propriete de symetrie dela covariance entre deux Variables Aleatoires. Rappelons qu’il s’agitici de covariances de VA reelles, les covariances de VA complexespossedant quant a elles la propriete de symetrie hermitienne —

c’est-a-dire que Kij

(h) ≡ Kji

(−h) ;

• Pour h = 0 et x ∈ Rn fixe, la matrice carree — evidemment

symetrique — de dimensions d× d

(

Kij

(0))

est la matrice de variances-covariances du vecteur aleatoire(

Zi(x))

J J J

et, en vertu de l’hypothese de stationnarite, ne depend pas de x.Pour rappeler cette propriete, on peut adopter une ecriture plusproche des statistiques, et noter

σij

= Kij

(0) [11]

• On etablit sans difficulte une inegalite de Schwarz :

|Kij

(h) | ≤√

σiiσ

jj

Mais il faut noter qu’en general, on ne peut rien dire sur la

comparaison entre Kij

(h), Kii(h) et K

jj(h) — non plus d’ailleurs

que sur la comparaison entre Kij

(h) et Kij

(0) lorsque i 6= j ;

• La propriete essentielle de positivite s’exprime sans nouveaute sion adopte le point de vue [2] d’une Fonction Aleatoire (reelle)monovariable sur l’espace R

n ×D : pour toute mesure λi(dx)definie sur cet espace, on aura

Var

[

i

R n

λi(dx)Z(x, i)

]

=∑

i, j

R n×R n

λi(dx)λj (dy) Kij

(x, y) ≥ 0

Consideree comme une fonction definie sur le produit de l’espaceR

n × D par lui-meme, la fonction de deux variables K est detype positif. Toutefois, dans la pratique de la Variographie, onfixera en general les indices i et j qui designent les variables, pourexaminer separement les fonctions K

ij(x, y) qui, elles, sont definies

sur Rn×R

n et ne dependent d’ailleurs que du vecteur (x−y.). Untel procede est naturel tant qu’il s’agit d’interpreter des structures ;il est par ailleurs beaucoup plus intuitif de travailler sur le seulespace geographique, plutot que sur un espace abstrait. On seramene ainsi, variable par variable, puis au niveau des paires devariables, a une succession d’analyses exploratoires partielles.

Mais en ce qui concerne la modelisation, il ne faudra pas oublier quec’est au niveau global de la fonctionK tout entiere qu’il faut assurerla contrainte de positivite, pour garantir la coherence interne — tout J J J

simplement : l’autorisation — du modele. Il s’agit la clairement,au niveau de la pratique de l’Analyse Variographique, d’une assezserieuse complication par rapport au cas monovariable.

Page 152: g é o Statistique

150 Aide-Memoire de geostatistique lineaire :

2.3. Indications sur le modele intrinseque strict

Il est naturel, a cette etape, de generaliser les notions introduites dansle cadre FASt-2 au cas plus large de l’hypothese intrinseque. Selon lemecanisme habituel, il suffit de reprendre les developpements precedentsen remplacant, mutatis mutandis, les valeurs ponctuelles de VariablesRegionalisees (ou de Fonctions Aleatoires) par des accroissements.

L’outil structural traditionnel en Variographie multivariable intrinsequeest ainsi le variogramme croise, defini par :

γij

(h) =1

2Cov [Z(x+ h, i) − Z(x, i) , Z(x+ h, j) − Z(x, j)] [12]

ou encore

γij

(h) =1

2Cov

[

∆i(x;h) , ∆j(x;h)]

en posant classiquement, pour alleger les ecritures et mieux mettre enIl s’agit de notationsusuelles en calcul

aux differences finies. relief le role des accroissements,

∆i(x;h) = Z(x+ h, i) − Z(x, i) = Zi(x+ h) − Z

i(x)

Cette expression [12] appelle deux remarques :

• on tient compte d’emblee de l’hypothese intrinseque. Ainsi, nonseulement on sait que la covariance des accroissements existe, maison sait aussi qu’elle est invariante par translation dans l’espacegeographique, ce qui implique que la fonction γ

ij(h) ne depend

effectivement que de h (a i et j fixes) ;

• on peut se demander si cette definition de γij

(h) n’est pas troprestrictive, et s’il n’aurait pas ete necessaire de recourir a un outilplus general comme la fonction

γij

(x, a; y, b) =1

2Cov

[

∆i(x; a) , ∆j(y; b)]

— fonction qui, dans le cadre de l’hypothese intrinseque, ne dependque du vecteur (x− y) et non de x et de y separement.

On rappelle que dans le cas monovariable, il n’est pas necessaired’introduire la COvariance d’accroissements, et que le variogramme,bien que simple variance, permet de calculer toutes les COvariancesd’accroissements quelles qu’elles soient. Mais la situation est toutedifferente ici. Un developpement sans difficulte prouve en effet quesi, de facon evidente et independamment de x,

γij

(h) = γij

(x, h;x, h)

c’est-a-dire si la fonction γij

permet de connaıtre la fonction γij

,en revanche, la connaissance de γ

ijn’entraıne pas celle de γ

ij.I I I

Plus precisement, a l’aide des fonctions γij

(h), on peut seulement

exprimer des quantites de la forme6

γij

(x, a; y, b) + γji

(x, a; y, b)

mais pas les γij

(x, a; y, b) consideres separement.

6L’explicitation est donnee en complement, en fin de chapitre.

Page 153: g é o Statistique

[9] – Introduction a la Geostatistique Multivariable 151

En resume, on sait d’avance que l’on sera incapable d’exprimer lavariance de toutes les CLA en termes de variogrammes croises, sauf dansdes circonstances tres particulieres. C’est dire que la fonction γ

ij(h) est

a priori inadequate pour entreprendre des estimations multivariables entoute generalite.

2.4. Liens entre covariances et variogrammes croisesEn fait, ce caractere limitatif des variogrammes croises se manifeste dansleur definition meme. Il est clair en effet que, par construction, γ

ij(h)

est une fonction paire, qui de ce fait ne voit pas les Decalages entrevariables. C’est donc un outil d’investigation limite par comparaison auxcovariances croisees (lorsque celles-ci existent, naturellement).

Cette particularite peut etre precisee dans le cadre stationnaired’ordre 2. Il existe alors un jeu de covariances croisees, et a fortiori devariogrammes croises, et on etablit immediatement grace aux definitions[10] et [12] :

γij

(h) = Kij

(0) −K

ij(h) +K

ij(−h)

2

Ainsi, le variogramme croise ne voit que la composante paire desCovariances Croisees. On en conclut que le variogramme croise ne seraun outil operatoire que dans le cas particulier de variables ne presentantpas de Decalages entre elles.

Pourtant, en depit de sa moins grande finesse explicative, le

J J J

Variogramme Croise est beaucoup plus contraignant que la CovarianceCroisee dans la pratique de l’Analyse Variographique. En effet, laconstruction d’une fonction experimentale γ

ij(h) par une moyenne

spatiale de produits de la forme

(

z(x+ h, i) − z(x, i))

.(

z(x+ h, j) − z(x, j))

exige de connaıtre simultanement les deux variables zi

et zj

auxdeux points x et x + h , ce qui constitue une contrainte tres fortesur l’echantillonnage. Notons en revanche qu’une telle exigence ne sepresente pas pour le calcul d’une covariance croisee. En bref, avec levariogramme croise, on perd sur tous les tableaux7 .

Pour pallier cette importante difficulte, effectivement bien connue despraticiens, certains auteurs ont voulu introduire une notion hybride de Cite dans Wackernagel,

1992, p49.pseudo-variogramme croise π

ij(h), defini par

πij

(h) =1

2Var [Z(x+ h, i) − Z(x, j)]

D’un point de vue mathematique, il s’agit bien de la demi-variance d’unaccroissement quelconque sur l’espace produit R

n × D, et il est doncnaturel que cette fonction permette de calculer toutes les covariancescroisees, lorsqu’elles existent : on retrouve tout simplement le resultat De fait, nous nous

retrouvons dans le casmonovariable, seul achange l’espace de travail.

bien connu du cas monovariable. Cependant, au niveau physique, ilest presque inutile de souligner les risques d’incoherence d’une telledefinition, meme si les variables i et j sont de meme nature.

C’est vers une fonction de type γij

(x, a; y, b) qu’il faudrait s’orienter Meme dans le casisotopique, le calculexperimental de tellesfonctions est tres delicat.

pour sauver l’efficacite des outils du modele intrinseque tout engardant un sens physique aux operations numeriques. Mais avant meme

7Voir discussion en fin de chapitre.

Page 154: g é o Statistique

152 Aide-Memoire de geostatistique lineaire :

d’envisager les difficultes de modelisation d’une telle fonction, ce sontles contraintes sur l’echantillonnage, pires encore que dans le cas duvariogramme croise, qui ne laissent aucun espoir en general de pouvoireffectuer une Variographie realiste.

C’est pourquoi, sauf indication contraire, nous nous restreindrons dansla suite de ce chapitre au cadre FASt-2, afin d’eviter d’envisager au plantheorique des situations que l’on n’a pour ainsi dire aucune chance derencontrer dans le cadre d’une etude pratique realiste. Cette hypothesede stationnarite d’ordre 2 pourra d’ailleurs aussi bien concerner le modeleSous-Jacent, c’est-a-dire que nous examinerons aussi le cas d’un KrigeageUniversel multivariable ; l’approche multivariable en termes de FAI-k8

ne sera en revanche pas abordee dans ce document.

3. Cokrigeage de FASt-2 d’esperances nulles

3.1. Construction du systeme de cokrigeage simpleLa demarche habituelle de construction du krigeage n’est affectee en rienpar le passage au multivariable, et l’on peut donc suivre les quatre etapesqui caracterisent l’estimation lineaire. Effectivement, Du point de vueconceptuel, il n’apparaıt aucun element nouveau.

On peut meme etre encore plus expeditif dans la construction de cepremier cokrigeage : le point de vue explicite au paragraphe 1.4,qui ramene un probleme multivariable a un probleme monovariablesur l’espace produit R

n × D, nous enseigne que le systeme quenous cherchons a construire se transcrit instantanement du systeme

L A U O

Fasc. 5, p187.

de Krigeage Simple en remplacant les sommations sur Rn par desChapitre 6,

paragraphe 3.3.1.sommations sur R

n×D, et la fonction de covariance par le jeu completdes Covariances croisees.

Si on adopte comme convenu des ecritures en termes de mesures,Paragraphe 1.4.

l’estimateur de la variable i0

(ou i0∈ D ) au point x

0(ou x

0∈ R

n)est de la forme generale

Z∗(x0 , i0) =∑

j∈D

Sj

λj(dy) Z(y, j) [13]

ou la mesure λ — qui sera notee λS, avec un indice S commeNaturellement, la mesure

solution des equationsest fonction de la

variable cible et dupoint geographique cible.

simple, pour la distinguer d’autres solutions — est caracterisee parle systeme d’equations

j

Sj

λj

S(dy) K

ij(x, y) = K

ii0(x, x0)

(

∀(x, i) ∈ S)

[14]

L’estimateur de Cokrigeage Simple est donc donne par

Z∗S(x

0, i

0) =

j∈D

Sj

λj

S(dy) Z(y, j)

et la variance de cokrigeage correspondante est

σ2S(x

0, i

0) = K

i0

i0(x

0, x

0) −

j∈D

Sj

λj

S(dy) K

ji0(y, x

0)

8Voir [Matheron, 1982] : bien que consacree au modele particulier de l’Analyse

Krigeante, cette note constitue une reference pour une premiere approche du

multivariable en termes de FAI-k.

Page 155: g é o Statistique

[9] – Introduction a la Geostatistique Multivariable 153

Remarques sur les notations :

• l’ensemble S des donnees est defini par la formule [4] ;

• lorsqu’il n’y aura pas de risque d’ambiguıte, on s’abstiendradesormais de preciser les domaines de sommations, etant bienentendu que les indices i, j, . . . parcourent l’espace D qui designeles variables, et que les integrales sont effectuees dans l’espacegeographique R

n.

• Naturellement, dans la pratique, il ne s’agira jamais d’integrales,

Paragraphe 1.4.

mais de sommes sur un nombre fini de points de donnees. Ainsi,dans la pratique, le Cokrigeage simple s’obtient en resolvant unsysteme de N equations a N inconnues, N etant le cardinal del’ensemble S ;

• classiquement, pour ne pas alourdir les notations, on ne precise pasdans les ecritures que la mesure solution λj(dy) depend evidemmentde la variable i

0a estimer, et du point x

0ou l’on demande cette

estimation.

3.2. Proprietes du systemeDe facon generale, les proprietes du systeme de Cokrigeage simplene representent rien de nouveau au plan theorique : le point devue multivariable = monovariable sur un espace produit permetde transposer sans difficulte les resultats acquis dans les chapitresprecedents. Mais comme les notations sont parfois un peu embrouillees,on profite de la grande simplicite du modele FASt-2 d’esperancesnulles pour recapituler une fois pour toutes ces proprietes qui nousaccompagneront dans tous les modeles ulterieurs, a des modifications dedetail pres qui seules seront alors mentionnees au coup par coup.

3.2.1. Structure du systeme

Au niveau pratique, lors de la constitution d’un systeme de Cokrigeage, ilest d’usage de classer les donnees par variables. Ainsi, la matrice globale— qui synthetiquement pourrait s’ecrire comme dans le cas monovariable

(Kαβ )

ou les indices α, β, . . . designent des elements (x, i) de S — est engeneral presentee sous la forme :

K11

(α1,β

1) K

12(α

1,β

2) · · · K

1d(α

1,β

d)

K21

(α2,β

1) K

22(α

2,β

2) · · · K

2d(α

2,β

d)

......

...

Kd1

(αd

,β1) K

d2(α

d,β

2) · · · K

dd(α

d,β

d)

(Dans cette presentation, l’ecriture (αi, β

j) designe la paire de points

de donnees courants, respectivement dans Si

et Sj.) Paragraphe 1.4.

3.2.2. Conditions de regularite

Dans le cas particulier du cokrigeage en FASt-2 d’esperances nulles,l’absence de Fonctions de Base dans le systeme rend la condition deregularite peu instructive. Il faut et il suffit, en effet, que la matrice decovariances K soit de type positif strict. Cette matrice est

trivialement symetrique,y compris dansle cas complexe.

Mais, meme si cela est probablement tres dangereux au plan pratique,rien n’interdit theoriquement d’envisager qu’il n’y ait aucune donneerelative a la variable a estimer. Autrement dit, avec les notationsadoptees pour construire le systeme, on pourrait supposer que S

i0est

Paragraphe 3.1.

vide sans pour autant que cela implique necessairement la singularite

Page 156: g é o Statistique

154 Aide-Memoire de geostatistique lineaire :

du systeme. A titre d’exemple, il suffit pour s’en convaincre de poser lesequations de l’estimation

Z∗(x0, i

0) =

Sj

λj(dy) Z(y, j)

sans sommation sur j, mais en supposant j 6= i0

: aucune contradictionn’apparaıt a priori . . .

On se trouve clairement ici au-dela du Seuil de Realisme9 . Une fois de

A titre de tresfacile exercice.

plus, on est confronte a une dialectique desormais classique : un modeletrop contraignant comme l’est le modele multi-stationnaire d’esperancesnulles ouvre la porte a des developpements qui sont acceptablesau niveau strictement mathematique, mais qui semblent imprudentslorsqu’ils sont appliques dans un cas reel — encore qu’ici apres tout,une telle estimation sans donnees sur la variable d’interet n’est jamaisqu’une regression lineaire comme on en rencontre souvent. . . En toutcas, a l’evidence, le cadre multivariable requiert un sens critique accruquant a la confiance que l’on peut accorder aux modeles mis en œuvre.L’experience montre de fait que la pratique du multivariable peut sereveler plus delicate, et meme beaucoup plus delicate, que celle de lageostatistique monovariable.

3.2.3. Separation des variables

Dans le cas particulier ou les differentes variables sont independantes,les Covariances Croisees sont toutes identiquement nulles, et la matricede Cokrigeage se simplifie en

K11

(α1,β

1) · · · 0

0 K22

(α2,β

2) · · · 0

......

...

0 0 · · · Kdd

(αd

,βd)

Il y a separation des variables, et il est immediat de voir que pourconstruire Z∗(x

0, i

0), il suffit de realiser un Krigeage Simple

(monovariable) sur la variable i0, les donnees relatives aux autres

variables etant affectees d’un poids nul. Ce resultat est naturellementparfaitement intuitif, une variable non correlee avec la variable d’interetne pouvant apporter aucune information. Incidemment, cette Separationdes Variables n’interdit pourtant pas de realiser l’estimation memeToujours cette propriete,

propre au modele FASt-2sans derive. si aucune donnee n’est disponible sur la variable d’interet : mais

l’estimateur optimal sera alors egal a 0. . . situation mathematiquementacceptable certes, mais bien peu realiste10 .

Mais au-dela de la situation simpliste causee par l’independancedes variables, cet exemple montre qu’en certaines circonstances, lesysteme de Cokrigeage peut autoriser des simplifications notables. Enl’occurrence, c’est d’abord la taille du systeme qui est en cause, doncle temps calcul requis. Aussi dans la pratique, on cherchera autant

9De facon plus nuancee, cela depend de la confiance que l’on peut accorder a

la determination des moyennes (mais c’est un probleme general du KS) et a la

correlation entre variables. [Note d’un relecteur].10

Nouvelle affirmation a nuancer, ou au moins a preciser : en l’absence de donnees

locales et d’information apportee par d’autres variables, on ne peut rien produire

d’autre que la valeur moyenne a priori : reste a savoir quelle confiance lui

accorder. [Note d’un relecteur].

Page 157: g é o Statistique

[9] – Introduction a la Geostatistique Multivariable 155

que faire se peut a se placer dans des conditions permettant de tellessimplifications. Ce point sera examine dans un paragraphe suivant,toujours dans le cadre FASt-2 sans derive pour eviter les surchargesde notations.

3.2.4. Le cokrigeage, interpolateur exact

On supposera naturellement toujours par la suite que le systeme deCokrigeage est regulier. Alors, classiquement, la propriete d’interpolationexacte du Cokrigeage se demontre par verification. Il est immediat quesi l’on cherche a estimer une variable en un point ou elle est connue, nonseulement les valeurs de donnees de cette variable en tous les autrespoints seront affectees d’un poids nul, mais il en sera de meme desdonnees de toutes les autres variables, meme au point a estimer.

Nous ne reviendrons plus sur cette propriete, qui subsistera de facon

Paragraphe 5.

presque evidente dans le cas du Cokrigeage Universel.

3.2.5. Superposition des figures de cokrigeage

De nouveau, ce resultat se verifie immediatement, par linearite desequations ; et cette verification constitue une demonstration si le systemeest suppose regulier.

Symboliquement, ∀x,

(A+B)∗Cok

(x) ≡ (A)∗Cok

(x) + (B)∗Cok

(x)

C’est essentiellement cette propriete de coherence entre variables quidans la pratique justifie le recours a une technique qui, il faut bienen convenir, est souvent lourde et de manipulation delicate. Aussilongtemps naturellement que les variables manipulees sont reliees pardes operations lineaires, on est assure par le formalisme du Cokrigeagede retrouver au niveau des estimateurs les liens existant au niveaudes variables physiques — ce qui constitue le principal atout et lajustification de cette approche.

3.2.6. Relation d’orthogonalite

Le parti-pris de considerer le cas multivariable comme du monovariablesur l’espace R

n ×D nous garantit a priori l’existence d’une proprieted’orthogonalite : de fait, on verifie immediatement que les equations Chapitre 7,

paragraphe 2.4.4.[14] s’ecrivent, ∀(x, i) ∈ S,

Cov[

Z∗S(x0 , i0) − Z(x0 , i0) , Z(x, i)

]

= 0

Par suite, par linearite de la covariance, l’erreur de CokrigeageSimple est orthogonale a toute combinaison lineaire des donnees.

3.3. Elements de reflexion generale sur le cokrigeageBien que nous ne soyons encore actuellement que dans le cadre le plusrestrictif des FASt-2 sans derive, il est bon d’indiquer des a presentquelques remarques qui ne feront que prendre plus d’acuite a mesureque les hypotheses de travail seront moins exigeantes — donc que lesmodeles seront plus generaux.

Ainsi, il a deja ete mentionne que plus que le Krigeage monovariable,le Cokrigeage risquait de se heurter au Seuil de Realisme. Dans lamesure meme ou le modele structural est considerablement enrichi

Page 158: g é o Statistique

156 Aide-Memoire de geostatistique lineaire :

par la combinatoire des variables, l’inference statistique — ou plutot,pour respecter la terminologie de Estimer et Choisir, laReconstruction Operatoire — peut se derouler dans des conditionsextremement delicates. Que l’on imagine quelques variables seulement,presentant deux ou trois structures (gigognes) imbriquees et quelquescoefficients d’anisotropie, et ce sont deja plusieurs dizaines au moins devariogrammes experimentaux qu’il faut calculer d’abord, puis modeliserdans un ensemble coherent. Et s’il est possible, comme cela semblepreferable, de travailler sur des Covariances Croisees, il faut prevoirle diagnostic, puis la modelisation d’eventuels Decalages. . . D’emblee,le Cokrigeage est gourmand en donnees, et la richesse meme de lacombinatoire des parametres laisse presager de grandes instabilites dansle calage numerique du modele.

L’experience montre aussi que les variogrammes croises experimentauxsont souvent numeriquement plus instables que les variogrammesmonovariables. N’oublions pas non plus les difficultes inherentes auxjeux de donnees heterotopiques. Enfin, les modeles traditionnellementutilises pour representer des coregionalisations sont probablement troplimitatifs, et il est vraisemblable qu’une recherche est encore necessairepour enrichir theoriquement la phase de modelisation.

Pourtant, quelque fruste ou instable que soit le modele, il concluratoujours que l’ajout de variables (toutes choses egales par ailleurs)ameliore l’estimation. Et cela est comprehensible : en rajoutant del’information, nous ne pouvons qu’obtenir de meilleurs resultats —selon le diagnostic du modele en tout cas, c’est-a-dire en termes devariance theorique de krigeage. Rien dans le processus de Variographied’abord, dans le choix de la Configuration de Krigeage ensuite, ne metle praticien en garde contre les risques encourus en se fiant aveuglementaux jugements que le modele porte sur lui-meme. Ce genre de difficultesavait deja ete rencontre, et ne devrait plus nous surprendre : le modelemultivariable presente un important caractere auto-justifiant.I I I

La reponse a ce genre de difficulte releve du domaine de la pratique et del’experience. Dans un cadre aussi mouvant que le multivariable, il fautsavoir revenir chaque fois que possible aux donnees physiques, et garderle controle permanent du modele : en amont, critique soigneuse desdonnees ; en aval, validation des resultats ; et a chaque etape, applicationdu Principe d’Economie. Savoir renoncer a une information dont on nesaurait pas faire un usage raisonnable, peut se reveler beaucoup plussage et plus efficace que jongler avec des notions mal maıtrisees ou maladaptees a la situation concrete.

Une autre remarque generale peut etre faite au sujet du Cokrigeage,qui elargit une ancienne observation sur les limites de la GeostatistiqueChapitre 3,

paragraphe 3.3.Lineaire. Dans le systeme de Cokrigeage, les differentes variables jouentdes roles symetriques. Naturellement, on devine que les poids deCokrigeage privilegieront les donnees relatives a la variable que l’onestime ; mais cette rupture de symetrie semble venir un peu tard : enTerminologie un peu

provocante, empruntee ala physique contemporaine. somme, elle procede du meme mecanisme qui en Krigeage monovariable

fait preferer les donnees proches du point a estimer (c’est-a-dire leuraccorde un poids plus important). Mais bien souvent, dans les problemesreels, la dissymetrie a un caractere beaucoup plus fondamental : ondistingue par exemple une variable d’interet et des variablesexplicatives, et il semblerait souvent essentiel de faire comprendre aumodele cette hierarchie de l’information — ce que le Cokrigeage ne saitpas faire par lui-meme.

Une autre dissymetrie, d’ailleurs souvent liee a la precedente, concernel’echantillonnage. Que l’on pense par exemple a la prospection petroliere(quelques donnees aux puits, des milliers de donnees geophysiques), auxgisements d’uranium (parfois moins de 10% des sondages sont analyses,

Page 159: g é o Statistique

[9] – Introduction a la Geostatistique Multivariable 157

le reste consistant seulement en donnees de radioactivite), etc. On peutdeviner que presque toute la qualite d’une etude multivariable tiendra al’elaboration des Configurations de Krigeage, etape decisive mais presqueexclusivement empirique. A lui seul, le modele — en l’occurrence duCokrigeage — est incompetent pour juger de la pertinence de nos choix.C’est pourquoi il ne faut pas hesiter, lorsqu’une etude demande unereflexion approfondie, a mettre en parallele les avantages et inconvenientsde differentes methodes.

Dans cette optique, il est legitime de considerer que le KrigeageUniversel, et plus encore le modele deja evoque de Derive Aleatoire, Chapitre 7.Chapitre 7,

paragraphe 4.3.constituent des reponses possibles a des problemes bivariables, et doncdeux alternatives au Cokrigeage. Nous en proposerons une autre dansla suite de ce chapitre. Mais il n’est pas question de donner ici unerecette, et de designer le bon choix. Bien au contraire, ilfaut rappeler que les choix methodologiques demeurent de la seuleresponsabilite du Geostatisticien : il n’y a pas de choix juste ou faux, Une repetition, certes,

une fois de plus ; maisprobablement utile ! (cf.Chapitre 1, paragraphe 1.)

mais seulement — et en general le diagnostic ne vient qu’apres coup— des choix judicieux ou non, efficaces ou non, opportuns ou non, quejamais le modele ne pourra faire a notre place : tout au plus pourra-t-ilparfois nous aider, et encore, pas toujours loyalement !

Il n’etait sans doute pas inutile que ces vues generales, bien sur inspireesde Estimer et Choisir, soient rappelees lors d’une introductiona la Geostatistique Multivariable, domaine propice aux pieges contrelesquels nous met en garde G.Matheron.

Une derniere remarque pour conclure, mais une remarque qu’il nefaudrait surtout pas prendre trop a la lettre, et encore moins commele contre-pied des reflexions generales qui precedent.

Lorsque les donnees disponibles pour une etude multivariable sont assezproches du cas isotopique11 , il semble raisonnable de penser que la priseen compte d’une variable supplementaire presentera peu d’avantagesdans deux cas :

• si cette variable est sans correlation significative avec la variabled’interet — puisqu’alors elle n’apportera aucune information ;

• si cette variable est en tres forte correlation lineaire (positive ounegative, d’ailleurs) avec la variable d’interet — puisque cette foisil y aura redondance d’information.

Notons d’ailleurs que le modele reagira tres differemment selon lescas : dans la premiere situation, on aura sans doute apparition deponderateurs tres faibles, qu’il aurait mieux valu ne pas perdre de tempsa calculer — ce qui est un inconvenient somme toute benin ; dans laseconde, on risque d’obtenir des systemes mal conditionnes, et donc desgrandes instabilites numeriques — ce qui est beaucoup plus dangereux.

Quoiqu’il en soit, s’il fallait donner une idee tres vague, et sansdoute riche en contre-exemples, d’une strategie multivariable, onpourrait penser que le Cokrigeage s’accommode assez bien de situationsou les variables se presentent sur un pied d’egalite, tant auniveau couplage statistique qu’en ce qui concerne l’echantillonnage. Aucontraire, les situations fortement hierarchisees (variables preeminentes,grandes heterogeneites des echantillonnages) devraient inciter a chercherdes methodes plus ciblees.

Compte-tenu de la tres grande variete de ces modeles specifiques que l’onpeut proposer dans le cadre multivariable, nous ne pourrons ici qu’en

11Une fois de plus, on donne volontairement a cet enonce une formulation intuitive.

Plus encore que dans la Geostatistique monovariable, le doigte (pour ne pas dire le

flair) du praticien est ici decisif, plus sans doute que ne le serait une definition

rigoureuse de ce que peut etre la proximite de l’Isotopie.

Page 160: g é o Statistique

158 Aide-Memoire de geostatistique lineaire :

presenter quelques exemples particuliers, a titre de simples illustrations.Au prealable, le modele FASt-2 d’esperances nulles etant troprestrictif, nous allons proposer un elargissement des hypotheses, afin dedevelopper maintenant le Cokrigeage dans son cadre le plus general.

4. Le cokrigeage universel

4.1. Dernier retour sur le modele intrinseque

Les commentaires precedents sur les proprietes du Variogramme CroiseParagraphe 2.3.–2.4.

ont montre que ce n’est que dans le cas tres favorable de variablessans Decalages qu’il est possible en toute generalite de calculer lavariance d’une CLA quelconque, donc en consequence de realiserun Cokrigeage. Encore cette situation est-elle tout-a-fait paradoxale,puisque le Variogramme Croise n’est pas en mesure de diagnostiquerpar lui-meme l’absence de Decalages12 .

Cela dit, si l’on admet que ce diagnostic a bien eu lieu, il est possiblede developper des calculs de variances multivariables en hypotheseintrinseque, par application de la Regle de Substitution dont onpeut aisement s’assurer qu’elle demeure valable. La nouveaute tienta la presence de conditions d’autorisation, qui exigent que l’erreurd’estimation

Z∗(x0, i

0) − Z(x

0, i

0) =

j∈D

Sj

λj(dy) Z(y, j) − Z(x0, i

0)

soit une combinaison lineaire d’accroissements pour chacune desvariables j. La notation [3] est ici plus parlante et, pour l’estimationParagraphe 1.4.

de la variable i0

au point x0, on obtient le jeu de contraintes :

Si0

λi0 (dy) = 1

Sj

λj(dy) = 0 (∀j 6= i0)

Il est clair que la premiere de ces conditions ne peut etre satisfaite si

le domaine Si0

est vide, c’est-a-dire si l’on ne dispose d’aucune donnee

relative a la variable a estimer. C’est une nouveaute par rapport aumodele FASt-2 d’esperances nulles, et qui procede d’une dialectiquemaintenant bien connue : lorsqu’on generalise un modele structural (ceCette dialectique est

typiquement cellequi a ete rencontree

en GeostatistiqueIntrinseque, chapitre 8.

qui est le cas lorsqu’on passe du modele FASt-2 d’esperances nulles aumodele FAI), on introduit de nouvelles contraintes sur la classe des objetsauxquels ce modele peut etre applique.

D’un point de vue plus algebrique, on peut aussi considerer cesconditions comme une manifestation particuliere de la conditiond’Independance Lineaire des Fonctions de Base sur les donnees, requiseLes fonctions

de base sont enl’occurrence les constantes. pour garantir la regularite du systeme. D’autres expressions moins

simplistes de cette condition seront rencontrees ulterieurement.

Pour conclure, on notera que l’apparition de la condition Si0

6= ∅va dans le sens d’un plus grand realisme dans la mise en œuvre del’estimation. Toutefois, sauf cas exceptionnel, les inconvenients du travail

12Voir discussion en fin de chapitre.

Page 161: g é o Statistique

[9] – Introduction a la Geostatistique Multivariable 159

en Variogrammes Croises apparaissent redhibitoires13 , et le modeleintrinseque multivariable ne sera plus evoque dans la suite du chapitre.

4.2. Les equations du cokrigeage universel

On se place donc desormais definitivement dans le cadre d’un modeleSous-Jacent stationnaire d’ordre 2.

4.2.1. Description de la derive

Il ne serait pas difficile, sinon peut-etre au niveau des notations,de construire le systeme de cokrigeage en presence de Derives(eventuellement de degres differents) pour un modele Sous-Jacentstationnaire d’ordre 2, en decrivant separement chacune des Derivesm

i(x) par un developpement ad hoc (on adopterait donc le point de Paragraphe 1.4.

vue de la formule [5]). C’est du reste ce que l’on fait en pratique lorsqu’il C’est aussi le pointde vue developpeau paragraphe 5,pour introduire lacorrelation intrinseque.

s’agit de traiter un probleme particulier : il n’est pas rare alors quel’on puisse introduire des simplifications d’ecriture, ce qui n’est pasnegligeable pour la lisibilite des calculs et des resultats.

Cependant, en toute generalite, le plus simple est de se laisser unenouvelle fois guider par le point de vue multivariable sur R

n =monovariable sur l’espace S = R

n ×D , et de se borner a transcrireles ecritures desormais classiques du Krigeage Universel. On supposedonc que la FA Z peut se decomposer sous la forme

Z(x, i) = Y (x, i) + m(x, i) (x, i) ∈ Rn ×D [15]

ou Y (x, i) est une FASt-2 d’esperance nulle et de covariance Kij

, et

m(x, i) admet le developpement [7] : Paragraphe 1.4.

m(x, i) =∑

l

alf l(x, i) [7]

Le seul point constituant une nouveaute est la description de la derive :afin de beneficier au maximum du formalisme monovariable, on considereen effet qu’il n’y a qu’une seule derive. On choisit donc une famille J J J

de Fonctions de Base definies sur S, c’est-a-dire de la forme f l(x, i).Ainsi, dans le developpement [7], la famille des coefficients (inconnus) a

l

depend d’un seul indice, et en particulier n’est pas indexee sur l’espaceDdes variables. Ce dispositif, qui peut paraıtre deroutant, est au contraire Comme exemple de lien

entre derives, on pourraitpar exemple imaginer quela derive d’une variablesoit la derivee de la derived’une autre, ou encoreque deux variables aientleur derive en commun. . .

d’une grande souplesse : que les derives des differentes variables soientalgebriquement independantes ou qu’elles soient liees, un formalismeunique permet d’ecrire les equations du Cokrigeage Universel. Lesseules differences tiendront au choix de ces fonctions de base, mais celan’affectera en rien la demarche ulterieure de construction du systeme.

Pour illustrer ces propos sans doute un peu abstraits, nous pouvonspresenter un exemple simple : le cas de deux variables considerees dansun espace geographique a 1 dimension. On a donc ici

S ⊂ R1 × 1, 2

et on se propose d’examiner quelques situations assez courantes :

• cas ou les deux derives m(x, 1) et m(x, 2) sont algebriquementindependantes. Supposons ainsi que m(x, 1) soit de degre k

1, et

13Propos volontairement excessif, mais la mise en garde est surement justifiee. Dans

la pratique, la plus grande robustesse du variogramme croise lui conserve des

atouts par rapport a l’utilisation des covariances, mais cet aspect de la pratique

du multivariable ne sera pas examine ici.

Page 162: g é o Statistique

160 Aide-Memoire de geostatistique lineaire :

m(x, 2) de degre k2. Alors, la famille des fonctions de base contient

k1 + k2 + 2 elements, definis par exemple ainsi (∀x ∈ R) :

f0(x, 1) = 1 f0(x, 2) = 0

f1(x, 1) = x f1(x, 2) = 0

......

fk1(x, 1) = xk1 fk1(x, 2) = 0

fk1+1(x, 1) = 0 fk1+1(x, 2) = 1

fk1+2(x, 1) = 0 fk1+2(x, 2) = x

......

fk1+k2+1(x, 1) = 0 fk1+k2+1(x, 2) = xk2

• cas ou les deux derives m(x, 1) et m(x, 2) sont egales, de degre k.Cette fois, on pourra prendre la famille

f0(x, 1) = 1 f0(x, 2) = 1

f1(x, 1) = x f1(x, 2) = x

......

fk(x, 1) = xk fk(x, 2) = xk

• enfin, on pourrait imaginer par exemple que la derive m(x, 2) soitla derivee de m(x, 1). En supposant m(x, 1) de degre k, la relation

m(x, 2) =d

dxm(x, 1)

sera prise en compte par la famille

f0(x, 1) = 1 f0(x, 2) = 0

f1(x, 1) = x f1(x, 2) = 1

f2(x, 1) = x2 f2(x, 2) = 2x

......

fk(x, 1) = xk fk(x, 2) = k xk−1

On peut bien sur envisager des couplages encore plus exotiques.Mais le formalisme adopte rend inutiles des developpements particuliers,et l’expression de la Derive sous la forme [7] permet de decrire toutesles situations, pourvu naturellement qu’en pratique la famille f l ait etechoisie judicieusement.

Par commodite, on designera dans la suite par k le nombre de FonctionsI I I

de Base, etant bien entendu, a la lumiere des exemples precedents, quece nombre ne s’identifie pas au degre de la derive. . .

4.2.2. Construction du systemeAvec les choix de notations qui ont ete faits, il est inutile de developperles quatre etapes de construction du systeme : on sait par avance que leL A U Oresultat se transcrit exactement du systeme de Krigeage Universel, soit :Chapitre 7,

paragraphe 3.3.

Z∗(x0, i

0) =

j∈D

Sj

λj

U(dy) Z(y, j) [16]

Page 163: g é o Statistique

[9] – Introduction a la Geostatistique Multivariable 161

ou la mesure λU

est caracterisee par le systeme d’equations —(∀(x, i) ∈ S, ∀l ∈ 1, 2, · · · , k)

j∈D

Sj

λj

U(dy) K

ij(x, y) +

s

µU sfs(x, i) = K

ii0(x, x

0)

j∈D

Sj

λj

U(dy) f l(y, j) = f l(x

0, i

0)

[17]

le nombre de multiplicateurs de Lagrange µ etant egal au nombre kde fonctions de base. Quant a la variance de cokrigeage, elle s’ecrit

σ2U(x0 , i0) = K

i0

i0(x0 , x0) −

j∈D

Sj

λj

U(dy) K

ji0(y, x0) −

s

µU sfs(x0 , i0)

[18]

Si l’on autorise l’ensemble des variables a se reduire a un seul element, Une affirmation certesparfaitement exacte, maispurement academiquevoire esthetisante, etqui n’aide en rien al’approche pratique !

et l’ensemble des fonctions de base a etre vide, les deux expressions [17]et [18] resument la totalite des krigeages que nous avons rencontres dansle present document. . .

4.3. Complements sur le cokrigeage universel

4.3.1. Proprietes algebriques du cokrigeage universel

Le systeme de Cokrigeage etant classiquement suppose regulier14 , lesproprietes qui en decoulent sont immediates :

• on observe la superposition des figures de (co)krigeage. On rappelleque cette propriete essentielle est une des principales raisons derecourir a un Cokrigeage ;

• le Cokrigeage est un interpolateur exact ;

• l’erreur de Cokrigeage est orthogonale a toute combinaison lineaire

Comme toujours, cesproprietes se verifientinstantanement, etcette verification vautdemonstration lorsquele systeme est regulier.

des donnees qui filtre les Fonctions de Base sur les donnees.Autrement dit, si une mesure ν verifie

∀l ∈ 1, 2, · · · , k :∑

j

Sj

νj(dy) f l(y, j) = 0 [19]

l’erreur de Cokrigeage est orthogonale a la combinaison lineaire

d’integrales∑

j

Sj

νj(dy)Z(y, j), ce qui s’ecrit :

Cov

Z(x0, i

0) − Z∗(x

0, i

0) ,

j

Sj

νj(dy)Z(y, j)

= 0

14Le grand nombre de cas de figure envisageables — par exemple de couplages entre

les derives — entraıne naturellement une multiplication des risques de produire un

systeme singulier. La notion de configuration degeneree devient d’une grande

variete. . . Dans la pratique, le plus sage est sans doute d’examiner les situations

au cas par cas.

Page 164: g é o Statistique

162 Aide-Memoire de geostatistique lineaire :

4.3.2. Regularite du systemeOn verifiera sans difficulte que la demonstration proposee dans le cadreAnnexe 5.

des FAI-k se transpose dans le cas du Cokrigeage Universel a modeleSous-Jacent stationnaire d’ordre 2.

La seule difference tient a la signification de conditions qui, par ailleurs,ont exactement la meme structure. En effet, le modele Sous-Jacentetant ici, par hypothese, stationnaire d’ordre 2, toutes les combinaisonslineaires sont autorisees. Aussi, par conditionnel, il faut comprendreici : concernant des mesures qui filtrent les k fonctions de base. Lanotion de filtrage se substitue a la notion d’autorisation.

Ainsi, dire que la matrice des covariances (croisees) qui apparaıt dansle systeme de Cokrigeage doit etre positive conditionnelle strictesignifie que, pour toute mesure ν satisfaisant aux contraintes [19]

∀l ∈ 1, 2, · · · , k :∑

j

Sj

νj(dy) f l(y, j) = 0 [19]

on a l’implication :

i,j

Si

Sj

νi(dx)Kij

(x, y) νj(dy) = 0

=⇒ ν = 0

Rappelons, a la lumiere des trois exemples proposes precedemment, queParagraphe 4.2.1.

la structure de la famille f l des fonctions de base peut etre assez variee,et qu’il en sera par suite de meme des conditions [19]. Cette varietese repercutera egalement sur l’explicitation de la seconde conditionnecessaire de regularite du systeme, a savoir l’Independance Lineairedes Fonctions de Base sur les Donnees.

Mais fondamentalement, le resultat est exactement le meme qu’enmonovariable : le systeme de Cokrigeage est regulier si et seulementsont satisfaites simultanement les deux conditions :

• matrice de covariance positive conditionnelle stricte sur les donnees ;

• fonctions de base lineairement independantes sur les donnees.

4.3.3. Coestimation optimale des coefficients de la deriveLa convention [7] choisie pour representer la Derive n’est peut-etre pas laplus naturelle dans certains cas particuliers, par exemple lorsque toutesles fonctions m

i(x) definies par [5] peuvent se developper selon uneParagraphe 1.4.

famille de fonctions de base commune.

Toutefois, d’un point de vue theorique, le choix de ne considerer qu’unseul developpement

m(x, i) =∑

l

alf l(x, i)

est extremement commode, puisqu’il permet de reduire la question de lacoestimation des coefficients de la Derive a une estimation classique, telleLe point important dans

cette optique, c’est qu’iln’y a qu’une seule Derive. qu’elle a ete developpee lors de la presentation du Krigeage Universel.

Ainsi,

A∗l

=∑

j∈D

Sj

λj

l(dy) Z(y, j)

ou λj

l(dy) est solution du systeme

j∈D

Sj

λj

l(dy) K

ij(x, y) +

s

µlsfs(x, i) = 0

j∈D

Sj

λj

l(dy) fs(y, j) = δs

l

[20]

Page 165: g é o Statistique

[9] – Introduction a la Geostatistique Multivariable 163

(equations satisfaites ∀(x, i) ∈ S, ∀s ∈ 1, 2, · · · , k).

Avec ces notations, on retrouve classiquement :

Cov[

A∗t, A∗

l

]

= −µtl

Ces resultats sont valables quel que puisse etre le couplage eventuel(ou au contraire l’independance algebrique) entre les derives de chacunedes variables.

4.3.4. Presentation duale du cokrigeage universel

Enfin, grace a la modelisation [7] adoptee pour la Derive, on etablitimmediatement pour la forme duale du Cokrigeage Universel une Simple transcription

des ecritures ducas monovariable,etablies en annexe 3.

expression du type

z∗(x0, i

0) =

j∈D

Sj

ψj(dy)Kji

0(y, x

0) +

s

a∗s fs(x

0, i

0)

en adoptant ici encore une notation par des mesures. Cette expressionest valable ∀(x0 , i0) ∈ S, les mesures ψ et les coefficients a∗ etantsolutions du syteme — (∀(x, i) ∈ S, ∀l ∈ 1, 2, · · · , k)

j∈D

Sj

ψj(dy) Kij

(x, y) +∑

s

a∗s fs(x, i) = z(x, i)

j∈D

Sj

ψj(dy) f l(y, j) = 0

[21]

5. Recherche de simplification du cokrigeage universel

5.1. Position du probleme et hypotheses simplificatrices

Outre la difficulte de definir une strategie claire de construction desvoisinages, le Cokrigeage est de toute facon a priori plus lourd qu’uneestimation monovariable. Rappelons que le nombre d’inconnues desdifferents sytemes rencontres ([17], [20] ou [21]) est

Card(S) + k

un nombre qui peut tres vite devenir excessif. C’est pourquoi il estjudicieux de chercher a simplifier les calculs, soit en s’autorisantdes simplifications au niveau du modele, soit en recourant a desmanipulations algorithmiques qui faciliteront les calculs.

On examinera ici a titre d’exemple un cas particulierement favorable : Cet exemple est tired’un exercice classique :fasc. 5, pp207-208.

• on suppose que toutes les variables sont connues surle meme ensemble (Isotopie) ;

et simultanement

• on suppose que les derives de chacune des variabless’expriment toutes a l’aide des memes Fonctions deBase et sont algebriquement independantes.

Page 166: g é o Statistique

164 Aide-Memoire de geostatistique lineaire :

Par rapport a une approche monovariable, le cokrigeage conduit donc icia multiplier le nombre d’equations par d, d etant le nombre de variables.

On a deja vu qu’en l’absence de Derives (Cokrigeage simple),l’independance des Fonctions Aleatoires Z

ientraıne la separation des

variables au niveau de l’estimation, c’est-a-dire que le Cokrigeage sesimplifie en d Krigeages monovariables. Dans le cadre des hypothesesactuelles, on cherche maintenant a mettre en evidence une autrecondition suffisante de Separation des Variables, moins exigeante quel’independance des Z

i.

On suivra pour cela les etapes d’un exercice classique, en en harmonisant

Paragraphe 3.2.3.

Fasc. 5, p207-208.

seulement les notations avec celles du present document. En l’occurrence,c’est essentiellement l’ecriture de la Derive qui gagne ici a etre adaptee,et il sera commode dans ce cas particulier d’adopter l’expression [5] etParagraphe 1.4.

de presenter le developpement de chaque Derive sous la forme :

mi(x) =

l

ailf l(x) [22]

Dans cette ecriture, le numero de la variable est considere comme unindice des coefficients de la derive. Par ailleurs, comme par hypothesetoutes les variables sont connues sur le meme domaine, on designera parV ∈ R

n ce domaine commun.

5.2. Principal resultatLa suite de ce paragraphe n’est rien d’autre que la resolution de l’exercicedeja cite du Fascicule 5, et l’on a choisi d’en expliciter ci-aprestous les developpements de calcul. Mais les notations sont forcementrebarbatives, et peuvent masquer le cheminement de la construction etle sens des formules obtenues.

Annoncons donc des a present le principal resultat (on se place dans lesconditions definies au paragraphe precedent, isotopie et independancealgebrique des fonctions de base) :

• si d’une part on dispose d’une famille de fonctions aleatoires Zu(y)

— u ∈ D — et si on designe par λ les ponderateurs du Cokrigeagede cette famille

Z∗i(x

0) =

u∈D

V

λu

i(dy;x

0) Z

u(y) ,

• si d’autre part on definit une famille de FA transformees Zi(x) par

Zi(x) =

u∈D

Bu

iZ

u(x)

ou B est une matrice reguliere d’inverse B, alors, les ponderateursλ du Cokrigeage de la famille transformee

Z∗i(x0) =

u∈D

V

λu

i(dy;x0) Zu

(y)

se deduisent des λ par la relation

λj

i(dy;x

0) =

u,v

Bu

iB

j

v

u(dy;x

0)

ou i, j, u et v ∈ D. Des relations similaires peuvent etreetablies pour les multiplicateurs de Lagrange, ainsi que pour lesponderateurs d’estimation optimale de la derive.

Naturellement, comme la matrice B est essentiellement supposeereguliere, on dispose aussi de l’expression inverse, c’est-a-dire les λ

en fonction des λ.

Page 167: g é o Statistique

[9] – Introduction a la Geostatistique Multivariable 165

L’interet de ces regles de transformation resulte de la proprietede Separation des Variables lorsque les FA sont mutuellementindependantes. Si en effet la famille initiale des Z

i(y) peut s’exprimer

comme combinaison lineaire reguliere de FA Zu(y) independantes, alors

le cokrigeage des Z se reduit a un jeu de krigeages monovariables surles Z et d’applications des formules de transformation. Le benefice entemps calcul peut etre considerable.

Les sous-paragraphes 5.3 a 5.7 ci-apres ne font que developper cette

Paragraphe 3.2.3.

demarche, en explicitant des calculs embrouilles mais sans difficulte,qui en general ne figurent pas dans les documents de cours : cesparagraphes peuvent donc etre sautes sans inconvenient en premierelecture. Le sous-paragraphe 5.8, qui detaille un cas de simplificationparticulierement spectaculaire (le cokrigeage se reduit a un uniquekrigeage monovariable), peut de meme etre lu rapidement.

5.3. Adaptation des notations : cokrigeage

On doit s’attendre, dans le deroulement des calculs, a manipulersimultanement les estimations de plusieurs composantes. Il nous fautdonc explicitement mentionner, dans l’ecriture de la mesure λ solutiondu Cokrigeage, l’indice de la composante a estimer — precision engeneral superflue dans les constructions usuelles.

On designera donc par l’ecriture plus detaillee λu

i(dy;x

0) le poids de la

Rappelons que lesdifficultes de notationssont reelles ! Il estplaisant que la recherched’une simplification ducokrigeage commence parune notable complicationdes ecritures. . .

composante u (en dy) qui intervient dans le Cokrigeage de la composantei au point x

0. On notera d’ailleurs qu’il n’etait pas indispensable ici de

faire figurer ce point x0

de l’espace geographique ; on a cependantsouhaite proposer pour une fois la notation la plus complete (sinonla plus lisible), etant bien entendu qu’il est raisonnable lorsqu’aucuneambiguıte ne se presente d’alleger au maximum des ecritures de toutefacon bien rebarbatives. . .

Il faut egalement indicer en i (et x0) les multiplicateurs de Lagrange.

Le Cokrigeage [17] se reecrit alors, (∀i ∈ D et ∀x0∈ R

n) ,

Z∗i(x0 ) =

u∈D

V

λu

i(dy;x0) Zu

(y)

avec

u∈D

V

λu

i(dy;x

0) K

ju(x, y) +

k∑

s=1

µs;ji

(x0) fs(x) ≡ K

ji(x, x

0)

V

λj

i(dy;x0) f

l(y) ≡ f l(x0 ) δji

[23]

etant entendu que

• le symbole ≡ signifie l’egalite des fonctions en x0, x

0∈ R

n ;

• les equations d’optimalite sont verifiees ∀(x, j) ∈ S ou plutot, pourrester coherent avec le point de vue adopte dans ce paragraphe,∀j ∈ D et ∀x ∈ V ;

• les equations d’universalite sont verifiees ∀l ∈ 1, 2, · · · , k et∀j ∈ D (on supposera ici que k designe le nombre de fonctions debase commun a chacune des composantes). J J J

Page 168: g é o Statistique

166 Aide-Memoire de geostatistique lineaire :

On note incidemment sur ce systeme [23] que, pour les variables autresque la variable i a estimer, la somme des poids de Cokrigeage est nulle.En revanche, sur les donnees de Z

i, les poids satisfont aux conditions

habituelles d’universalite du KU monovariable.

5.4. Adaptation des notations : coefficients des derivesDe la meme facon, on reecrit le systeme d’estimation optimale descoefficients des Derives, c’est-a-dire des parametres a

ildefinis (cf. [5]

et [22]) par :

E [Zi(x

0)] =

l

ailf l(x

0) [24]

Le plus simple est de suivre les quatre etapes classiques, en cherchant aconstruire l’estimateur

A∗il

=∑

u∈D

V

λu

il(dy)Z

u(y) [25]

pour i ∈ D et l ∈ 1, 2, · · · , k fixes.

On obtient sans difficulte les k × d equations d’universalite

V

λj

il(dy) fs(y) = δj

i δsl [26]

requises ∀s ∈ 1, 2, · · · , k et ∀j ∈ D.

Quant aux equations d’optimalite, elles se deduisent classiquement de

L A U O

l’optimisation, sous les contraintes [26], de la variance

Var[

A∗il

]

=∑

u∈D

v∈D

V

V

λu

il(dx)λ

v

il(dy) K

uv(x, y) [27]

et prennent la forme

u∈D

V

λu

il(dy) K

ju(x, y) +

s

µij;ls

fs(x) = 0 [28]

∀j ∈ D et ∀x ∈ V . Si l’on designe par N le nombre de points dedonnees dans V (pour chacune des d variables), on dispose donc deN × d equations d’optimalite.

Incidemment, on peut regrouper les expressions [25], [26] et [27] pourretrouver la relation classique

Cov[

A∗il, A∗

js

]

= −µij;ls

[29]

dans laquelle on rappelle que A∗il

represente l’estimateur du coefficientde la l–ieme fonction de base dans la derive de la i–ieme composante.

5.5. Transformation lineaire reguliere des variables

On se propose dans un premier temps d’examiner l’impact d’unetransformation lineaire reguliere des variables sur les differentesestimations. On suppose donc qu’il existe une matrice B de dimensiond× d, d’inverse B, telle que

Page 169: g é o Statistique

[9] – Introduction a la Geostatistique Multivariable 167

Zi(x) =

uBu

iZ

u(x)

Zi(x) =

uBu

iZ

u(x)

[30]

ou les matrices B et B verifient

u

Bj

uB

u

i=

u

Bj

uB

u

i= δj

i [31]

D’une part, comme toutes les FASt-2 Z admettent les memes fonctionsde base f l, il en sera de meme de toutes leurs combinaisons lineaires, eten particulier de la famille des Z.

D’autre part, dans le cadre d’un modele Sous-Jacent stationnaired’ordre 2, toutes les combinaisons lineaires admettent une variance, etpar suite, la famille de FASt-2 Z admet un systeme de fonctions decovariances K :

Kij

(x, y) = Cov[

Zi(x) , Z

j(y)]

= Cov

[

u

Bu

iZ

u(x) ,

v

Bv

jZ

v(y)

]

=∑

u,v

Bu

iB

v

jK

uv(x, y);

La matrice B etant inversible, il y a symetrie parfaite entre les Z et lesZ, et on etablit de meme sans difficulte :

Kij

(x, y) =∑

u,v

Bu

iB

v

jK

uv(x, y) [32]

ou encore, par exemple en explicitant Cov[

Zi(x) , Z

j(y)]

de deuxfacons differentes, une identite en x et y plus symetrique (∀i, ∀j ∈ D) : En utilisant les

expressions [30].

u

Bu

jK

iu(x, y) ≡

v

Bv

iK

vj(x, y) [33]

(On prendra bien garde dans cette formule a l’ordre des indices de la J J J

fonction de covariance K).

En resume, la famille des Z possede exactement les memes proprietessimplificatrices que la famille Z :

• isotopie : les composantes transformees Zi(x), de meme que les

composantes initiales Zi(x), sont toutes connues (∀i ∈ D) sur le

meme sous-ensemble x : x ∈ V ⊂ Rn ;

• de plus, la matrice B etant reguliere, la connaissance de la familleZ entraıne la connaissance de la famille Z, et reciproquement ;

• toutes les Derives (que ce soit de Z ou de Z) s’expriment a l’aidedes memes Fonctions de Base. Et, de meme que les derives deZ, les derives de Z sont algebriquement independantes, commeconsequence de la regularite de B.

Page 170: g é o Statistique

168 Aide-Memoire de geostatistique lineaire :

De plus, la famille complete des fonctions structurales de Z s’exprimepar une bijection lineaire a l’aide de la famille complete des fonctionsstructurales de Z.

Ainsi, toutes les constructions qui seront faites sur la famille initialeZ (cokrigeage ou estimation optimale des coefficients de derives,par exemple) pourront etre immediatement transposees a la famille

transformee Z — et reciproquement.

5.6. Cokrigeage des variables transformees

Comme premier exemple de la proposition precedente, on peut transcrirele systeme [23] de Cokrigeage etabli sur les variables initiales. On cherchedonc cette fois a construire l’estimateur optimal

Z∗i(x

0) =

u∈D

V

λu

i(dy;x

0) Z

u(y)

avec λ solution du systeme

u∈D

V

λu

i(dy;x

0) K

ju(x, y) +

s

µs;ji

(x0) fs(x) ≡ K

ji(x, x

0)

V

λj

i(dy;x

0) f l(y) ≡ f l(x

0) δj

i

[34]

En complement a la regle [30] de transformation des variables, il peutetre important pour la suite de determiner comment se transforment lescoefficients du Cokrigeage, autrement dit quelle relation existe entre lesλ et les λ.

Ce probleme est sans difficulte theorique. Pourtant, si l’on cherchea injecter dans le systeme [34] les formules de transformation, onprovoque un enchevetrement d’indices qui obscurcit completement lademonstration. On propose donc plutot une construction par etapes, enne developpant pas jusqu’au bout les ecritures (assez embrouillees), maisen mettant en relief les idees directrices :

• par cokrigeage dans la famille initiale, Z∗i(x0) est une combinaison

lineaire des Zu, donc aussi des Z

ud’apres [30] :

Z∗i(x

0) =

u∈D

V

λu

i(dy;x

0) Z

u(y)

=∑

u∈D

V

λu

i(dy;x

0)

(

v∈D

Bv

uZ

v(y)

)

=∑

v∈D

V

(

u∈D

λu

i(dy;x

0) B

v

u

)

Zv(y)

• par ailleurs, toujours d’apres [30], la quantite a estimer Zi(x

0) est

aussi une combinaison lineaire des Zv, et donc

Page 171: g é o Statistique

[9] – Introduction a la Geostatistique Multivariable 169

Z∗i(x

0) =

(

Zi(x

0)

)∗

=

(

v

Bv

iZ

v(x

0)

)∗

=∑

v

Bv

iZ∗

v(x

0)

par superposition des figures de cokrigeage ;

Le symbole ∗ designe ici l’estimation optimale a l’aide des Z

j.

Mais il est clair que l’estimation optimale de quelque combinaisonlineaire que ce soit (des Z ou des Z — ce qui du reste revient au

meme) sera la meme qu’elle soit realisee a l’aide des Z ou des Z : ce

resultat est du au caractere bijectif de la transformation Z ↔ Z eta l’isotopie, qui impliquent que les espaces de Hilbert engendres parles donnees sur Z et les donnees sur Z sont identiques. Par suite,le cokrigeage d’une combinaison lineaire (c’est-a-dire sa projectionsur cet espace de Hilbert) est unique, et seule change sa formulation

selon qu’on l’exprime en termes de Z ou de Z.

• On peut donc utiliser ce resultat, capital pour la suite de lademonstration :

Dans le cadre des hypotheses actuelles,le symbole ∗ represente a la foisle Cokrigeage en termes de Z et en

termes de Z.

• par identification des deux expressions du cokrigeage de Zi(x0 ), on

Ces deux conditions debijectivite et d’isotopiesont evidemmentessentielles pourgarantir le resultat.

J J J

commence par deduire l’egalite

v

Bv

iZ∗

v(x0 ) =

v∈D

V

(

u∈D

Bv

u

i(dy;x0 )

)

Zv(y)

Ensuite,

— multiplions les deux membres de cette egalite par Bi

j, et

sommons en i. Comme la matrice B est l’inverse de la matriceB ([31]), on obtient

Z∗j(x

0) =

v∈D

V

(

u

Bv

uB

i

u

i(dy;x

0)

)

Zv(y)

— mais par ailleurs, on a l’expression generale

Z∗j(x0) =

v∈D

V

λv

j(dy;x0) Zv

(y)

— par identification des deux expressions — considerees commedes fonctions de x0 — on obtient donc la regle de transformation

λv

j(dy;x

0) =

u,i

Bi

jB

v

u

i(dy;x

0)

Page 172: g é o Statistique

170 Aide-Memoire de geostatistique lineaire :

soit, apres harmonisation des indices,

λj

i(dy;x

0) =

u,v

Bu

iB

j

v

u(dy;x

0) [35]

dont on etablit immediatement la forme duale :

λj

i(dy;x

0) =

u,v

Bu

iB

j

v

u(dy;x

0)

— pour etablir la regle de transformation des multiplicateurs deLagrange, on peut suivre les memes etapes :

1. on injecte la formule de transformation [35] dans lesequations d’optimalite du Cokrigeage en termes devariables transformees ([34]) ;

Ces etapes peuventetre detaillees a tired’exercice (d’ailleurspeu instructif. . . ).

2. on multiplie ces equations d’optimalite par une quantite du

type Bj

mB

i

n, et on somme en j et i ;

3. grace a la relation [32] entre covariances, et par la relationd’inversion [31], on obtient une expression du Cokrigeageen termes de fonctions de covariances K ;

4. par identification de ce nouveau systeme avec le systemeclassique [23], on caracterise enfin les multiplicateurs deLagrange.

Apres harmonisation des indices, on obtient

µs;ij

(x0) =

u,v∈D

Bu

iB

v

s;uv(x

0) [36]

Remarque : ces formules de transformation [35] et [36] auraientAutre exercice, peugratifiant, de virtuosite

sur les indices. egalement pu etre etablies par identification des expressions des variancesde cokrigeage. . .

5.7. Coefficients des derives des variables transformeesLa demarche pour etablir les regles de transformation entre lesestimateurs optimaux des coefficients des derives est exactement la memeque pour le cokrigeage : on exprime l’estimateur A∗

ilde deux points de

vue (c’est-a-dire selon qu’il est estime par des Z ou par des Z), et onidentifie les resultats.

Rappelons que ail

designe le coefficient de la l−eme Fonction de BaseParagraphe 5.2.

dans l’expression de la Derive de la i−eme variable Z, et que sonestimateur ([25]) s’ecrit

A∗il

=∑

u∈D

V

λu

il(dy)Z

u(y)

les memes regles de notations etant naturellement adoptees lors dutravail sur les variables transformees Z.

On obtient ainsi :

λj

il(dy) =

v,u

Bu

iB

j

v

ul(dy) [37]

En ce qui concerne les multiplicateurs de Lagrange, on peut garderla meme demarche que pour le Cokrigeage. Mais il est sans douteun peu plus simple de se rappeler ([29]) que ces parametres sont, au

Page 173: g é o Statistique

[9] – Introduction a la Geostatistique Multivariable 171

signe pres, les covariances des estimateurs des coefficients des derives,et injecter dans cette relation les formules de transformation [37]. Les

simplifications habituelles (B etant l’inverse de B) conduisent a :

µls;ij

=∑

v,u∈D

Bv

iB

u

ls;vu[38]

5.8. Application : la correlation intrinseque

5.8.1. Definition du modele

Ces regles de transformations peuvent etre mises a profit dans un castres particulier, mais qui peut effectivement se rencontrer sur des donneesreelles : on suppose que toutes les fonctions structurales (covariances etcovariances croisees) sont proportionnelles a une meme fonction, note ρ.Ainsi on peut trouver une matrice ω

ijtelle que, ( ∀i, j ∈ D) ,

Kij

(x, y) ≡ ωijρ(x, y) [39]

— le signe identite signifiant qu’il s’agit d’une egalite de fonctions,definies sur R

n × Rn.

Naturellement, dans la pratique, on travaillera dans le cadre stationnaire,de sorte que cette relation sera en fait

Kij

(h) ≡ ωijρ(h)

Il s’agit d’un modele fort restrictif, tant au niveau de l’echantillonnagerequis que de la structure des variables. Ainsi, comme pour i = j ondoit retrouver une fonction de covariance (monovariable), il est clair quela fonction ρ(h) doit etre paire, de sorte que toutes les covariances K

ij

le sont. On exclut ainsi des hypotheses les composantes impaires desfonctions structurales (et par suite les Decalages, de sorte que ce cadrede travail s’accommoderait de l’utilisation de variogrammes croises).

La notation adoptee suggere alors donner a ρ le sens d’une fonctiond’auto-correlation (ρ(0) = 1), auquel cas la matrice ω

ija

exactement le sens d’une matrice de variances–covariances. On supposeraimperativement que cette matrice est strictement definie positive.

L’ensemble de ces hypotheses relatives aux fonctions structurales croisees

J J J

constitue le modele de correlation intrinseque.

5.8.2. Transformation des variables

On conserve le cadre des hypotheses adoptees au debut de ce paragraphe(isotopie, fonctions de base communes aux variables, independancealgebrique des derives)15 .

La matrice symetrique ωij

etant strictement definie positive, on peuttrouver une matrice B de meme dimension telle que matriciellement

(ω ) = (B )t(B )

ou encore, ∀i, j ∈ D,

ωij

=∑

u∈D

Bu

iB

u

j[40]

15La construction des sous-paragraphes 5.8.2 et 5.8.3 constitue un exercice

d’application du formalisme general du paragraphe 5.7. Mais le resultat peut

etre verifie directement sur le systeme de cokrigeage initial, et on peut sans

inconvenient se rendre directement a la conclusion du paragraphe 5.8.4.

Page 174: g é o Statistique

172 Aide-Memoire de geostatistique lineaire :

Incidemment, cette matrice B est reguliere : s’il existait un vecteur x nonnul solution de B x = 0, alors ce meme vecteur non nul serait solutionde ω x = 0, ce qui serait en contradiction avec le caractere strictementdefini positif de la matrice ω.

Soit maintenant une famille de FASt-2 Z independantes, admettanttoutes la meme fonction de covariance (monovariable) ρ — soit

Kij

(x, y) = Cov[

Zi(x) , Z

j(y)]

= ρ(x, y) δij [41]

Alors, les FASt-2 definies par

Zi(x) =

j

Bj

iZ

j(x)

ont pour systeme de covariances (d’apres [32]) :

Cov[

Zi(x) , Z

j(y)]

=∑

u,v

Bu

iB

v

jK

uv(x, y)

et, en appliquant successivement [41], [40] et [39], on etablit

Cov[

Zi(x) , Z

j(y)]

= Kij

(x, y)

c’est-a-dire que le jeu de FASt-2 ainsi construit satisfait aux conditionsdu modele de Correlation Intrinseque.

5.8.3. Simplification du cokrigeage universel

Recapitulation : lorsqu’un jeu de FASt-2 Z satisfait aux conditions dela Correlation Intrinseque, on peut considerer ces FASt-2 comme etantles transformees (par une transformation lineaire bijective) d’un autre

jeu de FASt-2 Z independantes et de meme covariance.

Dans la pratique, on realise l’Analyse Variographique sur la familleinitiale Z, de sorte que — bien sur si les hypotheses de CorrelationIntrinseque sont experimentalement satisfaites — c’est la matrice ω

ij

qui est experimentalement ajustee. La relation [40] montre que c’est pardiagonalisation de ω que l’on peut caracteriser la loi de transformationentre Z et Z, c’est-a-dire la matrice B.

Au niveau des variables transformees, on se trouve dans une situationparticulierement favorable :

• variables independantes ;

• Isotopie ;

• Fonctions de Base algebriquement independantes et communes atoutes les variables ;

• meme fonction de covariance monovariable pour toutes les variables.

Il est immediat de s’assurer alors que le resultat acquis lorsParagraphe 3.2.3.

du Cokrigeage simple subsiste : il y a bien Separation desVariables — grace au premier point, et parce que les Derives sontalgebriquement independantes. Bien plus, les trois autres conditionsont pour consequence que tous les systemes de Krigeage Universelmonovariable sont identiques, de sorte qu’il suffit d’effectuer un seulKrigeage Universel, dont les ponderateurs seront valables pour toutesles variables transformees Z.

On obtient ainsi un notable allegement des notations, puisque ∀i ∈ D,

Z∗i(x0) =

V

λU(dy;x0 ) Zi

(y) [42]

Page 175: g é o Statistique

[9] – Introduction a la Geostatistique Multivariable 173

ou la mesure λU

, qui ne depend pas de i, est solution du systeme

V

λU(dy;x

0) ρ(x, y) +

s

µU sfs(x) = ρ(x, x

0)

V

λU(dy;x

0) f l(y) = f l(x

0)

[43]

— equations etablies ∀x ∈ V et ∀l ∈ 1, 2, · · · , k. Pour garder lesnotations en usage dans ce paragraphe, on a donc

λj

i(dy;x

0) = λ

U(dy;x

0) δj

i [44]

Pour obtenir les ponderateurs du Cokrigeage en termes de Z, il suffitd’appliquer la formule de transformation [35], soit

λj

i(dy;x

0) =

u,v

Bu

iB

j

v

u(dy;x

0)

qui, compte-tenu de [44] et parce que B est la matrice inverse de B, sesimplifie en

λj

i(dy;x

0) =

u,v

Bu

iB

j

U(dy;x

0) δu

v = λU(dy;x

0) δj

i

5.8.4. ConclusionAinsi, dans le cadre de la Correlation Intrinseque, les variables initialesse separent au meme titre que les variables transformees. De plus, lesponderateurs de (co)krigeage sont independants de la variable a estimer,ce qui constitue une consequence immediate d’une propriete d’invariancevue precedemment (chapitre 7, paragraphe 2.4.3).

En resume, dans le cadre isotopique, si l’on pose N = CardS — detant le nombre de variables et k le nombre de fonctions de base —, unCokrigeage demande de resoudre :

J J J

• (N+k) d equations a (N+k) d inconnues dans le cas general ;

• d systemes de (N + k) equations a (N + k) inconnues dansle cas d’une separation complete des variables, sans hypothesesupplementaire ;

• un seul systeme de (N + k) equations a (N + k) inconnues dans lecas de la Correlation Intrinseque.

Le gain de temps calcul est donc considerable dans ce dernier cas, etle modele de Correlation Intrinseque montre tout son interet. Son seulinconvenient, qui est loin d’etre negligeable, est que c’est un modele tresrestrictif et qu’en pratique, il faut resister a la tentation de faire violenceaux donnees pour les enroler de force dans un tel modele. C’est pourquoiil est opportun de chercher des hypotheses moins exigeantes, mais plusrealistes, qui permettront des allegements significatifs du systeme deCokrigeage tel qu’il se presente en toute generalite. Compte-tenu de latres grande variete des situations possibles, nous ne ferons cependantqu’evoquer cette question au paragraphe suivant.

5.9. Perspectives : l’autokrigeabiliteNous dirons par definition qu’une variable est autokrigeable par rapporta une famille de variables, si son cokrigeage coıncide avec son krigeage

Page 176: g é o Statistique

174 Aide-Memoire de geostatistique lineaire :

propre (monovariable). Pour rester en toute generalite, nous supposeronsici qu’il s’agit de Cokrigeage Universel.

Nous avons donc deja rencontre deux cas d’autokrigeabilite :

• lorsque toutes les variables sont non correlees et sans Derives,elles sont toutes Autokrigeables. Dans le cas le plus general d’uncokrigeage universel — ainsi que cela a deja ete evoque —, il fautde plus que les Derives soient algebriquement independantes. Lecaractere necessaire de cette seconde condition est particulierementfacile a illustrer : si l’on imagine deux variables constituees dedeux FASt-2 Sous-Jacentes independantes, mais partageant la memeDerive, il est clair qu’elles ne sauraient etre Autokrigeables ;

• le modele de Correlation Intrinseque.

Ces exemples sont peut-etre trompeurs car, dans ces deux cas, toutes les

Paragraphe 3.2.3.

Paragraphe 5.7.3.

I I IA verifier a titre

d’exercice. . .

variables sont Autokrigeables. Or

L’autokrigeabilite n’est pas une relation symetrique.

Imaginons par exemple que dans le cadre du modele de CorrelationIntrinseque, on ajoute un effet de pepite a chacune des covariancesUn tel modele revient

par exemple a supposerque toutes les variables,

sauf la premiere, sontentachees d’erreurs demesure independantes.

monovariables, sauf a celle de la premiere variable : le modele restecoherent, mais il est facile de voir que seule la premiere variable estencore autokrigeable par rapport aux autres.

Ces quelques observations tracent des perspectives pour la recherche desimplifications au Cokrigeage. A la lumiere des manipulations qui ontete proposees en vue de la Correlation Intrinseque, on peut proposerParagraphe 5.6.

des transformations lineaires (et bijectives !) des variables initiales defacon a ce que quelques unes au moins des variables transformeesse revelent autokrigeables. Il n’est pas possible a ce niveau d’allerplus loin et de donner des regles generales, tant la combinatoire descas de figures possibles est embrouillee. Mais le point commun atoutes ces manipulations est qu’il faut tenir compte a la fois de lamodelisation structurale (les fonctions de covariance et les derives) etde l’echantillonnage.

6. Principes de l’analyse krigeante

6.1. PresentationLe texte fondateur de cette methode, Pour une analyse krigeantedes donnees regionalisees, se place de fait d’emblee dans le cadreMatheron, 1982.

des FAI-k. Ce point de vue a l’avantage de la rigueur mathematique, etpar ailleurs met en lumiere le caractere conventionnel de la separationDerive/Residu. En contrepartie toutefois, cette approche paraıtpeu adaptee au cas ou les variables traitees (de modeles Sous-Jacentsstationnaires) presenteraient des Derives algebriquement liees ; il est vraiqu’il ne semble pas qu’une telle situation ait souvent ete rencontree. . .

Cela dit, les premiers travaux rodant effectivement cette methode ont eteWackernagel, 1985 ;Sandjivy, 1987 ;Grzebyk, 1993. exposes dans une optique Krigeage Universel, et c’est le point de vue qui

sera adopte ici, en occultant en grande partie le probleme des derivesafin de se limiter aux grandes lignes du procede. On peut alors, avecH. Wackernagel, distinguer deux niveaux dans ce qui est usuellementWackernagel, 1992.

appele dans son ensemble l’analyse krigeante :

• une phase d’analyse : c’est l’etape par laquelle on modelise un jeu devariables selon le point de vue de la (co)regionalisation lineaire. Ils’agit essentiellement d’interpreter les variables disponibles commeune combinaison lineaire de facteurs, dans une optique tresproche de ce qui a ete fait pour la Correlation Intrinseque ;Paragraphe 5.5-5.6.

• une phase d’estimation des facteurs ainsi definis.

Page 177: g é o Statistique

[9] – Introduction a la Geostatistique Multivariable 175

Dans la suite de ce paragraphe, on ne fera qu’ebaucher la problematiquede cette Analyse Krigeante, en renvoyant a la bibliographie pour lesdetails techniques.

6.2. Le modele lineaire de coregionalisation

Fondamentalement, l’Analyse Krigeante repose sur l’idee d’une decom-position (lineaire) des variables a etudier.

Ce point de vue n’est pas depourvu d’embuches, au moins au niveaude la signification physique de ce que l’on entreprend. Car la seulerealite dont on dispose, ce sont des Variables Regionalisees z

i(x), et

leurs eventuelles composantes n’ont aucune signification objective. A E & C, p74.

priori donc, il faut s’attendre a des impasses en ce qui concerne laReconstruction Operatoire des futures estimations.

Naturellement, cette remarque n’a pas pour but de condamner lamethode, mais seulement de mettre en garde contre les dangers defranchir le Seuil de Realisme. En l’occurrence, une etude reelle enAnalyse Krigeante doit toujours faire l’objet d’une approche critiqueencore plus exigeante que pour une estimation classique, et on doit enparticulier toujours veiller a satisfaire au Principe d’Economie.

6.2.1. Le modele structural

Cela dit, on n’aborde pas un travail en Analyse Krigeante completementdemuni. On dispose en effet d’une information qui garde une signification On se place pour simplifier

dans le cadre d’un modeleSous-Jacent stationnaire.objective importante, a savoir le faisceau des covariances experimentales

(monovariables et croisees). Supposons alors que la famille de covariancesmodelisees apparaisse sous la forme :

Kij

(h) =∑

u

Cu

ijK

u

(h) [45]

ou les fonctions Ku

(h) representent des modeles elementaires decovariances ne dependant pas des variables : chacune des covariancesK

ij(h) apparaıt comme une Structure Gigogne, ce qui constitue

simplement une generalisation de ce qui a ete presente en introductionde ce chapitre. Comme on a choisi de se limiter au cas stationnaire, Paragraphe 1.1.

on pourra sans nuire a la generalite du modele supposer que cescomposantes structurales16 K

u

(h) sont de palier unite ; enfin, ondesignera par NC leur nombre, c’est-a-dire le nombre de valeurs prisespar l’indice u.

Il s’agit certes deja d’une premiere modelisation, et l’on peut doncmettre legitimement en question la signification objective de cettedecomposition17 . Cependant, si l’Analyse Variographique est faite dansles regles de l’art, il y a souvent consensus sur un certain nombre detraits structuraux (portees, paliers globaux, comportements a l’origine)mis en evidence numeriquement, de sorte que cette presentation [45]peut encore assez facilement etre consideree comme possedant une partimportante de signification objective.

Du reste, le developpement [45] constitue une hypothese falsifiable : il E & C, p33-34.

est clair par exemple qu’il impose que toutes les covariances croiseesK

ih(h) soient symetriques. Que la Variographie mette en evidence des

16Il ne s’agit pas d’une terminologie consacree, mais elle semble preferable, parce

que plus precise, a Modele Elementaire. Par ailleurs, le mot composantes

seul a deja ete utilise pour designer les variables definies sur l’espace geographique.17

Rappelons une fois encore que cette attitude critique envers les modeles utilises est

essentielle dans toute etude geostatistique bien comprise. Dans le cas de l’Analyse

Krigeante, elle peut devenir cruciale.

Page 178: g é o Statistique

176 Aide-Memoire de geostatistique lineaire :

Dephasages, et le modele sera ipso facto refute — preuve a contrario

que le Seuil de Realisme n’est pas franchi.

6.2.2. Decomposition des variables

Il en va tout autrement lorsqu’on passe au niveau de la modelisation desFonctions Aleatoires. Afin de conserver une unite de notation au traversde ce chapitre, on adoptera le point de vue Z est une FA scalaire surl’espace produit R

n ×D et on posera, en utilisant les notations [2] et[7]) et ceci ∀(x, i) ∈ R

n ×D :

Z(x, i) = Y (x, i) +

k∑

l=1

alf l(x, i) [46]

ou la fonction aleatoire Y est stationnaire d’ordre 2 sur Rn × D, et

d’esperance nulle.

L’idee directrice du modele lineaire de coregionalisation est alors de

Paragraphe 1.4.

Parfois note enabrege : MLC.

supposer que cette FASt-2 Y , ou si l’on prefere les composantes de lafamille des FASt-2 Y

i, peuvent se decomposer sous la forme

Yi(x) = Y (x, i) =

u

p

ap

iuY

u

p(x) [47]

ou les Fonctions Aleatoires Yu

psont supposees d’esperances nulles

et mutuellement orthogonales, c’est-a-dire de covariances croiseesidentiquement nulles.

Au contraire de la modelisation structurale, cette modelisationdes variables (ou plutot des Fonctions Aleatoires) est totalementconventionnelle. Il ne s’agit pas la de proferer un quelconque jugementde valeur, mais simplement de rappeler par exemple que dans ladecomposition [46], la Derive qui est mathematiquement definie parChapitre 1,

paragraphe 4.3 ;chapitre 6, paragraphe 3.5.

E [Z(x, i)] =k∑

l=1

alf l(x, i)

n’est pas une Grandeur Regionale.

A fortiori , rien dans un jeu de donnees quel qu’il soit ne permet dedire si la decomposition [47] est vraie ou fausse — la questionetant meme en fait depourvue de sens. Par ce Modele Lineaire deCoregionalisation, on s’aventure donc assez loin dans le domaine dela speculation, ce qui n’est evidemment pas condamnable en soi maisimplique que l’on multiplie les risques d’entreprendre des manipulationsmathematiques depourvues de contre-partie physique, et requiert doncun surcroıt de vigilance. Cette difficulte doit etre prise en compte achaque etape d’une etude, et le Geostatisticien doit etre pret a toutmoment a renoncer a une entreprise qui risque de n’avoir plus de rapportavec la realite.

6.2.3. Commentaires

Ce modele appelle deja plusieurs remarques :

• nous supposons ici que les FA Yu

pqui apparaissent dans la

decomposition de Y (x, i) — donc aussi Y (x, i) elle-meme — sontstationnaires d’ordre 2 sans derives. Nous nous demarquons ainsidu texte fondateur, dans un souci de simplification : en imposant ala Derive d’etre exterieure aux fonctions Y

i, on evacue en partie les

difficultes liees a la ventilation de la Derive entre les composantes.Matheron, 1982,paragraphe IV.

Ayant deliberement choisi le point de vue du (co)krigeage universel,

Page 179: g é o Statistique

[9] – Introduction a la Geostatistique Multivariable 177

nous economisons le probleme du changement de Representationrencontre dans l’approche en FAI-k ;

• bien sur, il ne s’agit que d’un modele — du reste assez restrictif —,et il n’est pas certain que ce soit le plus realiste. Nous avons vu autravers des chapitres 7 et 8 qu’en depit de son contenu apparemmentintuitif, le Krigeage Universel n’est pas toujours, au niveau de lapratique, le point de vue le plus aise a manipuler ;

• on suppose dans ce modele que les FA Yu

p(x), que l’on conviendra

d’appeler facteurs de la coregionalisation lineaire, admettent toutes,

pour un indice u donne, la meme covariance Ku

(h) telle qu’elleest introduite dans la formule [45]. Ainsi, l’indice u a la memesignification dans les formules [45] et [47], et est associe a uneComposante Structurale ;

• on a donc, (∀p, q),

Cov[

Yu

p(x), Y

v

q(y)]

= Ku

(x− y) δuv δpq [48]

• pour chaque valeur de l’indice u, l’indice p prend un nombre devaleurs N(u) au plus egal au nombre d de variables — cettelimitation etant une consequence de l’exigence d’orthogonalite entreles Y

u

p(x). Pour simplifier, G. Matheron fait observer que on Matheron, 1982, p6.

peut d’ailleurs toujours supposer N(u) = d, quitte a annuler

certains termes de la matrice ap

iu ;

• en resume, Cet indice u joue donc ici, en un sens large, le role Matheron, 1982, p 1.

d’indicateur d’une certaine “bande de frequence”. L’indice p, aucontraire, u etant fixe, repere les “composantes principales” de lacoregionalisation dans le “domaine de frequence” associe a u.

6.2.4. Calage du modele lineaire de coregionalisation

Le rapprochement entre le developpement [45] du faisceau de covariances

selon les Composantes Structurales Ku

Kij

(h) =

NC∑

u=1

Cu

ijK

u

(h) [45]

et le developpement [47] des FASt-2 selon les Facteurs Yu

p

Yi(x) = Y (x, i) =

NC∑

u=1

d∑

p=1

ap

iuY

u

p(x) [47]

conduit — ∀i, ∀j — a la tres importante relation :

Cu

ij=

d∑

p=1

ap

iua

p

ju[49]

l’indice u, quelconque, etant suppose fixe. On rappelle que, a u fixe, lejeu de coefficients C

u

ijn’est autre qu’une matrice de correlations — donc

symetrique definie positive.

Cette relation [49] est evidemment decisive en pratique, puisqu’elleetablit le lien entre un jeu de valeurs issues de l’experience (c’est-

a-dire les coefficients Cu

ij), et des parametres a

p

iuconventionnels,

mais indispensables pour les developpements ulterieurs. Une foisl’Analyse Variographique achevee, le calage du Modele Lineaire de

Page 180: g é o Statistique

178 Aide-Memoire de geostatistique lineaire :

Coregionalisation consiste donc a reconstituer les coefficients ap

iudes

Facteurs a partir des matrices de correlations. Cette reconstitutionequivaut a faire l’analyse en composantes principales des matrices C

u

ij.

En particulier, elle ne sera pas univoque, mais dependra du choix plusou moins arbitraire d’une metrique de reference : mais c’est la [. . . ] uninconvenient inherent a toutes les methodes d’analyse des donnees.

Cette etape est bien sur la plus propice aux errements, donc celle quirequiert le plus de doigte et de jugement dans la mise en pratique surdes donnees reelles. . .

6.3. Estimation des facteursLes coefficients a

p

iudes Facteurs etant supposes connus, le Cokrigeage

Matheron, 1982, p6.

des Facteurs ne pose plus de probleme theorique : il s’apparente, avecl’aspect multivariable en plus, a l’estimation des Residus qui estproposee en annexe. Quant a l’estimation optimale de la Derive ou deAnnexe 2,

paragraphe 2.1.3.ses coefficients, elle releve tres exactement de la demarche qui a deja eteexposee dans le cas general, et ne sera donc plus evoquee.Paragraphe 4.3.3.

Remarque : cette situation particulierement favorable est due al’hypothese de stationnarite d’ordre 2, et au fait que la Deriveest consideree comme globale. Il n’y a donc pas de probleme deventilation de cette derive entre les differentes composantes. Il enserait alle tout autrement dans un modele de type FAI-k, mais nousrenvoyons pour cette question a la bibliographieMatheron, 1982.

A toutes fins utiles, developpons rapidement les etapes d’un cokrigeagequi est donc parfaitement classique, a l’accumulation des indices pres. . .

Soit donc, pour u et p fixes, a estimer Yu

p(x

0) en un point x

0∈ R

n fixe.

Pour alleger (un peu. . . ) les notations, on ne fera pas figurer ces troisparametres comme indices de la solution. On cherche donc a caracteriserune mesure λ telle queL

[

Yu

p(x0 )

]∗

=∑

j∈D

Sj

λj

(dy) Z(y, j) [50]

puisque, rappelons-le, ce sont les z(x, i) (avec (x, i) ∈ S), quiconstituent les donnees.

L’erreur d’estimation est automatiquement autorisee, compte-tenu deAl’hypothese de stationnarite d’ordre 2.

On obtient les conditions d’universalite immediatement, en utilisant leUdeveloppement de la derive (cf. [46]) et sachant que tous les Facteurssont d’esperance nulle. Le parametre k retrouvant ici le sens de nombretotal de Fonctions de Base, on obtient (∀l ∈ 1, 2, · · · , k)

j∈D

Sj

λj

(dy) fs(y, j) = 0 [51]

La variance de l’erreur d’estimation se developpe enO

i,j∈D

Sj

Sj

λi

(dx)λj

(dy)Kij

(x, y) − 2∑

i∈D

Si

λi

(dx) ap

iuK

u

(x, x0) + K

u

(0)

[52]

expression dans laquelle on rappelle que les indices p et u sont fixes.L’optimisation de [52] sous les contraintes [51] conduit aux equationsd’optimalite — ∀(x, i) ∈ S

Page 181: g é o Statistique

[9] – Introduction a la Geostatistique Multivariable 179

j∈D

Sj

λj

(dy) Kij

(x, y) +∑

s

µsfs(x, i) = a

p

iuK

u

(x, x0)

[53]

(on rappelle qu’il n’y a pas sommation sur l’indice u).

En resume, par regroupement de [51] et [53], on a construit le systeme

de cokrigeage du Facteur Yu

p(x

0) par les Z(x, i). Il s’ecrit, ∀(x, i) ∈ S

et ∀l ∈ 1, 2, · · · , k ,

j∈D

Sj

λj

(dy) Kij

(x, y) +∑

s

µsfs(x, i) = a

p

iuK

u

(x, x0)

j∈D

Sj

λj

(dy) f l(y, j) = 0

[54]

On pourrait sans difficulte assortir cette estimation de sa variance decokrigeage. . . Par ailleurs, on observe naturellement que le systeme ala structure d’un systeme de Cokrigeage ponctuel, seul changeant lesecond membre : les conditions de regularite de cette estimation sontdonc exactement les memes que pour le Cokrigeage ponctuel. Enfin, encokrigeant simultanement deux Facteurs pour un jeu d’indices (p, u)et (q, v) distincts, on pourrait verifier sans difficulte que la relationd’orthogonalite [48] qui est verifiee au niveau de ces Facteurs n’est engeneral pas verifiee au niveau de leurs estimateurs. J J J

Par ailleurs, on pourrait sans difficulte expliciter des relations

d’additivite. En particulier, le cumul des cartes des[

Yu

p(x)]∗

, a i fixe

et pour toutes les valeurs de u et de p, redonne la carte de Y ∗i

(x). Celadit, il ne s’agirait la que d’une verification academique : en general, oncherche justement a se limiter aux Facteurs qui, pour une echelle destructure donnee (u fixe), representent les composantes principales(indice p) dans cette echelle.

6.4. Remarque finale

Dans le cadre des hypotheses retenues ici, l’Analyse Krigeante est sans

Matheron, 1982, p1.

reelle difficulte. Le vrai probleme est naturellement le sens physique quel’on peut legitimement attribuer aux operations effectuees.

La presence d’indeterminations irreductibles, dans le passage [49] desComposantes Structurales aux Facteurs, est une situation sommetoute classique, mais qui montre bien qu’il ne saurait y avoir dereponse unique — et encore moins de vraie reponse — a unprobleme de modelisation structurale. Le cadre de travail est ici devenuparticulierement mouvant, ce qui doit inciter a une prudence accrue.

Le probleme est que bien souvent, le recours a l’Analyse Krigeanteest justifie par le souci d’analyser en detail un phenomene, voire d’encomprendre la genese. Cette methode qui depend de tant de ParametresConventionnels est invoquee pour resoudre au contraire des problemesparticulierement concrets. Le risque est de s’arreter a des artefacts18 , et

18Ce mot est pris sans aucune connation pejorative. Il designe simplement un

resultat artificiel, qui procede davantage de la demarche du Geostatisticien que

de la realite.

Page 182: g é o Statistique

180 Aide-Memoire de geostatistique lineaire :

de leur attribuer une signification physique : danger redoutable, memesi le travail geostatistique a ete realise dans les regles de l’art.

C’est pourquoi il semble judicieux de suggerer une utilisation modestede l’Analyse Krigeante. Il peut parfaitement etre grandement revelateurde cartographier des Facteurs, mais il ne faut pas pour autant oublierque ceux-ci ne sont que des creations artificielles compatibles avecla realite, et nullement une representation univoque de celle-ci. Aussil’Analyse Krigeante doit-elle seulement etre consideree comme une aide,un complement a la reflexion structurale qui ne peut en aucun cas sesubstituer a cette reflexion.

Dans le meme temps, il ne faut pas oublier qu’elle est tributairedu Modele Lineaire de Coregionalisation, lequel est finalement assezrestrictif : restrictif implique assez facilement refutable, ce quiest une bonne nouvelle pour le souci de realisme d’une etude. Mais lesrestrictions sont faites pour etre levees, et on ne peut que souhaiter lapoursuite de la recherche de nouveaux modeles de coregionalisation.Grzebyk, 1993.

7. Notion de derive externe

7.1. Justification, et modele

On a deja releve que le Cokrigeage imposait un role symetrique auxParagraphe 3.3.

variables, et que ce n’etait que par le moyen indirect (et arbitraire) duvoisinage de krigeage qu’il etait possible eventuellement de s’affranchirde cette propriete.

Le nouveau modele envisage maintenant repose au contraire sur la notionhierarchique de fonction de forme. Bien souvent en effet, ilarrive que la variable d’interet voie sa structure d’ensemble modeleepar une autre variable, en elle-meme pas necessairement interessante,mais eventuellement abondamment echantillonnee et porteuse d’uneinformation riche.

Le plus simple est de proposer un exemple sommaire : le cas dedonnees meteorologiques (precipitations en regions temperees) dont lastructure principale est en grande partie tributaire du relief. Si, commeon peut le supposer, il y a une grande disproportion entre les effectifsd’echantillonnage (assortie d’une Heterotopie), on se trouve dans demauvaises conditions pour calculer les fonctions structurales croisees.En revanche, meme s’il s’agit de donnees de natures fondamentalementdifferentes, on a le sentiment que la connaissance de la topographie peutapporter une contribution importante a la modelisation structurale desprecipitations.

En toute generalite maintenant, l’idee est de considerer que l’on disposed’une fonction de forme, c-est-a-dire d’une Variable Regionaliseedistincte de la variable d’interet, mais dont le comportement spatialest cense decrire les grandes lignes structurales de la variable a estimer— autrement dit sa tendance. Remarquons que rien n’interdit quecette Fonction de Forme soit etrangere19 a la variable d’interet.

Notons s(x) cette Fonction de Forme. On modelisera son role detendance en ecrivant qu’elle s’identifie a l’esperance mathematique

19Par etrangere, on entend de nature physique differente — ce qui est le

cas dans l’exemple propose precipitations/topographie. Mais il peut arriver

aussi que la Fonction de Forme s’exprime dans les memes unites que la variable

d’interet : c’est le cas par exemple en geophysique petroliere, ou les profondeurs

reconstituees a partir des donnees geophysiques peuvent etre adoptees comme

Fonction de Forme des profondeurs mesurees aux puits.

Page 183: g é o Statistique

[9] – Introduction a la Geostatistique Multivariable 181

de la FA d’interet Z(x) — supposee une FASt-2 — ou meme, pourdonner un peu plus de generalite au modele, que

E [Z(x)] =

k∑

l=0

al sl(x) [55]

ou classiquement les coefficients al sont des parametres inconnus dumodele. C’est ce developpement qui est appele derive externe.

Remarques :

• on a suppose que Z etait une FASt-2, afin d’eviter les problemeshabituels inherents au terme constant de la Derive. On peutd’ailleurs s’interroger sur le sens que l’on pourrait attribuer a uneFonction de Forme par rapport a laquelle les fluctuations seraientde variance infinie. . .

• on retrouve tout naturellement la structure de la Derive telle qu’ellea ete introduite dans le cadre du Krigeage Universel ; Chapitre 7,

paragraphe 2.1.4.

• dans cette ecriture [55], l’indice l represente bien un exposant. Dansla pratique, on se limitera presque toujours a k = 1 : cela signifie quelocalement, on considerera que la Derive de Z est une fonction affinede s, ce qui effectivement peut assez souvent avoir une significationphysique ;

• rien enfin — sinon bien sur le Principe d’Economie — n’interdirait Chapitre 1,paragraphe 4.2.

de rajouter a l’expression [55] un developpement selon des Fonctionsde Base usuelles, ni meme d’utiliser plusieurs Fonctions de Forme,donc plusieurs Derives Externes.

7.2. VariographieDans la mesure ou la forme de la Derive Externe procede d’un choixdu Geostatisticien, il n’y a pas de nouveaute a ce niveau, dont ladifficulte est analogue a celle que l’on pourrait rencontrer pour caler(experimentalement) le degre k d’une FAI-k. Dans le cadre de la DeriveExterne, le parametre k est donne par l’utilisateur.

Il en va tout autrement en ce qui concerne l’identification de la fonctionde covariance de Z. On retrouve toutes les difficultes deja rencontreesdans le cadre du Krigeage Universel, et en particulier les biais ; car lefait d’avoir remplace les Fonctions de Base f l par des sl ne changeabsolument rien a la demarche.

En revanche, le recours aux FAI-k n’est plus cette fois une reponse

Chapitre 7, paragraphe 6.

satisfaisante a ce probleme de biais, parce que l’on a perdu les proprietes J J J

d’invariance par translation : si la famille des sl(x) etait globalement Chapitre 8,paragraphe 1.3.

invariante par translation, les sl seraient des monomes (et on serait alorsramene a une analyse classique en FAI-k) ; mais ce n’est pas le cas, s(x)etant une Variable Regionalisee a priori quelconque.

On est donc vraisemblablement contraint d’effectuer la recherche dumodele de covariance de Z par des methodes qui cherchent a s’affranchirde la presence de s(x) plutot que l’integrer, et c’est en ce sens que l’onpeut qualifier la derive d’externe, puisque sa presence est sans impactsur la famille des covariances Sous-Jacentes autorisees pourZ. Mais pource faire, il faut evidemment disposer d’une information qui n’est paspresente dans les seuls echantillons zα : soit des a priori sur l’expressionde la covariance, soit des echantillons de la meme variable sur desdomaines depourvus de derive, soit des resultats d’etudes similaires. . .

7.3. Krigeage avec derive externeRien dans le developpement [55] n’introduit de changement par rapporta la demarche usuelle du Krigeage Universel. En restant pour simplifierdans le cas d’une seule Derive Externe, on cherchera donc a construire

Z∗(x) = λα Zα

Page 184: g é o Statistique

182 Aide-Memoire de geostatistique lineaire :

sachant que Z est de la forme

Z(x) = Y (x) +k∑

l=0

al sl(x)

ou Y (x) est une FASt-2 d’esperance nulle et de covariance K. Parminimisation sous contraintes [55] de la variance d’estimation, onconstruit ainsi le systeme de Krigeage en Derive Externe :

βλβ Kαβ + µl s

lα = Kαx (∀α)

βλβ sl

β = slx (∀l)

La seule particularite qu’il convient de souligner concerne les pointsen lesquels on doit exprimer la Derive Externe. Celle-ci, ou plutot sescomposantes sl, doivent etre connues en tous les points de donnees(designes par les indices α, β), et en tout point x ou on souhaite realiserle Krigeage. Pour une derive polynomiale classique, il n’existait pasde probleme, puisque les f l etaient des expressions mathematiques quipouvaient etre calculees en tout point de l’espace. Ici en revanche, on nedisposera pas en general des valeurs de s aux points requis, et il faudradonc remplacer ces valeurs par leurs estimations.

Le Krigeage en Derive Externe commence donc en general par unKrigeage de la Fonction de Forme.

7.4. Remarques finalesEn introduisant dans le systeme de krigeage des contraintes d’untype nouveau, la technique de la Derive Externe ouvre la porte ipso

facto, par dualite, a des modeles nouveaux de covariances. Mais,fondamentalement, ces modeles sont non stationnaires, de sorte qu’ilest sans espoir de les expliciter. Ainsi, si dans le systeme de krigeageon introduit a la fois des Fonctions de Forme et des Fonctions de Base(celles-ci au sens usuel du KI), seules ces dernieres auront une influencesur la gamme des fonctions structurales K que l’on s’autorisera. Memesi le sens physique de l’operation est sans doute discutable, on pourradonc construire des systemes de Krigeage en Derive Externe avec desCovariances Generalisees, pourvu naturellement que soient introduitesles conditions d’autorisation correspondantes.

Par ailleurs, comme en Analyse Krigeante, l’emploi de la Derive Externe

Chapitre 8,paragraphe 2.4.

doit concilier des contraintes mathematiques (certes ici plutot modestes)et des vœux d’interpretation physique. Mais rien jamais ne peut garantirqu’il y ait coherence entre ces deux objectifs ; aussi — comme toujours— est-il requis de faire preuve de sens critique, la sagesse geostatistiqueconsistant a savoir renoncer a un modele lorsque la realite le demandeavec trop d’insistance. . .

Au terme de cet Aide-Memoire, on peut souhaiter que le lecteurDiscussion

aura compris combien la Geostatistique s’accommode mal de veritesdefinitives : si la rigueur mathematique y est indispensable, il n’en est pasmoins naturel que des elements d’appreciation personnelle interviennentau cours d’une etude, voire dans un expose comme celui-ci.

De par sa richesse et sa diversite, l’approche du multivariable constitueun bon exemple de situation ou les jugements, ou les feelings, peuvent

Page 185: g é o Statistique

[9] – Introduction a la Geostatistique Multivariable 183

sensiblement diverger sur un resultat donne. A titre d’exemples, onpropose donc pour conclure une amorce de discussion sur deux phrasesqui dans ce chapitre ont appele des objections d’un relecteur.

• avec le variogramme croise, on perd sur tous les tableaux . Cettephrase, sans doute exagerement peremptoire, resumait le fait que levariogramme est plus gourmand en donnees que la covariancecroisee, tout en etant moins explicatif comme modele. Il convientau moins de nuancer ce propos en rappelant que si on a despoints a echantillonnage simultane (isotopie) et si les covariancesne manifestent pas de non-symetrie, le variogramme croise est plusrobuste

20 . En revanche, si les echantillonnages des differentesvariables sont disjoints, on ne peut travailler qu’avec des covariances,mais en general, c’est une situation defavorable— ne serait-ce queparce que des conditions fortes de stationnarite au moins locale sontcette fois requises.

• le Variogramme Croise n’est pas en mesure de diagnostiquer Paragraphe 4.1.

Paragraphe 2.4.

par lui-meme l’absence de Decalages, formule a l’emporte-piecequ’il aurait mieux valu nuancer ainsi : le variogramme croisepeut indiquer un decalage (mais pas son sens)21 . De fait,l’existence d’un decalage affecte le comportement aux courtesdistances du variogramme croise, dans des conditions qui peuventd’ailleurs permettre d’evaluer effectivement au moins l’amplitude dece decalage.

Un exemple possible concerne la paire de variables

Z2(x) = Z

1(x+ a)

ou Z1

admet un variogramme lineaire γ(h) =| h |. On peutimmediatement verifier que le variogramme croise est de la forme :

γ12

(h) =

0 si |h | ≤ |a |

|h | − |a | si |h | ≥ |a |

ce qui constitue en effet une expression inhabituelle, dont on peutdeduire la valeur absolue de a, sinon son signe.

Ces deux remarques soulignent a contrario la tonalite parfois tropprudente de ce document, plus particulierement dans ce dernier chapitreou les mises en garde ont ete multipliees : ainsi que cela etait annoncedans sa presentation, ce chapitre etait compris comme une revision, aussibien en ce qui concerne les techniques mathematiques que les conseilsmethodologiques et les appels a la prudence. Mais, parvenu a ce point, letemps est maintenant venu de la mise en pratique, chose qui par natureechappe a toute approche livresque, et bien sur en tout premier lieu aupresent manuel. . .

La problematique multivariable a ete developpee des les debuts de la Bibliographie

Geostatistique, ce qui n’a rien d’inattendu. Aussi la premiere referenceest-elle le paragraphe consacre au Cokrigeage, dans le Fascicule 5.

20[Note d’un relecteur].

21[Note d’un relecteur].

Page 186: g é o Statistique

184 Aide-Memoire de geostatistique lineaire :

Commencant par un rappel d’Analyse des Donnees (ACP, AnalyseCanonique, Analyse des Correspondances), le cours

• Cours de Geostatistique Multivariable,H. Wackernagel,1992.

propose un tour d’horizon exhaustif des methodes multivariables enGeostatistique.

Le texte fondateur de l’Analyse Krigeante est

• Pour une analyse krigeante des donnees regionalisees,G. Matheron, 1982.

tandis que la Derive Externe est mentionnee pour la premiere fois dans

• Application of geostatistical analysis to the evaluationof petroleum reservoirs with well logs, P. Delfiner,J.-P. Delhomme & J. Pelissier-Combescure, 1983.

En complement, la these

• Ajustement d’une coregionalisation stationnaire,M. Grzebyk , 1993 .

propose une alternative au Modele Lineaire de Coregionalisation.

Se reporter, en deuxieme partie du document, au chapitre

• Introduction au filtrage d’erreurs.

Pour illustrer le lien existant entre stationnarite globale d’un modele

Annexe

Complement

multivariable et stationnarite de ses composantes, on choisira un exemplebivariable dans R

1. Soient alors X(x) une FASt-2 de fonction deParagraphe 2.1.

covariance (stationnaire) K, A une Variable Aleatoire de variance finieindependante de X , et a et b deux reels quelconques. Alors,

• la stationnarite individuelle de deux FA n’implique pas lastationnarite de leur Covariance Croisee. Comme exemple, il suffitde poser Y (x) = X(x) et Z(x) = X(ax + b). Clairement, Y etZ sont deux FASt-2, mais

KY Z

(x, x+ h) = Cov [X(x), X(ax+ ah+ b)] = K((a−1)x+ ah+ b)

qui depend de x si a 6= 1: la Covariance Croisee existe bien, maiselle n’est pas stationnaire ;

• a fortiori donc, la stationnarite individuelle de deux FA n’entraıneen general pas la stationnarite du couple de FA. Toutefois, cetteimplication est assuree lorsqu’il s’agit de deux FA independantes ;

• inversement, la stationnarite d’une fonction de Covariance Croiseen’implique pas que les deux FA correspondantes soient stationnaires.Ainsi, avec nos notations, si on pose cette fois Y (x) = X(x) etZ(x) = Ax, il est clair (par independance de X et A) que

KY Z

(x, x+ h) = Cov [X(x), Ax] = 0

qui est evidemment stationnaire, alors que Z(x) ne l’est pas.

Page 187: g é o Statistique

[9] – Introduction a la Geostatistique Multivariable 185

Expression de la covariance d’accroissements γij

(x, a; y, b) en fonction Complementdes variogrammes croises γ

ij(h) : on a souligne que les valeurs

individuelles de cette covariance ne pouvaient pas s’exprimer enfonction des variogrammes croises, et que seules sont accessibles des Paragraphe 2.3.

combinaisons effectuant une permutation sur les indices des variables.Plus precisement, soit la fonction auxilliaire F (paire, et symetrique eni et j) definie par

Fij

(h) = γii(h) + γ

jj(h) + γ

ij(h)

Alors, on ne sait pas exprimer isolement γij

en fonction de F , donc en

fonction de γ. Mais on peut etablir facilement la relation symetrisee

γij

(x, a; y, b) + γji

(x, a; y, b)

2= F

ij(y−x+b) + F

ij(y−x−a) − F

ij(y−x+b−a) − F

ij(y−x)

Page 188: g é o Statistique

186 Aide-Memoire de geostatistique lineaire :

Page 189: g é o Statistique

Deuxieme partie

Annexes

Page 190: g é o Statistique

188 Aide-Memoire de geostatistique lineaire :

Page 191: g é o Statistique

Chapitre 1

Esperance conditionnelle :mecanismes d’utilisation

Presentation

On veut presenter ici, d’un point de vue purement operatoire,la puissance du theoreme de l’Esperance Totale et quelques-unes de ses applications possibles en Geostatistique. Une de cesapplications a deja ete vue au Chapitre 4 en Estimation Globale,pour le calcul a maille aleatoire pure ou stratifiee.

Le premier paragraphe rappelle le theoreme et en degage lemecanisme de mise en œuvre. Cette presentation est faite sansaucune demonstration.

Un exemple simpliste d’application, en l’occurrence deux calculsde variogrammes, est donne au second paragraphe.

Au troisieme paragraphe enfin, on utilise ce mecanisme pourintroduire le krigeage aleatoire.

1. Theoreme et mise en œuvre

1.1. Rappel du theoremeSoient deux Variables Aleatoires Z etX . On supposera que Z admet uneesperance mathematique. Si on designe par E [ ] l’operateur esperancemathematique, le theoreme de l’esperance totale s’exprime ainsi : Pour un enonce rigoureux,

se reporter a toutcours de Probabilites.

E [Z] = E[

EZ [Z | X ]]

ou EZ designe l’esperance de la loi de Z conditionnellement a X . Onrappelle que cette esperance conditionnelle EZ [Z | X ] a le statutmathematique de Variable Aleatoire, du fait de la presence de X .

Plus laconiquement, le theoreme peut s’exprimer : l’esperance (totale)est egale a l’esperance de l’esperance conditionnelle.

1.2. Quelques formulesDesignons par F la loi de Z, et par P la loi de la variable conditionnanteX . On notera Fx la loi de Z conditionnelle a X = x. Alors :

E [Z] =

z F (dz)

EZ [Z | x] =

z Fx(dz)

et le theoreme permet d’ecrire :

E [Z] =

[

z Fx(dz)]

P (dx)

Page 192: g é o Statistique

190 Aide-Memoire de geostatistique lineaire :

Une formulation particuliere importante se presente lorsque la variableconditionnante X est discrete. Supposons ainsi que X puisse prendreles etats i avec les probabilites correspondantes pi. Alors :

E [Z] =∑

i

pi

z Fi(dz)

Cette expression est en particulier utile pour des calculs devariogrammes, comme on le verra au paragraphe suivant.

1.3. Les etapes de la mise en œuvreConcretement, l’utilisation pratique du theoreme comporte trois etapes,dont l’enchaınement est immuable :

• a X = x fixe, la loi de Z depend du parametre x. Ainsi, l’esperancede Z conditionnellement a X = x est une certaine fonction ϕ(x) :

E [Z | X = x] = ϕ(x)

• si on restitue a x son caractere aleatoire, E [Z | X ] devient doncune Variable Aleatoire:

E [Z | X ] = ϕ(X)

• enfin, le theoreme permet d’ecrire :

E [Z] = E [ϕ(X)]

1.4. Remarque sur la variance conditionnelleOn peut evidemment proposer une formule similaire pour calculer lavariance de Z a partir de sa loi conditionnelle. On trouve ainsi :

Var [Z] = E[

VarZ [Z | X ]]

+ Var[

EZ [Z | X ]]

Sans etre compliquee, cette formule n’a pas l’elegance du theoreme del’esperance conditionnelle. C’est pourquoi il semble judicieux, pour laclarte des calculs, de se ramener a des esperances — quitte ensuite aeffectuer les centrages necessaires. Notons que cette derniere contraintese rencontre peu en Geostatistique, puisque justement nous travaillonsen general sur des combinaisons lineaires d’esperance nulle.Cette remarque demeurera

valable au chapitre 8, dansle traitement des FAI-k. Ainsi, pour une Fonction Aleatoire Intrinseque sans derive, la variance

des accroissements n’est autre que l’esperance de leurs carres, de sorteque, avec les notations precedentes :

γ(h) =∑

i

pi [γ(h) | i ]

ou pi designe (ici en notation discrete) la loi d’un evenementconditionnant, et [γ(h) | i] le variogramme conditionnel pour l’etat ide l’evenement conditionnant.

1.5. Generalisation a plusieurs variables conditionnantesLa formule donnee pour une variable conditionnante unique s’etend sansdifficulte a plusieurs. A simple titre d’exemple, pour deux variablesconditionnantes X et Y , on trouve :

E [Z] = EY

[

EX

[

EZ [Z | X,Y ]]

]

Page 193: g é o Statistique

[1] – Esperance conditionnelle : mecanismes d’utilisation 191

avec les notations usuelles. Il est clair que EZ [Z | X,Y ], esperanceen Z, est une quantite deux fois aleatoire, comme etant fonction

deterministe a la fois de X et de Y . De meme, EX

[

EZ [Z | X,Y ]]

est

une quantite aleatoire, comme fonction de Y .

Par ailleurs, sous reserve bien sur que E [Z] existe, nous pouvons parle theoreme de Fubini intervertir l’ordre des conditionnements. Parexemple,

EX

[

EY

[

EZ [Z | X,Y ]]

]

= EY

[

EX

[

EZ [Z | X,Y ]]

]

Le choix de l’ordre des conditionnements est affaire d’opportunite, selonle probleme rencontre. Ainsi, dans l’exemple de l’Estimation Globale amaille aleatoire pure, il est paru plus expedient de conditionner d’abordpar la Realisation de la Fonction Aleatoire et de beneficier ainsi del’independance des points d’implantation, plutot que de conditionnerpar ces points d’implantation comme cela aurait pu sembler naturel.

Chapitre 6, paragraphe 2.1

2. Application aux calculs de variogrammes

2.1. Generation d’un modele triangulaireSoit a 1 dimension une maille reguliere, infinie, de longueur a. Onsuppose l’origine X0 de la maille implantee au hasard sur l’intervalle[0, a] suivant la loi uniforme.

Soit la Fonction Aleatoire Z(x) qui, sur chaque segment de la forme :[X0 + ka , X0 + (k+1)a] , prend une valeur aleatoire Zk, ou les Zk onttous la meme esperance m et la meme variance σ2 et sont independantspour deux indices k et k′ distincts.

Pour le calcul du moment d’ordre 1 de ce processus, une circonstanceparticulierement simplificatrice apparaıt. En effet, E [Z(x)] ne dependpas de l’intervalle dans lequel se trouve x, puisque tous les Zk ont memeesperance. Donc E [Z(x)] = m, qui ne depend pas de x. Le momentd’ordre 1 de Z(x) est stationnaire. Notons cette circonstance, tout afait particuliere, qu’il en est de meme pour l’esperance conditionnelleE [Z(x) | X0 = x0], qui ne depend ni de x, ni de x0.

Pour la covariance, C(x, x + h) = Cov [Z(x), Z(x+ h)], ce qui est Rappelons qu’ils’agit toujours decovariance centree.decisif est de savoir si x et x+h— on supposera h > 0 — appartiennent

tous deux au meme segment de la maille.

Si tel est le cas, Z(x) = Z(x+ h) = Zk et comme la loi de la VariableAleatoire implantee sur chaque segment est toujours la meme,

Cov [Z(x), Z(x+ h)] = Var [Zk] = σ2

Si x et x + h n’appartiennent pas au meme segment, c’est encore plussimple puisque, d’apres l’hypothese d’independance,

Cov [Z(x), Z(x+ h] = Cov [Zk, Zk′ ] = 0

On va donc choisir comme evenement conditionnant l’evenement U =appartenance de x et x + h au meme segment. Alors, d’apres letheoreme de l’esperance conditionnelle, et compte-tenu du resultat surle moment d’ordre 1 :

E [Z(x) · Z(x+ h)] = E[

EZ [Z(x) · Z(x+ h) | U ]]

= (m2 + σ2) · P [x et x+ h ∈ le meme intervalle]

+ m2 · P [x et x+ h 6∈ le meme intervalle]

Page 194: g é o Statistique

192 Aide-Memoire de geostatistique lineaire :

Or, la probabilite pour que x et x + h soient dans le meme intervalleest nulle si h > a, et vaut (a− h)/a si h < a. Ainsi,

• pour h < a, m2 + C(x, x + h) =(

m2 + σ2) a− h

a+(

m2) h

a

soit, apres simplification : C(x, x + h) = σ2

(

1 −h

a

)

• pour h > a, C(x, x + h) = 0.

Incidemment, on a etabli que C(x, x + h) ne depend pas de x : leprocessus Z(x) est donc stationnaire d’ordre 2. Sa covariance C(h)vaut, compte-tenu de la parite :

C(h) = σ2

(

1 −| h |

a

)

pour | h |< a

= 0 pour | h |> a

C’est la covariance triangulaire.

Remarque : le mode de construction de cette fonction garantit qu’il s’agitbien d’une covariance dans l’espace a 1 dimension. Il est par contreclassique que la Covariance Triangulaire n’est pas un modele autorisedans un espace a 2 dimensions ou plus.

2.2. Generation d’un modele exponentielReprenons une construction similaire : des Variables Aleatoiresindependantes de moments m et σ2 sont affectees a des segments, maisen choisissant cette fois comme extremites de ces segments un processusde Poisson de parametre λ a la place de la maille reguliere.

La demarche demeure la meme. En particulier le moment d’ordre 1 deZ(x) est egalement stationnaire : E [Z(x)] = m.

La probabilite que x et x + h (on suppose h > 0) appartiennent aumeme intervalle est egale a la probabilite qu’il n’y ait pas de point duprocessus dans l’intervalle [x, x + h] ; et on sait que cette probabilite

vaut e−λh. Alors :

m2 + C(x, x + h) =(

m2 + σ2)

e−λh + m2(

1 − e−λh)

d’ou C(x, x + h) = σ2e−λh, expression qui ne depend pas de x. On aainsi obtenu la covariance exponentielle :

C(h) = σ2e−λ|h|

(La presence de la valeur absolue en exposant resulte de ce que l’oncomplete le resultat, obtenu pour h > 0, en tenant compte de la paritede la fonction C).

3. Introduction au krigeage aleatoire

3.1. PresentationLe recours a un modele a implantation aleatoire des donnees a deja eterencontre en Estimation Globale. Dans le cas du Krigeage, il peut servira decrire une situation ou les voisinages de krigeage sont similaires, aquelques irregularites de geometrie pres : plutot que resoudre autant de

Page 195: g é o Statistique

[1] – Esperance conditionnelle : mecanismes d’utilisation 193

systemes qu’il y aura de voisinages, on prefere se referer a un voisinagemoyen sur lequel on calculera une fois pour toutes les ponderateurs,au prix bien sur d’une imprecision supplementaire.

Le modele a implantation aleatoire est aussi un moyen de prendre encompte des incertitudes de localisation, comme on en rencontre parexemple dans les mesures de type bathymetrie. Notons que le problemepratique, decisif, consiste a modeliser ces incertitudes. . .

Pour simplifier, dans l’exemple ci-dessous qui illustrera la demarche,nous supposerons que chaque donnee Zα est implantee en un pointaleatoire Xα, uniforme dans un domaine vα et independant des autrespoints. Notons que cette derniere hypothese est dans bien des casirrealiste, les erreurs de localisation etant souvent structurees et surtoutfortement correlees.

Pour rendre le probleme plus general, on supposera Z(x) intrinsequesans derive, de variogramme γ.

3.2. Linearite, autorisation et universaliteSoit a estimer la valeur inconnue Z(x) a l’aide des Zα :

Z∗(x) =∑

α

λα Z(Xα)

Il s’agit bien d’une combinaison lineaire de valeurs ponctuelles, et lepoids total de l’erreur d’estimation Z(x) − Z∗(x) est 1 −

α λα. On

retrouve donc la condition d’autorisation habituelle

α

λα = 1

en vertu de quoi l’Erreur d’Estimation est d’esperance nulle. L A U

3.3. Optimalite

3.3.1. Demarche generale

On doit minimiser la Variance d’Estimation Var [Z(x) − Z∗(x)],

conditionnellement a∑

α λα = 1. La nouveaute est ici que cette

variance s’ecrit Var [Z(x) −∑

α λα Z(Xα)], ou les Xα sont aleatoires.

Comme l’Erreur d’Estimation est d’esperance nulle, on a avantage a Oecrire sa variance

σ2A

= E

Z(x) −∑

α

λα Z(Xα)

2

et appliquer le formalisme de l’Esperance Conditionnelle. On choisira icide conditionner par l’ensemble des coordonnees des donnees. Les troisetapes decrites precedemment permettent d’ecrire successivement : Chapitre 6,

paragraphe 1.3.

• a Xα = xα fixes,

(

σ2A| Xα = xα, Xβ = xβ , . . .

)

= 2∑

α

λα γ (x− xα) −∑

α, β

λαλβ γ (xα − xβ)

c’est-a-dire la formule habituelle.

Page 196: g é o Statistique

194 Aide-Memoire de geostatistique lineaire :

• les Xα = xα etant rendus aleatoires,

(

σ2A| Xα, Xβ, . . .

)

= 2∑

α

λα γ (x−Xα) −∑

α, β

λαλβ γ (Xα −Xβ)

Notons que cette formule est vraie en toute generalite, quelle quesoit la loi du multiplet de points (Xα, Xβ, . . .).

• et enfin, par application du theoreme,

σ2A

= E[

σ2A| Xα, Xβ, . . .

]

C’est la seulement qu’intervient la loi du multiplet de points ; enl’occurrence, l’hypothese de l’independance de l’implantation de cespoints est tres simplificatrice.

3.3.2. Simplification pour des implantations uniformes independantesDans les hypotheses presentes (independance, et uniformite de Xα dansvα), la loi du multiplet s’ecrit simplement :

P (dxα, dxβ , . . .) =dxα

[vα]·dxβ

[vβ ]· · ·

chaque variable dxα parcourant le domaine vα. Ainsi

σ2A

=

· · ·

dxα

[vα]·dxβ

[vβ ]· · ·

2∑

α

λα γ (x− xα) −∑

α, β

λαλβ γ (xα − xβ)

Mais, pour un indice α fixe,∫

· · ·

dxα

[vα]·dxβ

[vβ ]· · ·(

γ (x− xα))

n’est autre apres simplification que

1

[vα]

dxα

(

γ (x− xα))

= γ[

x, vα

]

avec les notations usuelles :Chapitre 3,paragraphe 3.1.

De meme, pour deux indices α et β fixes,

· · ·

dxα

[vα]·dxβ

[vβ ]· · ·(

γ (xα − xβ))

se simplifie en

1

[vα]

1

[vβ ]

(

γ (xα − xβ))

dxα · dxβ = γ[

vα, vβ

]

si α 6= β

= 0 si α = β

3.3.3. Expression finale pour des implantations uniformes independantesExprimee a l’aide des γ, la Variance d’Estimation devient ainsi, compte-tenu de la distinction qu’il convient de faire suivant que les deux indicesα et β sont ou non confondus :

σ2A

= 2∑

α

λα γ[

x, vα

]

−∑

α6=β

λαλβ γ[

vα, vβ

]

Page 197: g é o Statistique

[1] – Esperance conditionnelle : mecanismes d’utilisation 195

En vue de la minimisation, il est peut-etre plus commode de l’ecrire sousla forme equivalente :

σ2A

= 2∑

α

λα γ[

x, vα

]

−∑

α, β

λαλβ γ[

vα, vβ

]

+∑

α

(λα)2γ[

vα, vα

]

3.4. Systeme du Krigeage AleatoireLa minimisation sous contrainte se fait des lors de facon classique, et onobtient

−∑

β 6=αλβ

Aγ [vα, vβ ] + µ

A= −γ [x, vα] (∀α)

βλβ

A= 1

en indicant naturellement par A la solution de ce krigeage aleatoire.Rappelons cependant que ces equations n’ont ete etablies que pour unmodele tres particulier d’implantation aleatoire des donnees, et que l’onpeut imaginer selon la meme demarche des formulations tres differentesde Krigeages Aleatoires.

Restant dans les hypotheses presentes, nous pouvons calculer sansdifficulte la Variance de Krigeage, qui apres les simplifications habituellesdevient

σ2A

=∑

α

λαAγ[

, x]

vα; − µA

3.5. Remarque importanteToujours en restant dans le cadre d’implantations uniformes etindependantes des donnees, il convient de noter que le systeme que nousvenons d’etablir n’est pas le meme que celui qui aurait ete construit pourestimer Z(x) a l’aide des valeurs moyennes Z(vα). Il est immediat eneffet de verifier que dans ce dernier cas, on aurait trouve

−∑

βλβ

Vγ [vα, vβ ] + µ

V= −γ [x, vα] (∀α)

βλβ

V= 1

en affectant d’un indice V le vecteur solution.

La difference entre les deux estimateurs A et V tient au terme diagonalde la matrice de Krigeage : terme nul dans le cas du Krigeage Aleatoire,mais qui vaut γ [vα, vα] dans le cas du Krigeage a l’aide des blocs vα.

Aussi, meme si la Variance de Krigeage dans ce dernier cas,

σ2V

=∑

α

λαVγ[

x, vα

]

− µV

a exactement la meme structure que pour le Krigeage Aleatoire, elle

ne prend pas la meme valeur puisque les vecteurs solutions

(

λαA

µA

)

et

(

λαV

µV

)

sont differents.

Page 198: g é o Statistique

196 Aide-Memoire de geostatistique lineaire :

Page 199: g é o Statistique

Chapitre 2

Complements surle theoreme d’additivite

Presentation

On propose ici quelques generalisations au theoreme d’additivite,d’abord dans le cadre restreint de l’estimation d’une moyenne(c’est-a-dire d’une Derive constante dans l’espace) vu auchapitre 6, ensuite dans le modele du Krigeage Universel tel qu’ila ete presente au chapitre 7.

Au premier paragraphe, on compare les resultats du Krigeagestationnaire a moyenne connue (Krigeage Simple) a ceux duKrigeage des residus en modele stationnaire a moyenne inconnue.La precision respective des estimateurs est examinee en fonctionde la somme des poids du Krigeage Simple.

Dans le second paragraphe, on se place dans le cadre d’un modeleSous-Jacent intrinseque strict. On se trouve donc dans le cas oul’estimation du terme constant de la derive n’est plus autorisee. Onetablit comme precedemment l’expression du theoreme au niveaudes estimateurs, puis des variances, mais il s’agit cette fois d’unerelation entre le Krigeage Universel et le Krigeage Ordinaire.

Au troisieme paragraphe enfin, on revient sur le cas d’un modeleSous-Jacent stationnaire, pour etablir une generalisation dutheoreme dans le cas de Krigeages Universels de degres differents.Cette generalisation est detaillee pour le krigeage ponctuel, etles resultats sont sommairement mentionnes pour l’estimation descoefficients de la derive.

1. Estimation des residus et Krigeage Simple

1.1. Hypotheses

On se place ici dans le cadre d’un modele stationnaire a moyenne Chapitre 6,paragraphe 3.3.2.

inconnue :

Z(x) = Y (x) + m

ou Y (x) est une Fonction Aleatoire Stationnaire d’esperance nulle et decovariance K.

Le Krigeage de Z dans ces hypotheses, — pour lequel on gardera parcommodite la terminologie de Krigeage Ordinaire — conduit auresultat classique Z∗

O(x) =

α λαOZα ou les ponderateurs λα

Osont

solutions du systeme

[O]

βλβ

OKαβ + µ

O= Kαx (∀α)

βλβ

O= 1

systeme que nous supposerons toujours regulier dans la suite du J J J

paragraphe.

Page 200: g é o Statistique

198 Aide-Memoire de geostatistique lineaire :

Par ailleurs, rappelons l’estimation de m : M∗ =∑

α λαMZα , qui est

obtenue par le systeme

[M ]

βλβ

MKαβ + µ

M= 0 (∀α)

βλβ

M= 1

Ce systeme est donc par hypothese regulier lui aussi, puisqu’on a priscomme hypothese que [O] l’est.

Enfin, dans le meme temps, nous supposerons egalement regulier le

Chapitre 7,paragraphe 2.3.

I I I

systeme de Krigeage Simple1

[S] ∑

βλβ

SKαβ = Kαx (∀α)

1.2. Conditions d’orthogonalite

1.2.1. Krigeage ordinaire

Concernant le Krigeage Ordinaire, on a vu que l’Erreur d’EstimationChapitre 7,paragraphe 2.4.4.

Z∗O(x)−Z(x) est orthogonale a toute combinaison lineaire des donnees

de poids total nul :

β

ϕβ = 0 =⇒ Cov

Z∗O(x) − Z(x) ,

β

ϕβZβ

= 0

La reciproque n’est pas exacte. En effet, la formule generale est

Cov

Z∗O(x) − Z(x) ,

β

ϕβZβ

=(

β

ϕβ)(

−µO

)

et donc l’orthogonalite peut avoir lieu pour une combinaison lineairedes donnees de poids total non nul si µ

O= 0. Dans ce dernier cas, on

a alors∑

βλβ

OKαβ = Kαx, ce qui signifie que le Krigeage Ordinaire

s’identifie au Krigeage Simple ou encore — ce qui est equivalent compte-

tenu de la regularite des systemes [O] et [S] — que∑

β λβS

= 1. Cette

condition recouvre evidemment le cas trivial ou l’erreur de krigeage estla variable presque surement nulle, c’est-a-dire le cas ou l’on krige unpoint de donnee.

1.2.2. Estimation de la moyenne

La meme demarche s’applique a l’estimation de la moyenne :

Cov

M∗ ,∑

β

ϕβZβ

=(

β

ϕβ)(

−µM

)

La condition de poids total nul est donc une condition suffisanted’orthogonalite. Mais cette fois, µ

Mne peut pas s’annuler : en effet,

si µM

etait nul, on aurait∑

βλβ

MKαβ = 0, donc λβ

M= 0, ce qui est

Toujours selon laregularite du systemede Krigeage Simple. incompatible avec la condition d’universalite

β λβM

= 1. La condition

1Ceci constitue une hypothese supplementaire. Voir annexe consacree a la

regularite des systemes de Krigeage.

Page 201: g é o Statistique

[2] – Complements sur le theoreme d’additivite 199

de poids total nul est donc cette fois une condition necessaire et suffisanted’orthogonalite.

1.2.3. Recapitulation

En resume,

β ϕβ = 0 ⇐⇒ Cov

M∗ ,∑

β

ϕβZβ

= 0

β ϕβ = 0 =⇒ Cov

Z∗O− Z ,

β

ϕβZβ

= 0

Cov[

Z∗O− Z ,

β ϕβZβ

]

= 0 =⇒

β ϕβ = 0

ou

β λβS

= 1

1.3. Estimation du ResiduIl est facile, selon le cheminement habituel, de construire directement unestimateur du Residu Y (x) a l’aide des seule donnees Zα, c’est-a-dire

une combinaison lineaire Z∗R(x) =

α λαRZα. On etablit sans difficulte

que les λαR

sont solutions du systeme

[R]

βλβ

RKαβ + µ

R= Kαx (∀α)

βλβ

R= 0

Du reste, on retrouve une relation evidente — resultant de la linearitedes estimateurs — a savoir

Z∗O(x) ≡ Y ∗

R(x) + M∗ [1]

le signe ≡ signifiant que l’egalite est assuree en tout point x aestimer.

Pour une combinaison lineaire∑

β ϕβZβ quelconque des donnees,

Cov[

Y ∗R

(x) − Y (x) ,∑

β ϕβZβ

]

=∑

β

ϕβ Cov[

Y ∗R

(x) − Y (x) , Zβ

]

=∑

β

ϕβ[

λαRKαβ −Kxβ

]

=(

β

ϕβ)(

−µR

)

Cette covariance est nulle si∑

β ϕβ = 0 : la condition de poids total

nul est donc une condition suffisante d’orthogonalite. Notons que cettefois encore, comme dans le cas du Krigeage Ordinaire, cette condition

Page 202: g é o Statistique

200 Aide-Memoire de geostatistique lineaire :

n’est pas toujours necessaire, meme en supposant la matrice (Kαβ )reguliere, car µ

Rpeut s’annuler. On verifie facilement que µ

R= 0 si

et seulement si la somme des poids du Krigeage Simple est nulle — lademonstration reposant comme toujours sur la regularite des systemes[R] et [S].

En resume,

I I I

Un exercice tres simple.

β ϕβ = 0 =⇒ Cov

[

Y ∗R− Y ,

β

ϕβZβ

]

= 0

Cov[

Y ∗R− Y ,

β ϕβZβ

]

= 0 =⇒

β ϕβ = 0

ou

β λβS

= 0

De ce qui precede, il s’ensuit que l’egalite au niveau des estimateurs

Z∗O(x) − Z(x) =

(

Y ∗R

(x) − Y (x))

+(

M∗ −m)

ne conduit pas en general a une relation d’additivite au niveau desvariances d’estimation. En effet, commeM∗ est une combinaison lineairedes donnees de poids total egal a 1, on a necessairement une covariance

non nulle entre(

Y ∗R

(x) − Y (x))

et M∗, sauf dans le cas particulier

ou∑

β λβS

= 0. Si en revanche∑

β λβS

= 0, cela entraıne µR

= 0, et

par suite Cov[

Y ∗R− Y , M∗

]

= −µR

= 0. Comme par ailleurs on sait

que Cov[

M∗, Y ∗R

]

≡ 0 — et ceci quel que soit le point ou a ete estime

le Residu — cela implique que, en tout point x tel que∑

β λβS(x) = 0,

on a Cov [M∗, Y (x)] = 0.

En resume,

β λβS(x) = 0 ⇐⇒

Cov[

Y ∗R

(x) − Y (x) , M∗]

= 0

Cov[

Y (x) , M∗]

= 0

1.4. Estimation des Residus et Krigeage Simple

Rappelons le theoreme d’additivite classique, tel qu’il s’exprime dansle cadre des hypotheses actuelles :Chapitre 7,

paragraphe 5.3.

Z∗O

= M∗ + λαS

(

Zα −M∗)

Page 203: g é o Statistique

[2] – Complements sur le theoreme d’additivite 201

ou encore

Z∗O(x) ≡ Z∗

S(x) + M∗

(

1 −∑

α

λαS(x))

[2]

Alors, par comparaison entre [1] et [2] :

Y ∗R

(x) ≡ Z∗S(x) − M∗

(

α

λαS(x))

En passant aux erreurs d’estimation,

Y ∗R

(x)−Y (x) ≡

(

Z∗S(x)−Z(x)

)

+

(

m−M∗(

α

λαS(x))

)

et comme l’erreur de Krigeage Simple est orthogonale a toutecombinaison lineaire des donnees, donc en particulier a M∗,

σ2R(x) ≡ σ2

S(x) + σ2

M

(

α

λαS(x))2

[3]

1.5. Quelques relations d’inegalite entre variances

De la formule d’additivite ci-dessus, on deduit

σ2R(x) ≥ σ2

S(x)

l’egalite etant atteinte si, et seulement si, la somme des poids λαS(x) de

Krigeage Simple est nulle.

Par ailleurs, au niveau des variances, on peut tirer de [2] la relationclassique Voir par exemple

Rivoirard, 1984.

σ2O(x) = σ2

S(x) + σ2

M

(

1 −∑

α

λαS(x))2

qui conduit, apres developpement du carre et compte-tenu de [3], a larelation entre σ2

O(x) et σ2

R(x) :

σ2O(x) = σ2

R(x) + σ2

M

(

1 − 2∑

α

λαS(x))

[4]

ce qui met en evidence le role de la valeur 1/2 pour la somme des poidsde Krigeage Simple :

α

λαS(x) ≤ 1/2 ⇐⇒ σ2

O(x) ≥ σ2

R(x)

Par ailleurs,

σ2O(x) = σ2

R(x) + σ2

M(x) ⇐⇒

α

λαS(x) = 0

Dans ce dernier cas, λαR(x) = λα

S(x), et µ

R= 0 : lorsque la somme

des ponderateurs du Krigeage Simple est nulle, l’estimation du Residus’identifie au Krigeage Simple.

Page 204: g é o Statistique

202 Aide-Memoire de geostatistique lineaire :

1.6. Recapitulation sur les variances et covariances

Dans la suite de ce paragraphe, et afin d’alleger les ecritures, nousdesignerons par q la somme des poids de Krigeage Simple, autrement

dit q =∑

β λβS(x). Cette quantite est le complement a 1 du poids de

la moyenne λm , tel qu’il est etudie dans la bibliographie.

Rappelons d’abord les relations entre les differents estimateursrencontres :

Z∗O

= Z∗S

+ M∗(

1 − q)

Y ∗R

= Z∗S

− M∗ q

Z∗O

= Y ∗R

+ M∗

On se propose maintenant de faire l’inventaire des variances etcovariances relatives aux quatre estimateurs suivants : Krigeage Simple,Krigeage Ordinaire, Residu et Derive. Afin d’en faciliter la comparaison,ces resultats seront exprimes a l’aide seulement de σ2

S, σ2

Met q.

Certains resultats sont de simples rappels ; le calcul (tres simple !) desautres repose essentiellement sur les trois relations precedentes, et surl’orthogonalite de l’estimation de la Derive et de l’erreur du KrigeageSimple. Le tableau recapitulatif est alors le suivant :

Cov M∗ Z∗S− Z Z∗

O− Z Y ∗

R− Y

M∗ σ2M

0(

1 − q)

σ2M

−q σ2M

Z∗S− Z σ2

Sσ2

Sσ2

S

Z∗O− Z σ2

S+(

1− q)2σ2

Mσ2

S− q(

1 − q)

σ2M

Y ∗R− Y σ2

S+ q2 σ2

M

Voir en particulierRivoirard, 1984.

1.7. Valeurs particulieres de la somme des poids de KS

On examine enfin les cas particuliers des equations [2], [3] et [4], ainsique des covariances etablies au §1.6, pour quelques valeurs sensiblesde la somme q des poids de Krigeage Simple.

1.7.1. Somme egale a 1

Ce cas particulier est classique : on sait en effet, par la formule [2],que cette egalite est une condition necessaire et suffisante pour qu’il yait identite entre Krigeage Ordinaire et Krigeage Simple. On aalors le jeu de relations :

Z∗O

= Z∗S

(et µO

= 0)

Y ∗R

= Z∗S−M∗ = Z∗

O−M∗

σ2R

= σ2S

+ σ2M

= σ2O

+ σ2M

ainsi que :

Page 205: g é o Statistique

[2] – Complements sur le theoreme d’additivite 203

Cov[

Z∗O− Z , M∗

]

= 0

Cov[

Z∗O− Z , Y ∗

R− Y

]

= σ2S

Cov[

Y ∗R− Y , M∗

]

= −σ2M

1.7.2. Somme egale a 0Dans ce cas,

Z∗O

= Z∗S

+M∗

Y ∗R

= Z∗S

(et µR

= 0)

σ2O

= σ2R

+ σ2M

= σ2S

+ σ2M

ainsi que

Cov[

Z∗O− Z , Y ∗

R− Y

]

= σ2S

Cov[

Z∗O− Z , M∗

]

= σ2M

Cov[

Y ∗R− Y , M∗

]

= 0

Cov [Y , M∗] = 0

1.7.3. Somme egale a 1/2C’est, pour la somme des ponderateurs du Krigeage Simple, la valeur en-dessous de laquelle l’estimation des Residus est meilleure que celle du

Krigeage Ordinaire. En revanche, pour∑

α λαS(x) ≥ 1/2, l’estimation

des Residus est moins bonne que celle du KO. Pour cette valeur frontiere,on a donc

Y ∗R

= Z∗S− 1

2 M∗

Z∗O

= Z∗S

+ 12 M

σ2R

= σ2O

= σ2S

+ 14 σ

2M

Naturellement, l’egalite σ2O

= σ2R

ne signifie nullement qu’il y ait J J J

identite entre Z∗O

et Y ∗R

. (Par identite, il faut entendre ici egalite

quelles que soient les donnees Zα, ou mieux encore egalite des

ponderateurs λαO

et λαR

). Une telle identite n’est pas possible, puisque∑

α λαO

= 1 tandis que∑

α λαR

= 0.

Par ailleurs,

Cov[

Z∗O− Z , Y ∗

R− Y

]

= σ2S− 1

4 σ2M

Cov[

Z∗O− Z , M∗

]

= 12 σ

2M

Cov[

Y ∗R− Y , M∗

]

= − 12 σ

2M

2. Theoreme d’additivite pour le modele intrinseque

2.1. Expression du theoreme au niveau des estimateursOn revient dans ce paragraphe au probleme du KU dans le cas oule modele Sous-Jacent est seulement intrinseque. On sait que cette

Page 206: g é o Statistique

204 Aide-Memoire de geostatistique lineaire :

hypothese a en particulier pour consequence l’impossibilite d’estimerle terme constant de la Derive.

Avec les notations usuelles (γ pour le variogramme,∑

l alflx pour la

derive), on notera avec un indice U la solution du Krigeage Universel,soit :

[U ]

−∑

βλβ

Uγαβ +

l µUl f

lα = −γαx (∀α)

βλβ

Uf l

β = f lx (∀l)

et avec un indice O la solution du Krigeage Ordinaire, c’est-a-dire :

Chapitre 7, paragraphe 4.2

[O]

−∑

βλβ

Oγαβ + µ

O= −γαx (∀α)

βλβ

O= 1

Comme il n’y a pas de confusion possible avec les notations du chapitre 7,Chapitre 7, paragraphe 5.

on designera cette fois encore avec un indice ∆ la difference

Z∗∆(x) = Z∗

U(x) − Z∗

O(x)

donc

Z∗∆(x) =

α

λα∆(x)Zα

avec

λα∆(x) = λα

U(x) − λα

O(x)

Si de plus on pose

µ∆0 = µ

U0 − µ0

µ∆l = µ

U l pour l 6= 0

on deduit alors par soustraction des systemes [U ] et [O] :

−∑

βλβ

∆γαβ +

l µ∆l flα = 0 (∀α)

βλβ

∆= 0

βλβ

∆f l

β = f lx −

ε λεOf l

ε (∀l 6= 0)

De ce nouveau systeme, on deduit immediatement

λβ∆

=∑

l6=0

λβl

(

f lx −

ε

λεOf l

ε

)

ou, selon les notations usuelles, les λβl sont les solutions du systemeChapitre 7,

paragraphe 4.2. d’estimation des coefficients al de la derive :

−∑

βλβ

l γαβ +∑

s µl s fsα = 0 (∀α)

βλβ

l fsβ = δs

l (∀s)

Page 207: g é o Statistique

[2] – Complements sur le theoreme d’additivite 205

Alors,

β λβ∆Zβ =

β

l6=0

λβl

(

f lx −

ε

λεOf l

ε

)

=∑

l6=0

(

β

λβl Zβ

)(

f lx −

ε

λεOf l

ε

)

=∑

l6=0

A∗l

(

f lx −

ε

λεOf l

ε

)

d’ou

Z∗U(x) = Z∗

O(x) +

l

A∗l

(

f lx −

ε

λεOf l

ε

)

[1]

Telle est l’expression du theoreme d’additivite, dans le cas intrinsequestrict, au niveau des estimateurs.

Notons que le probleme de l’indice l = 0 ne se pose pas puisque(

f lx −

ε λεOf l

ε

)

, le coefficient correspondant dans l’expression de λβ∆

,

s’annule. Autrement dit, la contrainte l 6= 0 qui figure dans les

sommations ci-dessus est superflue. AinsiZ∗∆(x) ne depend-il pas d’un J J J

hypothetique A∗0 — non plus bien sur que Z∗

U(x) .

2.2. Expression du theoreme au niveau des variancesSoit alors l’erreur d’estimation du Krigeage Universel :

Z∗U(x) − Z(x) = Z∗

O(x) − Z(x) +

l

A∗l

(

f lx −

ε

λεOf l

ε

)

dans laquelle on fait apparaıtre l’erreur de Krigeage OrdinaireZ∗

O(x) − Z(x).

On sait, comme consequence du theoreme general, que cette erreur de Chapitre 7,paragraphe 2.4.4.

KO est orthogonale a toute combinaison lineaire des donnees de poidstotal nul. Or les estimateurs A∗

l sont de telles combinaisons, a l’exceptionde A∗

0 — mais A∗0 est affecte d’un coefficient nul dans l’equation [1]

ci-dessus, et a donc disparu. Donc la somme∑

lA∗l

(

f lx −

ε λεOf l

ε

)

est une CLA : elle admet par consequent une variance, et est de plusorthogonale a l’erreur de Krigeage Ordinaire Z∗

O(x) − Z(x). Et

donc par suite,

Var[

Z∗U(x) − Z(x)

]

= Var[

Z∗O(x) − Z(x)

]

+ Var

[

l

A∗l

(

f lx −

ε

λεOf l

ε

)]

Page 208: g é o Statistique

206 Aide-Memoire de geostatistique lineaire :

ce qui prouve incidemment que

σ2U(x) ≥ σ2

O(x)

Cette formule peut se developper en

σ2U(x) = σ2

O(x) +

l

s

(

f lx −

α

λαOf l

α

)

Cov [A∗l , A

∗s ]

(

fsx −

β

λβOfs

β

)

soit encore, avec les notations usuellesChapitre 7,paragraphe 4.2.

σ2U(x) = σ2

O(x) −

l,s

µls

(

f lx −

α

λαOf l

α

)(

fsx −

β

λβOfs

β

)

On remarquera une nouvelle fois qu’il est superflu de preciser dans ladouble sommation que les indices l et s doivent etre non nuls : les termescorrespondants a l = 0 (ou s = 0) disparaissent, puisqu’ils sont affectesd’un facteur

(

f lx −

α λαOf l

α

)

qui s’annule.

2.3. Illustration sur un cas simpleA 1 dimension, on suppose integralement connue sur l’intervalle[−R,+R] une Fonction Aleatoire Z(x) de variogramme lineaireγ(h) =| h |, et de derive lineaire m(x) = a0 + a1.x. On souhaitekriger Z au point R+ h (avec h > 0).

On sait par un exercice classique que le Krigeage Ordinaire (enl’absence de derive) donnerait Z∗

O(R + h) = Z(R) : c’est une

consequence du caractere markovien du variogramme lineaire.

Par ailleurs, on verifie facilement que l’estimateur de la pente a1 de laderive est

A∗1 =

Z(R) − Z(−R)

2Rce qui signifie que la derive lineaire a meme pente que la droite joignantles deux extremites du segment de donnees. On a incidemment :

Var [A∗1] =

1

4R2

(

2γ(2R))

=1

R

On peut bien sur proposer un Krigeage Universel direct de Z(R + h),par

Z∗U(R+ h) =

∫ R

−R

λ(dx)Z(x)

ou :

∫ R

−R

λ(dx) | x− y | + µO

+ µ1 y = − | R+ h− y |

∫ R

−R

λ(dx) = 1

∫ R

−R

xλ(dx) = | R+ h |

Page 209: g é o Statistique

[2] – Complements sur le theoreme d’additivite 207

les condition d’optimalite etant vraies ∀y ∈ [−R,+R]. Mais c’est iciqu’il est plus simple d’appliquer le Theoreme d’Additivite :

Z∗U(R + h) = Z∗

O(R+ h) + A∗

1 (R + h−R)

= Z(R) + A∗1h

Ce meme theoreme au niveau des variances permet d’ecrire

σ2U(R+ h) = σ2

O(R + h) + h2Var [A∗

1]

Mais

σ2O(R+ h) = Var

[

Z(R+ h) − Z∗O(R + h)

]

= Var [Z(R+ h) − Z(R)]

= 2 γ(h)

c’est-a-dire 2h, et on a vu par ailleurs que Var [A∗1] =

1

R. D’ou :

σ2U(R+ h) = 2h +

h2

R

3. Generalisation a des KU de degres differents

3.1. Notations

Revenons maintenant au cas d’une Fonction Aleatoire admettant unecovariance Sous-Jacente K. On propose cette fois deux modeles dederives,

Z(x) = Y (x) +∑

l≤k

al flx

et

Z(x) = Y (x) +∑

l≤k

al flx

ou k < k , les fonctions de base f l etant identiques pour l ≤ k.

On indicera respectivement par U et U les Krigeages Universels etablisdans chacun de ces modeles. Ainsi :

Z∗

U(x) =

α

λα

U(x)Zα

ou les λα

U(x) sont solutions de

[U ]

βλβ

UKαβ +

s µU s fsα = Kαx (∀α)

βλβ

Uf l

β = f lx (∀l ≤ k)

tandis que

Z∗U(x) =

α

λα

U(x)Zα

Page 210: g é o Statistique

208 Aide-Memoire de geostatistique lineaire :

ou les λα

U(x) sont solutions de

[U ]

βλβ

UKαβ +

s µU s fsα = Kαx (∀α)

βλβ

Uf l

β = f lx (∀l ≤ k)

De meme, pour les estimations des coefficients des derives,

A∗

U l =∑

α

λα

U l Zα

avec, ∀l ≤ k,

[D]

βλβ

U lKαβ +∑

s≤k µU sl fsα = 0 (∀α)

βλβ

U l fsβ = δs

l (∀s ≤ k)

tandis que

A∗

U l =∑

α

λα

U l Zα

avec, ∀l ≤ k,

[D]

βλβ

U lKαβ +∑

s≤k µU sl fsα = 0 (∀α)

βλβ

U l fsβ = δs

l (∀s ≤ k)

Enfin, d’apres le theoreme d’orthogonalite, nous avons les resultatsChapitre 7,paragraphe 2.4..

complementaires suivants : l’Erreur de KU Z∗U(x) − Z(x) —

[respectivement : Z∗U(x)−Z(x)] — est orthogonale a toute combinaison

lineaire des donnees ϕα Zα qui verifie∑

α ϕα f l

α = 0 pour tout l ≤ k

— [respectivement : pour tout l ≤ k].

3.2. Additivite des estimateurs du KrigeageNotons cette foisCette notation, toute

temporaire, ne risque pasde preter a confusion avecles definitions precedentes.

Z∗∆

= Z∗

U− Z∗

U

et reprenons sous une forme plus generale la demarche precedente, enposant

λα∆

= λα

U− λα

U

µ∆l = µ

U l − µU l (∀l : l ≤ k)

µ∆l = µ

U l (∀l : k < l ≤ k)

On obtient par soustraction des systemes [U ] et [U ] :

β λβ∆Kαβ +

s≤k µ∆s fsα = 0 (∀α)

β λβ∆f l

β = 0 (∀l ≤ k)

β λβ∆f l

β = f lx −

β λβ

Uf l

β (∀l > k)

Page 211: g é o Statistique

[2] – Complements sur le theoreme d’additivite 209

ce qui, par identification au systeme [D], permet d’ecrire :

λα∆

=∑

l>k

λα

U l

(

f lx −

β

λβ

Uf l

β

)

µ∆s =∑

l>k

µU ls

(

f lx −

β

λβ

Uf l

β

)

(∀s ≤ k)

Alors,

λα

U= λα

U+∑

l>k

λα

U l

(

f lx −

β

λβ

Uf l

β

)

ce qui, au niveau des estimateurs, donne :

Z∗

U(x) = Z∗

U(x) +

l >k

A∗

U l

(

f lx −

β

λβ

Uf l

β

)

On dispose ici de la version la plus generale du theoreme d’additivite. J J J

Ainsi par exemple, si [U ] correspond a une absence de Derive (donc, auKrigeage Simple), on retrouve bien la formule classique : Chapitre 7,

paragraphe 5.3.

Z∗U(x) = Z∗

S(x) + M∗

x −∑

β

λβSM∗

β

= M∗x +

β

λβS

(

Zβ −M∗β

)

3.3. Additivite des variances

Pour l > k, A∗U l est une combinaison lineaire des donnees autorisee a

l’ordre k en vertu des conditions d’universalite du systeme [U ]. Ainsi,

Cov[

Z∗

U(x) − Z

U(x), A∗

U l

]

= 0 (∀l > k)

On a donc

Var[

Z∗U(x) − Z(x)

]

= Var[

Z∗U(x) − Z(x)

]

+ Var

l>k

A∗U l

(

f lx −

β

λβ

Uf l

β

)

ce qui prouve en particulier que

σ2U(x) > σ2

U(x)

Notons d’ailleurs que cette inegalite est evidente si on considere leKrigeage en termes de projections. Journel, 1977.

Page 212: g é o Statistique

210 Aide-Memoire de geostatistique lineaire :

Enfin, si on tient compte de ce que Cov[

A∗U l , A

∗U s

]

= −µU ls, on

obtient l’explicitation :

σ2

U(x) = σ2

U(x) −

l >k

s>k

(

f lx−∑

α

λα

Uf l

α

)

µU ls

(

fsx−∑

β

λβ

Ufs

β

)

Remarquons d’ailleurs, ce qui a deja note ci-dessus au cours de lapresentation dans le cadre intrinseque, que la restriction sur les indices de

la sommation double (l > k et s > k) est en realite superflue, puisque,

en vertu des equations d’universalite du systeme [U ], les termes de la

sommation s’annulent des que l’un des indices l ou s est ≤ k.

3.4. Formulaire des estimateurs de coefficients de la DeriveLes etapes pour etablir ce formulaire sont similaires a celles parcourues

au niveau du Krigeage ponctuel. Posant, ∀l ≤ k,

λα∆l = λα

U l − λα

U l

µ∆ls = µ

U ls − µU ls (∀s : s ≤ k)

µ∆ls = µ

U ls (∀s : k < s ≤ k)

On obtient par soustraction des systemes [D] et [D] :

β λβ

∆l Kαβ +∑

s≤k µ∆ls fsα = 0 (∀α)

β λβ

∆l fsβ = 0 (∀s ≤ k)

β λβ

∆l fsβ = −

β λβ

U l fsβ (∀s > k)

et donc, pour l ≤ k

λα∆l = −

s>k

λα

U s

(

ε

λε

U l fsε

)

(∀α, ∀l ≤ k)

µ∆lt = −∑

s>k

µU ts

(

ε

λε

U l fsε

)

(∀t ≤ k, ∀l ≤ k)

Alors, toujours pour l ≤ k,

A∗U l = A∗

U l +∑

β

λβ

∆l Zβ

= A∗

U l −∑

t>k

β

λβ

U t

ε

λε

U l ftε Zβ

d’ou

Page 213: g é o Statistique

[2] – Complements sur le theoreme d’additivite 211

A∗

U l = A∗

U l −∑

t>k

A∗

U t

(

ε

λε

U l ftε

)

(∀l ≤ k)

Enfin, pour l ≤ k et s ≤ k,

Cov[

A∗U l , A

∗U s

]

=∑

α,βλβ

U l λα

U sKαβ

(1)=

αλα

U s

(

−∑

t≤k

µU tl f

)

=∑

t≤k

(

−µU tl

)

(

α

λα

U s ftα

)

(1) : d’apres les equations d’optimalite de [D].

Deux cas sont alors a distinguer :

• Si s > k, on a toujours t 6= s, et le resultat est nul, puisque lasommation en α l’est.

• Si s ≤ k, la sommation en α se reduit a δts d’apres [O], et la

sommation en t est finalement egale a −µU sl

D’ou le tableau recapitulatif :

Cov[

A∗U l , A

∗U s

]

= −µU ls (∀l ≤ k, ∀s ≤ k)

Cov[

A∗U l , A

∗U s

]

= −µU ls (∀l ≤ k, ∀s ≤ k)

Cov[

A∗U l , A

∗U s

]

= 0 (∀l ≤ k, ∀s > k)

= −µU ls (∀l ≤ k, ∀s ≤ k)

Page 214: g é o Statistique

212 Aide-Memoire de geostatistique lineaire :

Page 215: g é o Statistique

Chapitre 3

Aspect dualdu Krigeage Universel

1. Presentation duale du Krigeage Universel

1.1. Complement sur l’estimation du residuNous avons precedemment construit le systeme de Krigeage du Residu Voir annexe

consacree autheoreme d’additivite.Y (x) dans le cas d’un modele stationnaire a moyenne inconnue, c’est-

a-dire a Derive constante dans l’espace. Il est immediat de generalisercette construction au cas d’un modele de type Krigeage Universel — ensupposant toujours le Residu stationnaire pour simplifier la presentation.De la sorte, si

Z(x) = Y (x) +∑

l

al flx

ou Y (x) est une Fonction Aleatoire Stationnaire d’ordre 2 de covarianceK, alors

Y ∗R

(x) =∑

α

λαRZα

avec

[R]

βλβ

RKαβ +

l µRl flα = Kαx (∀α)

βλβ

Rf l

β = 0 (∀l)

On suppose bien sur par la suite ce systeme regulier.

Ainsi, les ponderateurs λαR

— donc l’estimateur Y ∗(x) lui-meme — sontdes combinaisons lineaires des Kαx. Avec les notations adoptees pourl’inverse du systeme de Krigeage, nous avons donc Chapitre 7,

paragraphe 5.2.

λβR(x) =

αBβαKαx

µRl(x) =

α

cαl Kαx

ou, rappelons-le, les cαl ne sont autres que les ponderateurs λαl de

l’estimation du coefficient al de la Derive. Rappelons aussi que, pour

un indice ε quelconque fixe, les coefficients Bεα et λεl sont caracterises

par le systeme

BεαKαβ + λεl f

lβ = δε

β (∀β)

Bεα f lα = 0 (∀l)

Page 216: g é o Statistique

214 Aide-Memoire de geostatistique lineaire :

L’estimation du residu peut donc s’ecrire

Y ∗(x) =∑

β

α

BβαKαx Zβ

soit, au niveau de la Variable Regionalisee,

y∗(x) =∑

α

bαKαx

bα =∑

β

Bβα zβ

On pourrait, par analogie avec le vocabulaire employe pour l’estimationde la Derive, etre tente d’appeler les bα coefficients du residuestime, puisque ce residu estime se developpe selon les Kαx commela derive se developpe selon les f l

x. Toutefois, il existe une differenceimportante : dans le modele du KU, la Derive vraie est effectivementL’adjectif vrai doit

toujours etre compriscomme vrai dans lemodele probabiliste.

un developpement alflx, et les a∗l qui surgissent dans le mecanisme

d’estimation sont effectivement les estimateurs des vrais al. Au contraire,les coefficients bα qui apparaissent lors de l’estimation du Residu n’ontpas de correspondant dans le modele de depart : le Residu vrai n’est pasun developpement selon les Kαx.

1.2. Estimation de la Derive et Krigeage Universel

Nous savons queChapitre 7,paragraphe 4.1.

m∗(x) =∑

l

a∗l flx

a∗l =∑

β

λβl zβ

(Comme precedemment pour le Residu, nous exprimons cette estimationau niveau de la Variable Regionalisee).

Par ailleurs, de la relation evidente

z∗U(x) = z∗

R(x) + m∗(x)

(vue en detail dans le cas particulier du Krigeage Ordinaire), ilVoir annexe consacree auTheoreme d’Additivite.

s’ensuit que l’estimateur du Krigeage Universel est une combinaisonlineaire des Kαx et des f l

x, soit :

z∗U(x) =

α

bαKαx +∑

l

a∗l flx

Dans la demarche actuelle, les bα et a∗l , qui ne dependent pas du pointx a estimer, ont ete calcules par un processus tenant compte du modeleprobabiliste : la construction de la matrice du KU, dans une optique deminimisation de variance.

2. Caracterisation des coefficients du KUOn se propose maintenant de caracteriser les coefficients bα et a∗l parun jeu d’equations qui s’affranchira de toute interpretation probabiliste.

On sait pour commencer que le KU est un interpolateur exact. Si lepoint a estimer x est confondu avec un des points de donnees xβ (et

Page 217: g é o Statistique

[3] – Aspect dual du Krigeage Universel 215

ceci quel que soit β), on a z∗U(xβ) = zβ . De la sorte, on dispose d’un

jeu d’equations

z∗U(xβ) =

α

bαKαβ +∑

l

a∗l flβ = zβ (∀β)

Ces equations sont au nombre de N , si N est le nombre de points dedonnees.

Par ailleurs, nous savons que∑

α Bεαf l

α = 0 — (∀l, ∀ε) — et que

bα =∑

β Bβαzβ .

Donc,

∀l :∑

α

bα f lα =

β, α

Bβα zβ flα = 0

On a cette fois k equations, k etant le nombre de fonctions f l.

Paragraphe 1.1.

En resume, on dispose de N + k equations que satisfont les N + kcoefficients bα et a∗l :

[B]

αbαKαβ +

l a∗l f

lβ = zβ (∀β)

αbα f l

α = 0 (∀l)

Mais ce systeme n’est autre, quant a son premier membre, que le systemedu Krigeage Universel, que l’on a suppose regulier. Ce qui signifie quece jeu d’equations [B] caracterise les coefficients bα et a∗l .

Autrement dit, si cette fois on definit un estimateur z(x) par

z(x) =∑

α

bαKαx +∑

l

a∗l flx

ou les bα et a∗l verifient le systeme [B], on sait que z(x) est en realiteidentique a l’estimateur z∗

U(x) du Krigeage Universel.

Mais, dans cette construction de z(x), toute reference probabiliste adisparu : sous sa forme z(x), l’estimateur du KU n’a donc plus lesens que d’un interpolateur. On sait de plus que dans la decomposition∑

α bαKαx +

l a∗l f

lx , le premier terme correspond a l’estimation du

Residu, et le second a celui de la Derive.

Telle est finalement la formulation duale du Krigeage Universel.

3. Interet pratiqueDans tout le present paragraphe, on supposera le jeu de donnees fixe J J J

une fois pour toutes. Cette condition est essentielle.

Dans l’optique classique, une estimation — du Krigeage Universel parexemple — exige de resoudre autant de systemes que de points a estimer.

On peut egalement inverser une seule fois le systeme de KU, et stocker Le stockage du reste de lamatrice inverse n’est pasutile si on ne s’interessepas aux variances.

les coefficients Bβα et λεl , qui sont donc en nombre N(N + k). Cette

approche revient a resoudre (N + k) systemes.

En revanche, si on renonce au calcul des variances, on peut se contenterd’estimer et stocker les (N+k) coefficients bα et a∗l , a l’aide d’une seuleresolution du systeme : gain de memoire et surtout gain de calcul peuventetre considerables, puisque ces seuls coefficients permettent de realiser

Page 218: g é o Statistique

216 Aide-Memoire de geostatistique lineaire :

l’estimation en autant de points que souhaite, sans nouvelle resolutiond’equations.

4. PerspectivesOn notera que la formulation duale du Krigeage fournit une indicationprecise sur les proprietes analytiques de l’estimateur. Si, comme on lesuppose presque toujours, les fonctions de base f l

x sont des monomes, outout au moins des fonctions indefiniment derivables, alors le caracterede regularite de z∗(x) est uniquement lie au degre de continuite de lafonction K, c’est-a-dire plus precisement a sa regularite a l’origine.

Par ailleurs, on remarque que l’equation d’estimation

z∗(x) =∑

α

bαKαx +∑

l

a∗l flx

donne, au moins sous forme implicite, l’equation des lignes de niveau, laligne de niveau z0 etant le lieu des points x tels que z∗(x) = z0 :

x : z∗(x) = z0

Compte-tenu du caractere extremement simple de l’expression de z∗(x),on pourrait donc imaginer un algorithme de cartographie automatiquequi ne necessiterait pas le recours a une grille intermediaire, comme celase fait usuellement. Inutile de preciser que cette approche, extremementsimple en voisinage unique, risque de se compliquer notablement lors dupassage en voisinages glissants.

Page 219: g é o Statistique

Chapitre 4

Demonstrationdu theoreme des

Representations

1. Hypotheses

Z est une FAI-k, c’est-a-dire que

• Z est une application lineaire sur Λk ;

• ∀λ ∈ Λk, Z (τhλ) est stationnaire d’ordre 2 en h.

2. Enonce du theoreme

Theoreme :

• Toute FAI-k Z admet des Representations.

• Si Z(x) est une de ces Representations, toutes les autres Representations Z1(x)sont de la forme :

Z1(x) = Z(x) + Al fl(x)

ou les Al sont des Variables Aleatoires quelconques.

3. Construction d’une representation particuliere

3.1. Choix d’un systeme de ponderateursSoit un jeu de points xα, et une famille de coefficients verifiant :

λαl f

sα = δs

l

Remarque : quelle que soit la dimension de l’espace, il est toujourspossible de trouver de tels coefficients si le nombre de points xα estsuffisant. Cette relation n’est autre que la condition d’universalite duprobleme d’estimation des coefficients de la derive en KU. Notons Chapitre 7,

paragraphe 4.1.d’ailleurs que cette relation ne caracterise pas les λα

l , mais c’est ici sansimportance : ce qui est decisif est la possibilite de construire au moinsun jeu de tels coefficients.

3.2. Construction d’une CLA d’ordre kConstruisons maintenant une mesure, designee par εx, et affectant lespoids suivants :

Page 220: g é o Statistique

218 Aide-Memoire de geostatistique lineaire :

• le poids 1 au point x

• les poids −f lx λ

αl aux points xα

Nous adopterons la notation en mesure :

εx(dt) = δx(dt) − f lx λ

αl δα(dt)

Alors, pour toute fonction de base f s :

fs(t) εx(dt) = f sx − f l

x λαl f

(1)= fs

x − f lx δ

sl

= fsx − fs

x = 0

(1) : resultant de la relation sur les λαl .

Donc : εx est une mesure autorisee.

3.3. Construction d’une Fonction Aleatoire non stationnaireDefinissons une fonction aleatoire non stationnaire Z(x) par :

Z(x) = Z(

ε(dt))

Soit par ailleurs λ ∈ Λk une Combinaison Lineaire Autorisee d’ordre kquelconque. Alors :

λ(dx)Z(x) =

λ(dx) Z (εx(dt))

(1)= Z

(∫

λ(dx) εx(dt)

)

(1) : etant une consequence de la linearite de Z sur Λk (l’integraleest selon dx).

Mais, compte-tenu de la definition de εx, cette integrale en dx s’ecrit :

(

λ(dx) εx(dt)

)

=

λ(dx)[

δx(dt) − λαl f

lx δα(dt)

]

= λ(dt) − λαl δα(dt)

λ(dx) f lx

= λ(dt)

parce que λ est par hypothese une CLA-k, et que par suite l’integrale∫

λ(dx) f lx s’annule.

Page 221: g é o Statistique

[4] – Demonstration du theoreme des Representations 219

En reportant dans l’egalite precedente, on obtient donc :

λ(dx)Z(x) = Z(λ)

egalite vraie ∀λ ∈ Λk. On a donc demontre que Z(x) une

Representation de Z.

3.4. Conclusion

On sait donc construire au moins une Representation Z(x) pour toute

Fonction Aleatoire Intrinseque d’ordre k quelconque Z .

4. Caracterisation de l’ensemble des representations

4.1. Enonce

Deux Fonctions Aleatoires sont Representations d’une meme FAI-k si et

seulement si elles different d’un polynome arbitraire Al flx de degre k.

4.2. Condition suffisante

Soit Z(x) une Representation de Z, et Al flx un polynome quelconque.

Posons :Z1(x) = Z(x) +Al f

lx

Alors, ∀λ ∈ Λk,

λ(dx)Z1(x) =

λ(dx)Z(x) +Al

λ(dx) f lx

(1)=

λ(dx)Z(x)

(2)= Z(λ)

(1) : parce que λ est une CLA-k ;

(2) : parce que Z est Representation de Z.

Donc, par definition, Z1 est Representation de Z.

4.3. Condition necessaireSoient Z et Z1 deux Representations de la meme FAI-k Z :

∀λ ∈ Λk :

λ(dt)Z(t) =

λ(dt)Z1(t) = Z(λ)

Posons alors Z0 = Z − Z1. Par definition,

∀λ ∈ Λk :

λ(dt)Z0(t) = 0

Cette egalite sera vraie en particulier pour la mesure εx(dt), definieci-dessus au §3.2,qui est une Combinaison Lineaire Autorisee d’ordre k.

Page 222: g é o Statistique

220 Aide-Memoire de geostatistique lineaire :

Donc,

0 =

[

δx(dt) − f lx λ

αl δα(dt)

]

Z0(t)

= Z0(x) − f lx λ

αl Z0(xα)

(1)= Z0(x) −Al f

lx

(1) : en posant Al = λαl Z0(xα).

Il s’agit la d’une egalite vraie ∀x, donc d’une identite en x. Ainsi :

Z0(x) ≡ Al flx

Et finalement, Z et Z1 different d’un polynome en x.

Page 223: g é o Statistique

Chapitre 5

Demonstration dutheoreme de regularite

du Krigeage Intrinseque

1. Enonce du theoreme

Theoreme :

Le systeme de Krigeage Intrinseque

βλβ Kαβ + µl f

lα = Kαx

βλβ f l

β = f lx

est regulier si et seulement si :

• la sous-matrice des Covariances GeneraliseesKαβ est de type positif conditionnel strict ;

• les Fonctions de Base f lα sont lineairement

independantes sur les donnees.

2. Remarque preliminaireUn moyen commode de verifier la regularite de la matrice :

(

Kαβ f lα

f lβ 0

)

est de s’assurer que le systeme homogene :

βbβ Kαβ + cl f

lα = 0 (∀α)

βbβ f l

β = 0 (∀l)

n’a pas d’autres solutions que bα = 0 et cl = 0.

3. Condition necessaire

3.1. Necessite de la seconde conditionSupposons une dependance lineaire des Fonctions de Base sur lesdonnees, c’est-a-dire la seconde condition non satisfaite. Soit donc Dl

un jeu de coefficients non tous nuls tels que, ∀α, Dl flα = 0 .

Page 224: g é o Statistique

222 Aide-Memoire de geostatistique lineaire :

Alors, le jeu de coefficients bα = 0 et cl = Dl est solution du systemehomogene. Or ces coefficients sont non tous nuls d’apres l’hypothese faitesur les Dl. Donc le systeme homogene, qui admet une solution non nulle,est singulier.

Par la suite, nous devons donc supposer au moins la seconde conditionsatisfaite. Cela a pour consequence d’abord que le nombre de donneesdoit etre au moins egal au nombre de fonctions de base, et ensuite surtoutque la matrice rectangulaire f l

α doit etre de rang p, ou p est le nombre defonctions de base. On peut donc trouver au moins un jeu de coefficientsλα

l verifiant :λα

l fsα = δs

l

3.2. Effet du non-respect de la premiere conditionSupposons que la premiere condition ne soit pas satisfaite. Il existe alors

En fait, on peut trouverune infinite de jeux de

tels coefficients. Dans lecas present, peu importele jeu particulier choisi.

une mesure λ non nulle — c’est-a-dire un jeu de coefficients λα nontous nuls — telle que :

λα Kαβ λβ = 0

Autrement dit, il existe une CLA-k, a savoir Y = λα Zα, nonidentiquement nulle et telle que :

Var [λα Zα] = 0

Soit donc X est une Combinaison Lineaire Autorisee d’ordre k ,

quelconque : X = Z(µ), avec µ ∈ Λk. En vertu de l’inegalite deSchwartz,

| Cov [Y,X] | ≤√

Var [Y ] .Var [X ]

d’ouCov [λα Zα, X] = 0

Autrement dit :

∀µ ∈ Λk :

λαK(xα − t)µ(dt) = 0

3.3. Necessite de la premiere conditionAppliquons la formule precedente a la CLA-k εx deja rencontree, c’est-Voir annexe sur

le theoreme desRepresentations. a-dire dans le cas

µ(dt) = εx(dt) = δx(dt) − f lx λ

αl δα(dt)

ou x est un point quelconque. Alors :

0 =

λα K(xα − t)[

δx(dt) − f lx λ

βl δβ(dt)

]

= λαKαx − λα λβl Kαβ f

lx

= λαKαx − el flx

en posant el = λα λβl Kαβ. Cette egalite etant vraie pour tout x, elle

est vraie en particulier pour x prenant toutes les valeurs xα, xβ . . .. On

Page 225: g é o Statistique

[5] – Demonstration du theoreme de regularite du Krigeage Intrinseque 223

a ainsi montre que le jeu de coefficients λα et el, non tous nuls selonl’hypothese sur les λα, verifie :

αλαKβα + (−el) f

lβ = 0 (∀β)

αλα f l

α = 0 (∀l)

c’est-a-dire le systeme homogene. Celui-ci est donc singulier, et lapremiere condition est bien ainsi, comme la seconde, necessaire a laregularite du Krigeage Intrinseque.

3.4. Resultat complementaire

3.4.1. Consequence du theoreme precedent

Accessoirement, nous avons demontre que si λ est une CLA non

identiquement nulle qui verifie λα Kαβ λβ = 0, alors, ∀x,

λα Kαx = el flx

ou les el sont des coefficients numeriques dependant de λ, de la fonctionstructurale K, et des points xα.

Donc, λα Kαβ λβ = 0 entraıne que l’expression λα Kαx est une

combinaison lineaire des fonctions de basef lx.

3.4.2. Reciproque

La reciproque est immediate : si λ, Mesure Autorisee d’ordre k, est telleque, ∀x, λα Kαx ≡ el f

lx, alors :

λα Kαβ λβ = (el f

lβ)λβ = el

(

λβ f lβ

)

= 0

La forme quadratique λα Kαβ λβ est nulle.

3.4.3. Enonce

∀λ ∈ Λk : (λα Kαβ λβ = 0) ⇐⇒ λα Kαx = el f

lx

Une Combinaison Lineaire Autorisee d’ordre k Z(λ)est de variance nulle si et seulement si la combinaisonλα Kαx est, identiquement en x, combinaison lineairedes fonctions de base f l

x.

4. Condition suffisanteSupposons maintenant les deux conditions de regularite satisfaites, etsoit le systeme homogene :

βbβ Kαβ + cl f

lα = 0 (∀α) [a]

βbβ f l

β = 0 (∀l) [b]

Page 226: g é o Statistique

224 Aide-Memoire de geostatistique lineaire :

Multiplions les equations [a] par bα, et sommons en α :

bαKαβ bβ + cl f

lα b

α = 0

Mais comme, d’apres [b], f lα b

α = 0, on obtient

bαKαβ bβ = 0

ce qui, d’apres la propriete [1] supposee verifiee par hypothese, impliquebα = 0, (∀α).

En reportant dans les equations [a], il s’ensuit que, ∀α, cl flα = 0 ce

qui entraıne d’apres la propriete [2] que cl = 0

Ainsi, la seule solution du systeme homogene est le vecteur nul : donc lesysteme est regulier.

Page 227: g é o Statistique

Chapitre 6

EquivalenceSpline-Krigeage

Presentation

A l’aide du formalisme du Krigeage dual, on veut montrer(dans le cas fini seulement) que les estimateurs rencontres enGeostatistique Lineaire peuvent s’exprimer en terme d’integralesd’espace (Splines).

Le point de vue du Krigeage Universel est une premiere approche.On suppose que le modele admet une covariance Sous-Jacentestationnaire, et on examine successivement les formulations del’estimation de la Derive et du Krigeage Simple. La synthese,relative au formalisme du Krigeage Universel, est acquise graceau theoreme d’additivite.

Le point de vue du Krigeage Intrinseque exige de formulerde nouvelles hypotheses, et en particulier de prouver quel’indetermination inherente au formalisme des FAI-k est sansconsequence sur l’interpretation de nos resultats en termes deSplines. Le theoreme d’equivalence peut ensuite etre complete parquelques resultats algebriques sur les proprietes de la matrice deKrigeage Intrinseque.

1. Estimation des coefficients de la deriveDans tout ce paragraphe, nous nous placerons dans le cadre d’un modelede dichotomie, ou le phenomene global est considere comme la sommed’un Residu admettant une Covariance et d’une Derive deterministe. Cesont la les conditions du Chapitre 7, a modele Sous-Jacent stationnaire.

1.1. Systeme d’estimationRappelons le systeme d’estimation des coefficients as de la Derive : Chapitre 7,

paragraphe 4.1.A∗

s = λαs Zα , avec :

(∀s)

αλα

s σβα + µls flβ = 0 (∀β) [1]

αλα

s ftα = δt

s (∀t) [2]

Notations : pour eviter tout rapprochement intempestif avec le modelede FAI-k examine ulterieurement, nous choisirons exceptionnellement denoter σ la fonction de covariance.

On suppose de plus que la matrice de terme general σαβ , ou α et βparcourent l’ensemble des donnees, admet un inverse de terme generalQαβ — soit, en ecriture matricielle : [σ]−1 = [Q].

Les equations [1] s’ecrivent alors :

λαs = −µls f

lβ Q

αβ

Page 228: g é o Statistique

226 Aide-Memoire de geostatistique lineaire :

d’ou, en reportant dans les conditions [2] :

−µls flβ Q

αβ f tα = δt

s (∀s, ∀t)

Si on pose gst = f lβ Q

αβ f tα, on a donc (matriciellement)

[−µ] = [g]−1

Enfin, reportant l’expression de λαs dans l’estimation de A∗

s , et en seplacant au niveau de la Realisation, on obtient :

a∗s = −µls flβ Q

αβ zα [3]

1.2. Estimateur du maximum de vraisemblance (cas gaussien)On considere une Fonction Aleatoire gaussienne de covariance σsupposee connue, et de Derive al f

lx, ou les al sont inconnus. On conserve

la notation α, β, . . . pour l’indice des points de mesure.

L’estimation du maximum de vraisemblance de la Derive consiste arechercher les valeurs des parametres al inconnus qui maximisent ladensite de probabilite du multiplet zα, zβ , . . .. Cette densite s’ecrit,dans le cas gaussien :

f(zα; al) = (2πDet[σ])−n

2 e−12 (zα−alf

lα) Qαβ (zβ−asfs

β)

ou :

• n designe la dimension des matrices [Q] et [σ] ;

• Qαβ est l’inverse de la matrice σαβ ;

• Det[σ] est le determinant de σαβ . Le facteur devant l’exponentielleest donc connu ;

• les al et as sont les inconnues du probleme.

Ainsi, maximiser f(zα; al) revient a maximiser l’expression en exposant,donc a minimiser la forme quadratique

(zα − alflα)Qαβ (zβ − asf

sβ)

1.3. Point de vue generalOn definit cette fois un jeu d’estimateurs as des as comme etant lesvaleurs qui minimisent la forme quadratique :

(zα − asfsα)Qαβ (zβ − atf

tβ)

Il existe bien un tel minimum, et unique, puisque Qαβ est strictementdefinie positive comme inverse de σαβ . On sait donc de plus que, dansle cas d’une Fonction Aleatoire gaussienne, cet estimateur est identiquea celui du Maximum de Vraisemblance.

Dans le cas general, l’estimateur a annule les derivees partielles de laforme quadratique, c’est-a-dire qu’il est solution de

∂(

(zα − asfsα)Qαβ (zβ − atf

tβ))

∂al

= 0 (∀l)

Page 229: g é o Statistique

[6] – Equivalence Spline-Krigeage 227

On a donc, ∀l,

−f lβ Q

αβ (zα − asfsα) = 0

ou encore :as f

sαQ

αβ f lβ = f l

β Qαβ zα

Mais on sait que fsαQ

αβ f lβ = gsl est la matrice inverse de (−µls),

ou les µls sont les solutions du systeme de Krigeage des coefficients al.Donc :

as = −µls flβ Q

αβ zα

ce qui n’est autre que l’expression de l’estimateur a∗s .

Paragraphe 1.1.

Paragraphe 1.1.

1.4. Conclusion

L’estimateur as, defini ci-dessus comme minimisation d’une integraled’espace, est identique a l’estimateur a∗s de Krigeage, et coıncide deplus avec l’estimateur du Maximum de Vraisemblance dans le cas d’uneFonction Aleatoire gaussienne.

2. Notations Generales

2.1. Indices et ensembles concernes

On designe par A l’ensemble des points de donnees, et par α, β, . . .l’indice de ces points xα, xβ , . . .

On designe par V l’ensemble des points a estimer et par u, v, . . . l’indicede ces points xu, xv , . . ..

Precision essentielle : on suppose A ∩ V = ∅ J J J

Enfin, on designe par i, j, . . . l’indice des points appartenantindifferemment a A ou V . On pose : I = A ∪ V . Il s’agit d’une uniondisjointe, et par consequent :

i∈I

=∑

α∈A

+∑

u∈V

2.2. Matrices de covariances

Soit σij une matrice de covariance, reguliere sur l’ensemble I . D’apresles notations ci-dessus, nous avons matriciellement :

(σij) =

(

σαβ σαv

σuβ σuv

)

2.2.1. Proprietes d’une sous-matrice de covariance

La fonction σ etant une fonction de covariance, donc etant de typepositif, toute matrice (σij) — ou (σαβ), ou (σuv) — sera egalementde type positif.

Theoreme : si de plus (σij) est strictement positive, il en sera de memede toute sous-matrice de covariance, et en particulier de (σαβ).

En effet, supposons

α, β∈A

λα σαβ λβ = 0

Page 230: g é o Statistique

228 Aide-Memoire de geostatistique lineaire :

Si nous completons le vecteur λα — ou(

α ∈ A)

— par un vecteur de

composantes toutes nulles λu = 0 — ou(

u ∈ V)

—, nous obtenons

finalement un vecteur λi — ou(

i ∈ I)

— tel que∑

i, j∈I

λi σij λj = 0

et donc, (σij) etant strictement positive, cela implique λi = 0 pouri ∈ I , et en particulier λα = 0 pour α ∈ A.

En resume :∑

α, β∈A

λα σαβ λβ = 0 ⇐⇒ ∀α ∈ A : λα = 0

2.2.2. NotationsOn designera par [B] l’inverse de la matrice [σ] sur I , donc :

k∈I

σik Bkj = δj

i

De meme, on designera par [Q] l’inverse de la matrice [σ] sur A. Cetinverse existe en vertu du theoreme precedent. Donc :

ε∈I

σαε Qεβ = δβ

α

Mais attention ! La matrice [Q] n’est pas la restriction a l’ensemble AI I I

de la matrice [B]. Autrement dit,

Qαβ 6= Bαβ

La relation entre ces deux quantites sera precisee au §2.4.

2.3. Une identitePartons de l’identite, toujours vraie :

f(zi) = fA(zα) . fV (zu | zα)

qui exprime que la densite du multiplet zi est egale au produit de ladensite a priori du multiplet zα (ou α ∈ A : les zα representent lesvaleurs conditionnantes) par la densite conditionnelle du multiplet zu,u ∈ V , conditionnellement aux zα.

Dans le cas particulier d’une loi gaussienne de covariance σ, et avec lesnotations adoptees precedemment :

• f(zi) = e−12 zi Bij zj , a un coefficient multiplicatif pres qui ne

depend pas des zi ;

• de meme, fA(zα) = e−12 zα Qαβ zβ ;

• enfin, comme resultat classique de la loi multigaussienne, on saitque la loi des Zu conditionnellement aux Zα est egalement unemultigaussienne, avec :

— E [Zu | Zα, Zβ, . . .] = Kαu Zα

ouKαu Zα represente le poids de Zα dans le Krigeage Simple de

Zu : l’esperance conditionnelle s’identifie en effet au Krigeagepour une Fonction Aleatoire gaussienne ;

— Cov [Zu, Zv, . . . | Zα, Zβ , . . .] = Suv ,

matrice definie positive stricte d’inverse note Cuv , qui nedepend pas des zα ;

— la densite conditionnelle fv (zu, zv, . . . | zα, zβ, . . .) est donc,a un coefficient multiplicatif pres qui ne depend ni des zu, nides zα, de la forme :

e−12 (zu−Kα

u zα) Cuv (zv−Kβv zβ)

Page 231: g é o Statistique

[6] – Equivalence Spline-Krigeage 229

Il ne reste plus qu’a reporter ces expressions dans l’identite initiale, pourobtenir :

ziBij zj = zαQ

αβ zβ + (zu−Kαu zα)Cuv (zv−K

βv zβ) [4]

identite purement algebrique dans laquelle la loi de Gauss ne joue J J J

finalement aucun role.

2.4. Identification des termesComme d’autre part, en decomposant la sommation sur I en sescomposantes sur A et sur V , on sait que

ziBij zj = zαB

αβ zβ + 2 zαBαu zu + zuB

uv zv

on trouve par identification :

• Buv = Cuv = (Suv)−1 [5]

• Bαu = −Kαv C

vu = −Kαv B

vu

(et donc Kαv = −SvuB

uα) [6]

• Bαβ = Qαβ + Kαu B

uv Kβv [7]

3. Krigeage Simple

3.1. Systeme d’estimationToujours en designant par Kα

u les ponderateurs du Krigeage Simple,l’estimateur du KS s’ecrit donc :

z∗u = Kαu zα

avec les Kαu caracterises par les equations de Krigeage Simple :

Kαu σβα = σβu

3.2. Minimisation d’une integrale d’espaceSoit a minimiser ziB

ij zj sous la contrainte zα donnes. On cherchedonc a minimer cette expression relativement aux zu ou encore, d’apresl’identite precedente [4], on cherche a minimiser

(zu −Kαu zα) Cuv (zv −Kβ

v zβ)

puisque l’autre partie de l’expression, zαQαβ zβ, ne fait pas intervenir

les inconnues zu.

Mais Cuv etant strictement definie positive, cette expression seratoujours positive, sauf si zu −Kα

u zα = 0 — auquel cas elle sera nulle,donc minimum. Les valeurs zu qui realisent ce minimum nul sont donc :

zu = Kαu zα

c’est-a-dire identiques au Krigeage z∗u.

Page 232: g é o Statistique

230 Aide-Memoire de geostatistique lineaire :

4. Krigeage Universel

4.1. Systeme d’estimationL’estimateur du Krigeage Universel s’ecrit z∗

U= λα

Uzα, avec

αλα

Uσβα + µ

U l flβ = σβx (∀β)

αλα

Uf l

α = f lx (∀l)

4.2. Minimisation d’une integrale d’espaceOn cherche a faire la synthese du Krigeage Simple et de l’estimation de laDerive. On se laisse guider par le Theoreme d’Additivite pour examinerla forme quadratique :

(zi − alfli ) B

ij (zj − asfsj )

On veut minimiser cette forme a la fois par rapport aux al et aux zu,pour zα fixes. Ainsi, en utilisant une nouvelle fois l’identite algebrique [4],on veut minimiser

(zα − alflα)Qαβ (zβ − asf

sβ)

+[

zu − alflu −Kα

u (zα − alflα)]

Buv[

zv − asfsv −Kβ

v (zβ − asfsβ)]

par rapport a la fois aux al et aux zu , les zα etant fixes. Cela s’effectueen deux etapes :

• on minimise d’abord a al fixes, par rapport aux zu . Le premierterme est alors fixe. Comme Buv est de type positif strict, leminimum est donc obtenu pour des zu verifiant

zu − alflu − Kα

u (zα − alflα) = 0

soit encore

zu = alflu + Kα

u (zα − alflα)

• il ne reste plus alors qu’a minimiser

(zα − alflα) Qαβ (zβ − asf

sβ)

par rapport aux al : ce minimum est atteint pourVoir l’estimation de laDerive, paragraphe 1.

al = al = a∗l

Alors, la valeur de zu qui assure le minimum est donnee par :

zu = alflu + Kα

u (zα − alflα)

= a∗l flu + Kα

u (zα − a∗l flα)

c’est-a-dire z∗u, d’apres le Theoreme d’Additivite.

zu est donc identique a l’estimateur de Krigeage Universel z∗u.I I I

Page 233: g é o Statistique

[6] – Equivalence Spline-Krigeage 231

5. Krigeage Intrinseque (FAI-k)

5.1. Position du probleme

Dans les etapes precedentes, on avait suppose que σij etait de typepositif strict. Cette hypothese n’est plus adaptee au modele des FAI-k :la matrice Kij de Covariance Generalisee n’a aucune raison d’avoir cettepropriete, et ne l’a donc pas dans le cas general.

On supposera en revanche toujours par la suite que la matrice Kij estde type positif conditionnel strict relativement a un jeu de fonctions debase f l

i , et on supposera que ces fonctions de base sont lineairementindependantes sur l’ensemble des points xi, i ∈ I .

On sait que ces conditions sont necessaires et suffisantes pour assurer laregularite du systeme general :

bi Kij + cl flj = ϕj (∀j)

bi f li = Rl (∀l)

ou en l’occurrence

(

ϕj

Rl

)

est un vecteur libre quelconque.

Chapitre 8,paragraphe 3.3.

On peut donc trouver des matrices [B], [C] et [ν] telles que :

bi = Bij ϕj + Cil R

l

cl = Cjl ϕj + νls R

s

ou encore :(

Kij f lj

fsj 0

)−1

=

(

Bij Cil

Cjl νls

)

ou explicitement :

Bki Kij + Ckl f

lj = δk

j (∀k, j) [8]

Cil Kij + νls f

sj = 0 (∀l, j) [9]

Bji f lj = 0 (∀l, i) [10]

Cjl f

sj = δs

l (∀l, s) [11]

Le systeme de depart etant symetrique, Bij est egalement symetrique.On note d’autre part que les equations [9] et [11] presentent la structured’un estimateur de coefficient de derive a partir de tous les points de I .

5.2. Donner un sens aux Splines

Une minimisation d’integrale d’espace (Spline) s’effectue sur laRealisation d’une representation particuliere de la Fonction AleatoireIntrinseque d’ordre k Sous-Jacente. Il donc faut s’assurer, si on cherchea minimiser une expression du type fiB

ij fj et comparer ce resultat au

Krigeage Intrinseque, que la matrice Bij ne depende pas du choix d’uneRepresentation particuliere.

La forme generale de la covariance σ d’une Representation d’une FAI-k Matheron, 1971 (b).

de covariance generalisee K est donnee par :

σij = Kij − aliflj − asjf

si + Tls f

li f

sj

Page 234: g é o Statistique

232 Aide-Memoire de geostatistique lineaire :

On peut alors representer le vecteur libre deja rencontre

(

ϕj

Rl

)

par

un systeme construit a l’aide de cette covariance de Representationparticuliere, soit

bi σij + cl flj = ϕj (∀j)

bi f li = Rl (∀l)

ou bien sur les coefficients bi et cl sont distincts des bi et cl duparagraphe precedent.

De ce nouveau systeme, on en deduit d’abord que ces bi et cl sont descombinaisons lineaires des ϕj et Rl :

bi = Bij ϕj + Cil R

l

cl = Cil ϕi + νlsR

s

Par ailleurs, en remplacant σij par son expression en fonction de laCovariance Generalisee K, on trouve

biKij + (cl − bi ali) flj = ϕj +Rs asj − TlsR

s f lj (∀j)

bi f li = Rl (∀l)

ou l’on fait apparaıtre dans le terme de gauche le systeme generalexprime en terme de Covariance Generalisee — systeme qui, parhypothese, est regulier. Par suite,

bi = Bij(

ϕj +Rs asj − TlsRs f l

j

)

+ Cil R

l

et,

(

ϕj

Rl

)

etant un vecteur libre, on etablit donc, par identification

entre les deux expressions de bi :

Bij = Bij

La matriceBij est bien une Caracteristique Intrinseque. En revanche, laI I I

meme identification conduit a

Cis = Ci

s + Bij asj − Bij Tls flj

et on pourrait egalement facilement verifier :

νls = νls + Cil asi + Ci

s ali + Bij asj ali

5.3. Une bijection essentielleSoit le systeme :

biKij + cl flj = ϕj (∀j)

bi f li = 0 (∀l)

cas particulier du systeme general presente au §5.1 : en l’occurrence, ona choisi Rl = 0, et ϕj est un vecteur libre quelconque.

Page 235: g é o Statistique

[6] – Equivalence Spline-Krigeage 233

Compte-tenu de nos hypotheses sur la positivite stricte de la matrice Ket la lineaire independance des fonctions de base, ce systeme est regulier.

Il etablit donc une bijection entre le vecteur

(

bi

cl

)

et le vecteur

(

ϕj

0

)

— ou, pour simplifier, le vecteur (ϕj ).

Ainsi, la matrice de Krigeage Intrinseque permet de definir une bijectionentre des vecteurs de dimensions differentes. En particulier, il pourra etrejudicieux dans les developpements a venir de caracteriser un vecteur libre

quelconque (ϕj ) par un vecteur

(

bi

cl

)

ayant plus de composantes, mais

plus commode a manipuler.

5.4. Proprietes de la matrice Bij

• Bij est definie positive.

Soit en effet le systeme :

bi Kij + cl flj = ϕj (∀j)

bi f li = 0 (∀l)

ou, selon le mecanisme vu au paragraphe precedent, ϕj est unvecteur quelconque.

Alors, en appliquant au cas Rl = 0 les formules generales du §5.1,

bi = Bij ϕj

cl = Cil ϕi

d’ou :ϕi B

ij ϕj = bj ϕj

= bj Kij bi + bj cl f

lj

= biKij bj

≥ 0

• Mais Bij ne peut pas etre STRICTEMENT definie positive carBij f l

j = 0. Et, plus generalement,

ϕi = cl fli =⇒ ϕi B

ij ϕj = 0

• Reciproquement, les combinaisons ϕi = cl fli sont les seules qui

annulent la forme quadratique ϕiBij ϕj .

Demonstration : on veut donc montrer l’implication

ϕi Bij ϕj = 0 =⇒ ϕi = cl f

li

1. Soit ϕi tel que Bij ϕj = 0. Alors, comme dans le cas Rl = 0

on sait que bi = Bij ϕj , cela implique bi = 0, et par suiteParagraphe 5.1.

ϕj = bi Kij + cl flj = cl f

lj . Ainsi,

Bij ϕj = 0 =⇒ ϕj = cl flj

Page 236: g é o Statistique

234 Aide-Memoire de geostatistique lineaire :

2. Construisons la Variable Aleatoire : Y i = Bij Zj . Il s’agit bien

d’une Combinaison Lineaire Autorisee, puisque Bij f lj = 0 .

La covariance de Y i et Y j existe donc, et vaut :

Cov[

Y i, Y j]

= Bii′ Ki′j′ Bj′j

Mais l’equation [8], qui s’ecrit :

Bii′ Ki′j′ + Cil f

lj′ = δi

j′

peut etre multipliee par Bj′j (∀j) et sommee en j′, d’ou :

Bii′ Ki′j′ Bj′j + Ci

l flj′ B

j′j = δij′ B

j′j

et puisque f lj′ B

j′j = 0,

Bii′ Ki′j′ Bj′j = Bij

Finalement :

Cov[

Y i, Y j]

= Bij

3. Soit maintenant ϕi tel que ϕi Bij ϕj = 0. On construit

Y = ϕi Yi. Alors :

Var [Y ] = ϕiBij ϕj = 0

ce qui montre que Y est la Variable Aleatoire presque surementnulle. Y est donc en covariance nulle avec toute CombinaisonLineaire Autorisee, et en particulier Y j . Alors,

0 = Cov[

Y i, Y]

= Bij ϕj

Ainsi, Bij ϕj = 0 (∀i), donc ϕi = cl fli d’apres le point 1.

Finalement,

ϕi Bij ϕj = 0 =⇒ ϕi = cl f

li

5.5. Equivalence Spline–Krigeage

5.5.1. Annonce de la methode et du resultatOn examine le minimum de la forme quadratique giB

ij gj sous lacontrainte gα = zα donnes. On procede en deux etapes :

• on etablit d’abord que la condition d’unicite de la solution a ceprobleme est equivalente a la condition de regularite du KrigeageIntrinseque ;

• on se place alors dans ces conditions de regularite commune, et onmontre que la solution unique au probleme de Spline s’identifie acelle du Krigeage Intrinseque.

5.5.2. Definition de la matrice Bij

Soit une matrice Bij definie par :

(

Kij f lj

fsj 0

)−1

=

(

Bij Cil

Cjl νls

)

ou :

• Kij est positive conditionnelle stricte sur I ;

• les f li sont lineairement independants sur I .

Page 237: g é o Statistique

[6] – Equivalence Spline-Krigeage 235

Remarque : dans ces hypotheses,Bij est bien caracterisee par la relationci-dessus, puisque la matrice de gauche est alors reguliere, et doncinversible.

On cherche a quelles conditions la forme quadratique giBij gj admet

un minimum unique— l’existence de solutions resultant de theoremesgeneraux. C’est la recherche de ce minimum que nous appellerons leprobleme de Splines.

5.5.3. Expression des solutions du systeme des Splines

Annulons les derivees partielles de giBij gj par rapport aux

composantes inconnues gu, soit :

∂gu

(

giBij gj

)

= 0

ou encore :

Buj gj = 0 (∀u ∈ V )

En decomposant cette somme sur I en ses composantes sur A et sur V ,

Voir le theoremesur la regularite dusysteme de Krigeage.

On conserve les notationsusuelles : A designel’ensemble des donnees,et V l’ensemble despoints a estimer.

on a les equations :

Buv gv +Buα gα = 0 (∀u ∈ V )

ou encore

Buv gv = −Buα gα = −Buα zα

La solution sera unique si et seulement si Buv est reguliere. Et alors,d’apres [5],

gv = −SvuBuα zα (∀v ∈ V )

5.5.4. Consequence de la singularite de Buv

Cherchons a caracteriser les solutions de Buv ϕv = 0. Soit ϕ une tellesolution, et posons Y u = Buj Zj et Y = ϕv Y

v. Toutes les VariablesAleatoires Y u — et toutes leurs combinaisons lineaires, parmi lesquellesen particulier Y — sont bien des Combinaisons Lineaires Autoriseesd’ordre k grace a l’equation [10].

Alors, par hypothese sur ϕv ,

Var [Y ] = ϕu Buv ϕv = 0

ce qui signifie que Y est la Variable Aleatoire presque surement nulle, quiest donc de covariance nulle avec toute Combinaison Lineaire Autorisee,et en particulier avec

Y i = Bij Zj

Comme Cov[

Y i, Y v]

= Biv , on a donc ainsi : Paragraphe 5.3.

0 = Cov[

Y i, Y]

= Cov[

Y i, ϕv Yv]

= Biv ϕv

On a donc etabli un premier resultat :

Buv ϕv = 0 =⇒ Biv ϕv = 0

Page 238: g é o Statistique

236 Aide-Memoire de geostatistique lineaire :

5.5.5. Condition necessaire de singularite du systeme de Splines

Soit donc un vecteur ϕu non nul solution de Bvu ϕu = 0. D’apres leresultat precedent, on aura biu ϕu = 0 (∀i ∈ I).

On definit un vecteur ϕi en completant ϕu par des ϕα nuls :

ϕi =

ϕu

ϕα = 0

Avec cette definition, on a donc :

Bij ϕj = Biu ϕu + Biα ϕα = Biu ϕu = 0 (∀i ∈ I)

et donc ϕi Bij ϕj = 0.

On a etabli precedemment que cela implique, ∀i ∈ I , ϕi = cl fli , et en Paragraphe 5.4.

particulier ϕα = cl flα. Mais ϕα = 0 par construction.

On a donc construit une combinaison lineaire des fonctions de base,non identiquement nulle, et qui s’annule sur les donnees. Le systeme deKrigeage Intrinseque sera donc singulier. D’ou le resultat :

Si le systeme des Splines est singulier, le systeme deKrigeage Intrinseque est singulier.

5.5.6. Reciproque

Supposons maintenant le systeme de Krigeage Intrinseque singulier. Lamatrice Kij etant positive conditionnelle stricte sur I l’est a fortiori surA. Si le systeme de Krigeage Intrinseque est singulier, c’est donc que lesfonctions de base ne sont pas lineairement independantes sur A.

Soient donc cl 6= 0 tels que cl flα = 0. On pose, ∀i ∈ I , ϕi = cl f

li ; on

a ainsi ϕα = 0.

Comme Bij f lj = 0, on a Bij ϕj = 0 ou encore, comme ϕα = 0,

Biv ϕv = 0. En particulier, en limitant l’indice i a l’ensemble A :

Buv ϕv = 0 (∀u ∈ V )

Donc, la matrice Buv est singuliere.

Si le systeme de Krigeage Intrinseque est singulier,le systeme des Splines est singulier.

5.5.7. Recapitulatif

En conclusion des deux implications precedentes,

Les systemes des Splines et du Krigeage Intrinseque ontles memes conditions de regularite.

On se placera dans toute la suite dans l’hypothese ou les deux problemessont reguliers, c’est-a-dire admettent une solution unique.

5.5.8. Explicitation de la solution des Splines

On a vu que cette solution s’ecrit :

Page 239: g é o Statistique

[6] – Equivalence Spline-Krigeage 237

gu = − Suv Bvα zα

gα = zα

5.5.9. Explicitation de la solution du Krigeage Intrinseque

Sous sa forme duale, le Krigeage Intrinseque donne :

z∗j = bαKαj + cl flj

avec :

βbβ Kαβ + cl f

lα = zα (∀α)

βbβ f l

β = 0 (∀l)

On prolonge le vecteur bα a l’ensemble de tous les indices de I , par descomposantes nulles bu = 0, soit :

bi =

bu = 0

Alors,

z∗j = biKij + cl flj

et

bi f li = 0

Mais cet ensemble d’equations n’est autre que le systeme deja rencontre,ce qui permet d’ecrire : Paragraphe 5.1.

bi = Bij z∗j

cl = Cjl z

∗j

Comme par construction bu = 0, on a Buj z∗j = 0. C’est tresexactement l’equation des Splines. Et comme on a suppose le problemeregulier, on a bien z∗j = gj . Ainsi,

Lorsque le probleme des Splines est regulier, sa solution estidentique a celle du Krigeage Intrinseque.

5.5.10. Explicitation des ponderateurs du Krigeage Intrinseque

Sous sa forme directe, le Krigeage Intrinseque s’ecrit :

z∗u = λαu zα

Comme cette solution est identique a la solution du probleme de Splines,on obtient par identification :

λαu = −Suv B

Page 240: g é o Statistique

238 Aide-Memoire de geostatistique lineaire :

5.5.11. Resultat complementaire

En se placant ici au niveau de la Fonction Aleatoire, on a parconstruction Buj Z∗

j = 0. Posons

Y i = Bij Zj

En particulier,

Y u = Buj Zj = Buj(

Zj − Z∗j

)

La difference(

Zj − Z∗j

)

represente l’Erreur de Krigeage. Cette erreur

est nulle sur A (ensemble des donnees) parce que le Krigeage est uninterpolateur exact. Donc :

Y u = Buv (Zv − Z∗v )

Posons enfin :

Rv = Zv − Z∗v = Svu Y

u

Rv′ = Zv′ − Z∗v′ = Sv′u′ Y u′

Alors,

Cov [Rv, Rv′ ] = Svu Cov[

Y u, Y u′]

Su′v′

et comme Cov[

Y u, Y u′]

= Buu′

et (Buv) = (Suv)−1

, alors:

Cov [Rv, Rv′ ] = Svv′

La matrice Buv est l’inverse de la matrice decovariances des Erreurs de Krigeage.

Page 241: g é o Statistique

Chapitre 7

Etude de la bathymetriesur le site du Titanic

Presentation

Ce texte, dont le but est d’illustrer par un exemple reel la mise enœuvre de l’Analyse Variographique en Geostatistique Intrinseque,est extrait de la publication Traitement des donnees a supportspatial : la Geostatistique et ses usages — document realise al’initiative et avec le soutien d’EdF.

Les donnees relatives au site du Titanic sont presenteesavec l’autorisation de TAURUS INTERNATIONAL / TITANICVENTURES. Pour raison de confidentialite, les coordonnees et lesprofondeurs ne seront pas mentionnees, non plus que les details surla strategie de la campagne de reconnaissance.

1. Presentation des donneesL’objet de cette etude etait de fournir une image du fond sous-marin aproximite immediate de l’epave du Titanic. Les planches proposees iciveulent attirer l’attention sur les etapes d’une Analyse Variographiquereelle, ainsi que sur l’importance du choix du voisinage de Krigeage.

Comme presque toujours pour des donnees a la mer, les informationsdisponibles sont reparties sur des profils (planche 1). Les donnees sonttres denses sur les profils (ici, une information tous les 50 metresen general), tandis que les profils sont beaucoup plus espaces. On setrouve d’emblee confronte a une anisotropie, non pas de la VariableRegionalisee — on ne dispose actuellement d’aucune information a cesujet — mais de l’information. A chaque etape donc, il faudra s’assurerque cette situation ne provoque pas d’artefact. En particulier, il fautevidemment a reception des donnees demander la raison de la maillede reconnaissance : pourquoi cette orientation precisement, pourquoin’avoir pas fait de quadrillage. Une des conditions essentielles a labonne marche d’une Analyse Variographique est en effet de disposerd’une information non preferentielle : les donnees doivent pouvoir avoirune signification statistique non biaisee. Cela ne signifie naturellementpas que la Geostatistique ne peut travailler que sur des donneesaveugles, mais que les informations qualitatives a priori doivent etresoigneusement prises en compte avant tout traitement statistique, soit endelimitant des sous-zones homogenes, soit en incorporant explicitementces informations au modele.

En l’occurrence, le choix de la campagne obeissait a des contraintesetrangeres a la variable bathymetrique a etudier : il n’y avait doncpas de biais a redouter a priori . Cela dit, a reception des donnees,force est de constater que les donnees privilegient une direction. Enfait, a l’echelle de travail demandee (200 ou 300 metres), il n’est paspossible d’avoir une information sur la structure de la bathymetrie dans

Page 242: g é o Statistique

240 Aide-Memoire de geostatistique lineaire :

la direction perpendiculaire aux profils. Aussi, nous sommes contraintsde nous limiter aux variogrammes dans la direction des profils et,faute d’information supplementaire, nous sommes obliges de chercherun modele isotrope. En effet, nous de disposons d’aucun element pourenvisager quelque modelisation que ce soit d’une eventuelle anisotropie.

Cette situation est typique en Geostatistique. Faute d’arguments dedecision, nous nous rabattons sur le modele minimum. Tout autrechoix serait arbitraire, et les libertes qu’il laisserait dans le choix deparametres seraient illusoires. Certes, le modele minimum aussi estarbitraire, mais c’est celui qui fait courir le moins de risques, et celuiqui sera le plus facile a corriger en cas de refutation ulterieure. Pourdes raisons de prudence, pour des raisons de realisme aussi, il est bond’adopter a chaque etape d’une modelisation un principe d’economie :eviter la proliferation d’hypotheses ou de parametres qui ne peuvent etresoumis a aucun controle.

2. Calcul des variogrammesAinsi, les variogrammes sont calcules a une dimension, dans la directiondes profils. La planche 2 presente ces variogrammes aux pas 50, 100 et500 metres. La derniere figure regroupe ces trois resultats, et confirmeleur coherence. La conclusion qui prevaut est clairement qu’un modelestationnaire n’est pas acceptable. Sur les deux premieres figures en effet,on ne voit pas apparaıtre de palier, ce qui semble indiquer qu’il n’ya pas de stationnarite jusqu’a l’echelle 5000 metres au moins. Au pas500 metres, on pourrait admettre a la rigueur un phenomene de paliervers 20 kilometres, mais ce palier serait de l’ordre de trois fois la variancedes donnees, ce qui est incompatible avec un modele stationnaire. Biensur, un tel effet de depassement de la variance pourrait etre du a uneforte anisotropie (et alors, le palier dans d’autres directions serait tres en-dessous de la variance), mais il n’y a aucun moyen de controler ce modele.Le principe d’economie nous suggere donc de rechercher un modele nonstationnaire, en esperant que s’il y a effectivement une anisotropie, ellesera prise en compte par la derive. L’Analyse Variographique est doncentreprise en FAI-k, a l’aide du logiciel BLUEPACK.

3. Analyse Variographique non stationnaire

3.1. Approche automatiqueUne premiere approche a l’aveugle, utilisant les options par defaut,conclut a une FAI-1, de Covariance Generalisee lineaire + spline. Lacarte resultante, obtenue par Krigeage avec des voisinages de 12 points(valeur par defaut) est inacceptable — voir planche 3. La raison en estque rien dans cette estimation ne contraint le programme a utiliser desdonnees provenant de profils differents. Ainsi, pour estimer des valeursvoisines d’un profil donne, le voisinage de Krigeage n’utilise que desdonnees issues de ce profil. D’une part donc, on travaille en FAI-1 avecdes donnees presque alignees — ce qui conduit a une quasi-singularite dusysteme de Krigeage. D’autre part, vues du point a estimer, les donneesne sont reparties au mieux que dans un angle de 180 — ce qui signifieque l’on est en extrapolation. Paradoxalement, ce n’est que lorsqu’onest assez loin entre deux profils que l’on retrouve des conditions moinsinacceptables : le voisinage comporte des informations sur chacun desdeux profils, le systeme est regulier, et les courbes de niveau deviennentplausibles.

3.2. Modification des parametres par defautIl est possible de contraindre le programme, aussi bien pour l’AnalyseVariographique que pour le Krigeage, a utiliser des donnees appartenant

Page 243: g é o Statistique

[7] – Etude de la bathymetrie sur le site du Titanic 241

a au moins n profils distincts. En prenant la valeur minimum n = 3, leprogramme diagnostique cette fois une FAI-2, avec une Covariance Ge-neralisee lineaire. Le Krigeage, realise avec le voisinage par defaut de 16points, est presente sur la planche 4. On note une certaine amelioration,en particulier dans les zones ou les profils sont regulierement espaces etinformes. Cependant, il subsiste des anomalies des que le programme ades difficultes a trouver des informations a la fois bien reparties et issuesde trois profils differents.

L’idee est donc d’augmenter le nombre minimum de profils a utiliser.En passant a n = 5, et avec des voisinages de 24 points, le resultat estcatastrophique (planche 5). A posteriori , on constate que cela est du aun modele de Covariance Generalisee trop regulier (cubique). Ainsi, lorsdu Krigeage, la valeur estimee est extremement sensible a la donnee laplus proche, et traduit donc les moindres fluctuations des donnees. Enrevanche, lorsqu’on est assez loin de toute donnee, c’est plutot sur laderive que s’aligne l’estimateur.

Notons que, dans le cas de la planche 3, il etait clair a priori que l’onobtiendrait des anomalies — et cette estimation n’a ete realisee que dansun but pedagogique. En revanche, dans le cas de la planche 5, le resultatcatastrophique est un enseignement : il signifie en quelque sorte quele modele de FAI-2 — ou plus exactement, le choix de l’ordre 2 pour laFAI — conduit a une trop grande instabilite numerique compte-tenu desvoisinages choisis et compte-tenu de la structure intrinseque des donnees.Le programme d’Analyse Variographique se defend alors en adoptantune Covariance Generalisee trop reguliere qui, jointe a une derive dusecond degre, conduit a des estimateurs completement erratiques.

3.3. Une solution acceptableIl faut tirer un enseignement de cette experience. A l’evidence, imposertrois comme minimum du nombre de profils utilises est insuffisant, selonla planche 4. Par ailleurs, on vient de voir qu’une derive quadratiquedestabilise l’estimation. Par rapport a la planche 5, l’idee est doncd’imposer au programme une derive lineaire, toutes choses egales parailleurs. Dans ces conditions, le programme diagnostique un modele lineaire + cubique (planche 6). Ce modele est assez voisin, au pointde vue regularite et degre de derive, de celui de la planche 3 ; en revanche,il est identique a celui de la planche 5 quant a la structure des voisinages.

Le resultat peut cette fois etre considere comme assez satisfaisant. Sansdoute faudrait-il effectuer un faible lissage des lignes de niveau, pourgommer les quelques irregularites dues localement a des voisinageslegerement defectueux. En revanche, la structure transversale que surles planches 3 et 4 on aurait pu attribuer a des artefacts, et qui etaitcompletement cachee par les parasites sur la planche 5, est ici clairementvisible. Il s’agit d’un canon qui existe reellement, et dont la structure estd’ailleurs connue. La restitution de ce relief a ete juge satisfaisante parle client.

Naturellement, a l’apparition d’une telle heterogeneite, il faudraitreprendre une Analyse Variographique fine, qui distinguerait lesstructures du canon et du reste du champ. Les donnees disponibles dansce cas ne le permettaient pas. Tout au plus, on aurait pu retirer del’Analyse Variographique les donnees du canon, et proposer un modelestructural pour le reste : la restitution de la bathymetrie aurait alors eteun peu meilleure sur la majeure partie de la carte, et vraisemblablementsensiblement moins bonne sur le canon. . .

3.4. Recherche d’allegement des calculsLa derniere manipulation que nous proposons sur ce cas d’etude visea une economie de temps calcul. Nous cherchons l’impact du nombrede points du voisinage, toutes les autres conditions etant identiques a

Page 244: g é o Statistique

242 Aide-Memoire de geostatistique lineaire :

celles de l’estimation precedente. En prenant la valeur par defaut de huitpoints, on obtient la carte de la planche 7, qui par rapport a l’estimationprecedente n’est qu’assez faiblement degradee. Or, dans le cas present,le systeme de Krigeage n’est que de dimension 11 × 11, alors qu’iletait 27 × 27 dans le calcul precedent. Pour un travail en routine —ce qui d’ailleurs n’etait pas le cas ici — le gain de temps justifieraitvraisemblablement la faible degradation constatee.

Enfin, pour conclure cet exemple, la planche 8 propose la carte desecart-types de Krigeage pour cette derniere estimation. On y distingueevidemment les profils de reconnaissance. On observera egalement — cequi etait previsible theoriquement — que le canon n’est pas discernablesur cette carte : cela est naturel, puisque l’on a adopte un modelestructural global, et qu’alors, l’ecart-type de Krigeage ne depend quede la geometrie de l’information, et non des valeurs des donnees.Naturellement, une etude plus detaillee ne saurait se contenter de ceresultat. . .

4. Elements de conclusionLa lecon a tirer de cet exemple pourtant simple, est la grande difficultequ’il y aurait a elaborer une procedure purement automatique d’AnalyseVariographique et d’estimation. Le dialogue entre le geostatisticien et lesdonnees (et celui qui les a fournies. . . ) est bien un element essentiel d’uneetude reelle.

Par ailleurs, le recours a des criteres de qualite purement statistiquesrisquerait de causer bien des desillusions. Ainsi, dans l’etude proposeeici, c’est de la planche 5 que le programme s’accommoderait le mieux :c’est la qu’il a eu le plus de liberte pour ajuster les parametres au mieuxde ses tests statistiques. Et effectivement, la restitution des valeurs aproximite immediate des donnees est excellente. Malheureusement, cequi interesse l’utilisateur est precisement ce qui se passe ailleurs quepres des donnees ; pour conduire a un resultat interessant, le modeledoit donc apporter plus d’information qu’il n’en est contenu dans lesdonnees. Ce surcroıt d’information (ici : choix de la taille du voisinageet degre impose de la derive) mesure la necessaire responsabilite que legeostatisticien doit engager dans la conduite d’une etude pratique.

Page 245: g é o Statistique

[7] – Etude de la bathymetrie sur le site du Titanic 243

Page 246: g é o Statistique

244 Aide-Memoire de geostatistique lineaire :

INFORMATION DISPONIBLE

Planche 1.

Page 247: g é o Statistique

[7] – Etude de la bathymetrie sur le site du Titanic 245

VARIOGRAMMES SUR PROFILS

Planche 2.

Page 248: g é o Statistique

246 Aide-Memoire de geostatistique lineaire :

ESTIMATION PAR KRIGEAGE

Voisinage : 12 points, pas de codeStructure : k = 1

Lineaire -0.3591 10−1

Spline 0.4383 10−4

Planche 3.

Page 249: g é o Statistique

[7] – Etude de la bathymetrie sur le site du Titanic 247

ESTIMATION PAR KRIGEAGE

Voisinage : 16 points, code [3]Structure : k = 2

Lineaire -0.3087

Planche 4.

Page 250: g é o Statistique

248 Aide-Memoire de geostatistique lineaire :

ESTIMATION PAR KRIGEAGE

Voisinage : 24 points, code [5]Structure : k = 2

Cubique 0.5056 10−7

Planche 5.

Page 251: g é o Statistique

[7] – Etude de la bathymetrie sur le site du Titanic 249

ESTIMATION PAR KRIGEAGE

Voisinage : 24 points, code[5]Structure : k = 1 (force)

Lineaire -0.1360 10−1

Cubique 0.6797 10−8

Planche 6.

Page 252: g é o Statistique

250 Aide-Memoire de geostatistique lineaire :

ESTIMATION PAR KRIGEAGE

Voisinage : 8 points, code [5]Structure : k = 1 (force)

Lineaire -0.2047 10−1

Cubique 0.1869 10−7

Planche 7.

Page 253: g é o Statistique

[7] – Etude de la bathymetrie sur le site du Titanic 251

ECART-TYPE DE KRIGEAGE

Voisinage : 8 points, code [5]Structure : k = 1 (force)

Lineaire -0.2047 10−1

Cubique 0.1869 10−7

Planche 8.

Page 254: g é o Statistique

252 Aide-Memoire de geostatistique lineaire :

Page 255: g é o Statistique

Chapitre 8

Introductionau filtrage d’erreurs

Presentation

Ce bref chapitre est une evocation, d’ailleurs simplifiee, de deuxexercices proposes dans le Fascicule 5. Il vise principalement ademystifier les notations du Cokrigeage, par la presentation d’unexemple elementaire.

Au premier paragraphe, on traite le cas du filtrage d’une erreurnon systematique : comment estimer un signal lorsque les donneessont entachees d’une erreur d’esperance nulle.

Le probleme du filtrage d’une erreur systematique, examine ausecond paragraphe, est en fait presque identique au probleme del’estimation d’un Residu presente en annexe 2.

1. Filtrage d’une erreur non systematique

1.1. Hypotheses et notations

On suppose que les donnees utilisees dans cet exercice sont desrealisations d’une certaine FASt-2 Z, qui peut se decomposer ainsi :

Z(x) = Y (x) + ε(x)

ou : Dans l’exercice dereference (Fascicule 5,p205), on se placedans le cadre duKrigeage Universel :cette derive est nonconstante dans l’espace.

• Y (x) est une FASt-2 de Derive (inconnue) m, et de covariancestationnaire K(h) ;

• ε(x) est une FASt-2 de covariance Kε(h) et, ce qui est essentiel,d’esperance nulle.

On supposera que Y et ε sont independantes — ce qui allegera lesecritures. D’un point de vue mathematique, cette contrainte est d’ailleursnon essentielle ; mais on imagine mal en pratique comment on pourraitsur un jeu de donnees reelles zα realiser la variographie simultanee de Yet ε sans cette restriction : il n’est d’ailleurs pas sur que meme le modelesimplifie propose ici soit tres aise a caler sur un cas reel.

Dans ces conditions, on peut considerer que Y constitue un signalet ε un bruit. Par hypothese, on suppose que l’on ne dispose quede donnees sur le signal bruite, et on voudrait reconstituer le signalsous-jacent sur la base de ces donnees : il s’agit donc d’un probleme defiltrage, ou si l’on prefere de nettoyage de donnees.

Par un calcul trivial, on explicite le jeu de fonctions structurales :

Page 256: g é o Statistique

254 Aide-Memoire de geostatistique lineaire :

Cov [Y (x) , Y (y)] = Kx,y

Cov [ε(x) , ε(y)] = Kεx,y

Cov [Z(x) , Z(y)] = Kx,y + Kεx,y

Cov [Z(x) , Y (y)] = Kx,y

ce qui prouve incidemment que la covariance croisee entre Y et Z estsymetrique. De fait, on est exactement dans les hypotheses du ModeleLineaire de Coregionalisation.

1.2. Systeme de filtrageOn cherche donc a construireL

Y ∗(x) =∑

α

λα Zα

sans contrainte d’autorisation active (modele FASt-2).ALa contrainte de non-biais E [Y ∗(x) − Y (x)] = 0 s’ecritU

α

λα = 1

et la variance a minimiser sous contrainte vautO

Var [Y ∗(x) − Y (x)] =∑

α,β

λα λβ(

Kαβ +Kεαβ

)

− 2∑

α

λα Kαx + Kxx

Finalement, on etablit le systeme de filtrage

[F ]

βλβ

F

(

Kαβ +Kεαβ

)

+ µF

= Kαx

βλβ

F= 1

auquel est associee la variance

σ2F

= Kxx −∑

α

λαFKαx − µ

F[1]

Naturellement, ce systeme n’a fondamentalement rien de nouveau : ilcorrespond seulement a un cas extremement simple d’Analyse Krigeante.Le signal que l’on a cokrige est tres semblable a un Facteur ; aussiLe signal n’est pas

exactement un Facteurau sens du chapitre 9,

parce qu’il n’est pasd’esperance nulle.

— et bien que dans ce cas le signal Y et les donnees Z soient de memenature et possedent une signification physique —, il ne s’agit pas d’uneinterpolation. Il n’y a donc en particulier aucune raison pour que lavaleur y∗α estimee en un point de donnee coıncide avec la valeur zα dela donnee en ce point.

1.3. Remarque sur la regularite du systemeOn observe que le membre de gauche du systeme [F] est exactementcelui que l’on obtiendrait pour un Krigeage monovariable de Z. Aussises conditions de regularite sont-elles exactement celles de ce krigeagede Z, et l’on se placera naturellement dans le cas ou ce systeme est

Page 257: g é o Statistique

[8] – Introduction au filtrage d’erreurs 255

regulier. Notons que cette situation ne serait pas modifiee dans uneoptique Krigeage Universel.

Cela signifie que, dans le cadre de nos hypotheses, il a ete possibled’estimer une VR — y — pour laquelle on ne disposait d’aucune donnee.Pour reprendre les notations du chapitre 9, cela signifie que l’on est enmesure d’estimer une VR z

i, alors que S

i= ∅. Cette situation est

evidemment confortable mathematiquement, mais fait en contrepartiecourir des risques (classiques. . . ) au niveau du realisme des estimations.

1.4. Comparaison aux krigeages monovariablesIl peut etre interessant de comparer le resultat du Filtrage auxestimations monovariables du signal et du signal bruite (il estrealiste de supposer que l’estimation du bruit lui-meme ne presente pasd’interet pratique).

L’ideal serait bien sur de disposer de donnees non bruitees, et de pouvoir

J J J

realiser l’estimation de Y (x) a l’aide de donnees Yα : en l’occurrence, ils’agirait d’un Krigeage Ordinaire banal, dont la solution est fourniepar le systeme

[Y ]

βλβ

YKαβ + µ

Y= Kαx

βλβ

Y= 1

la variance correspondante s’ecrivant :

σ2Y

= Kxx −∑

α

λαYKαx − µ

Y[2]

Notons qu’ils s’agit bien cette fois d’une interpolation, et que bien sur cekrigeage est un Interpolateur Exact. Malheureusement, par hypothese,on ne peut realiser cette estimation faute de donnees.

Meme si cela ne presente pas un interet pratique evident, ce que l’on peutfaire en revanche compte-tenu des donnees disponibles est le krigeage deZ(x). Il s’agit encore une fois d’une estimation classique — un Krigeagemonovariable —, et l’on obtient le systeme

[Z]

βλβ

Z

(

Kαβ +Kεαβ

)

+ µZ

= Kαx +Kεαx

βλβ

Z= 1

auquel est associee la variance

σ2Z

= Kxx +Kεxx −

α

λαZ

(

Kαx +Kεαx

)

− µZ

[3]

De nouveau, il s’agit la d’un Interpolateur Exact.

On peut seulement noter que la matrice de (co)krigeage est la meme dansle cas des systemes [F] et [Z]. La comparaison entre les trois systemess’arrete la dans le cas general.

1.5. Cas particulier d’un bruit blancLorsque le bruit est un bruit blanc, c’est-a-dire lorsque la covarianceKε est un effet de pepite pur :

Kεxy = Kε(0) pour x = y

= 0 pour x 6= y

Page 258: g é o Statistique

256 Aide-Memoire de geostatistique lineaire :

on peut preciser la comparaison entre les systemes [F] et [Z] :

• lorsque le point a estimer x ne coıncide avec aucun des points α dedonnees, les seconds membres des deux systemes sont identiques (lespremiers membres le sont de toute facon). Donc, les ponderateursλ

Zet λ

Fsont identiques, ainsi que les estimateurs correspondants.

En revanche, par comparaison des variances [3] et [1], on etablitimmediatement

σ2Z

= σ2F

+ σ2ε [4]

en designant par σ2ε = Kε(0) la variance du bruit ;

• si le point x a estimer est un point de donnee, alors σ2Z

= 0, puisquele krigeage est un interpolateur exact.

En revanche, σ2F

ne peut s’annuler. En effet,

σ2F

= Var

[

α

λα Zα − Y (x)

]

= Var

[

α

λα Yα − Y (x)

]

+ Var

[

α

λα εα

]

d’apres l’independance de Y et ε. On a donc une relationd’inegalite :

σ2F

≥ Var

[

α

λα εα

]

= σ2ε

α

(

λα)2

> 0

En resume, en dehors des points de donnees, on obtient la meme valeurestimee pour Y et pour F . Mais la variance d’estimation n’est pas lameme : cet estimateur commun est de variance plus faible, c’est-a-direest cense plus fiable, s’il est considere comme une estimation de Y plutotque de Z.La comparaison entre

les systemes [F] et [Y]est plus compliquee. En revanche, en un point de donnee, Z est connue donc de variance

d’estimation nulle, tandis que l’estimation de Y est entachee d’unevariance irreductible.

1.6. Estimation de la derive(Remarque : par souci de simplification, on a suppose que la derivede Y etait constante, mais rien ne changerait fondamentalement si elleadmettait le developpement habituel du KU).

Apres (co)krigeage de Y , on souhaite maintenant estimer sa Derive. Lecalcul est tres simple, mais il est encore plus rapide de remarquer queles hypotheses impliquent

E [Z(x)] = m

de sorte que m peut parfaitement etre consideree comme la Derive de Z.Dans ces conditions, l’estimation optimale dem n’est rien d’autre qu’uneChapitre 6,

paragraphe 3.5.estimation classique (monovariable), et donc le systeme d’estimation est

[M ]

βλβ

M

(

Kαβ +Kεαβ

)

+ µM

= 0

βλβ

M= 1

Page 259: g é o Statistique

[8] – Introduction au filtrage d’erreurs 257

Ce tour de passe-passe n’est pas depourvu d’enseignement. Une desparticularites des hypotheses de depart, c’est que l’on a arbitrairementattribue la Derive a la composante Y : il peut y avoir d’excellentesraisons (naturalistes, experimentales, etc. ) a cela dans une etude reelle,mais rien dans les seules donnees z ne permet de valider cette decision.En quelque sorte, on a rendu possible le travail du modele, qui n’a paseu a ventiler m entre les deux composantes : m est, d’autorite, laDerive de Y comme elle est, de facto, la Derive de Z.

2. Filtrage d’une erreur systematique

2.1. Hypotheses et notations

On reprend les hypotheses du paragraphe precedent, a une tres

Comme on le verra auparagraphe suivant,c’est cette decisionqui a pour effet depermettre d’estimer lesignal alors meme qu’onne dispose d’aucunedonnee le concernant.

importante difference pres : on suppose que ε(x) admet cette fois uneesperance mε inconnue. J J J

Il est interessant ici de roder les notations correspondant au point de Chapitre 9,paragraphe 1.4.

vue theorique :multivariable = monovariable sur l’espace produit R

n ×D.

Ainsi, en gardant la terminologie du paragraphe precedent, le couple On essaie de garder lechoix d’indices adoptedans l’exercice initial,fascicule 5, p206.

signal/signal bruite pourra etre modelise par une FA Z(x, i) definiesur R

n × 0, 1, et verifiant :

• Z(x, 0) = Z0(x) = Y (x) (signal)

• Z(x, 1) = Z1(x) = Z(x) (signal bruite)

Avec ces notations, on dispose donc du systeme de covariances

Cov [Y (x) , Y (y)] = K00

(x, y) = Kx,y

Cov [Z(x) , Z(y)] = K11

(x, y) = Kx,y + Kεx,y

Cov [Z(x) , Y (y)] = K10

(x, y) = Kx,y

et bien sur, dans le cas present, K10

(x, y) = K01

(x, y).

Au niveau de la Derive, on a la modelisation globale

E [Z(x, i)] =∑

l

alf l(x, i)

qui, suivant un exemple vu dans le chapitre 9, se detaille ainsi : Chapitre 9,paragraphe 4.2.1.

f0(x, 0) = 1 f0(x, 1) = 0

f1(x, 0) = 0 f1(x, 1) = 1[5]

ce qui precise que le nombre k de Fonctions de Base vaut 2 et que

a0 = m

a1

= m + mε

Cette presentation peut-etre un peu inhabituelle est en fait, ainsi quecela a ete vu au chapitre 9, le systeme de notation le plus commode

Page 260: g é o Statistique

258 Aide-Memoire de geostatistique lineaire :

pour les developpements theoriques. On verifie sans probleme que celadecrit bien la situation :

E [Y ] = E [Z(x, 0)] =

1∑

l=0

alf l(x, 0) = m

E [Z] = E [Z(x, 1)] =

1∑

l=0

alf l(x, 1) = m + mε

2.2. Regularite du systeme de cokrigeage

Le probleme est maintenant de cokriger Z(x) et Y (x), avec l’arriere-pensee que si Y a effectivement le sens d’un signal, il risque d’arriverque cette composante ne soit pas informee (donc que S0 = ∅).

Une premiere remarque, de nature intuitive, concerne les hypotheses dece paragraphe. On note que, contrairement au paragraphe 1, les deuxcomposantes Y et ε y jouent des roles parfaitement symetriques1 .On sait qu’il n’est pas possible en general, dans un phenomene global,de separer des composantes qui ont approximativement les memesproprietes. Dans le cas present, si l’on ne dispose de donnees que surZ (c’est-a-dire la somme Y + ε), on imagine mal comment on pourraitdiscerner dans la Derive globale ce qui revient au signal et ce quirevient au bruit.

Cette intuition peut etre confortee immediatement. D’une maniere unpeu abstraite d’abord, on peut invoquer la condition d’IndependanceLineaire des Fonctions de Base. On sait que si l’on peut trouver un jeude coefficients non tous nuls tels que

1∑

l=0

cl fl(x, i) = 0 (∀(x, i) ∈ R

n × 0, 1) [6]

alors, le systeme est singulier, donc le Cokrigeage impossible. Or il estclair que si S

0= ∅, c’est-a-dire concretement si l’on ne dispose d’aucune

information sur la composante Y , alors tout jeu de coefficients de laforme

c0 = c ; c1 = 0

satisfait aux conditions [6]. Le Cokrigeage est donc impossible si on nedispose d’aucune donnee sur Y .

De facon un peu plus classique, on peut tout simplement essayer deconstruire les equations de l’estimation de Y (x) a l’aide de donnees Zα

seulement :

Y ∗(x) =∑

α

λα Zα

En posant les conditions d’Universalite, on trouve que — m et mε etanttous deux inconnus — on doit avoir l’esperance de l’erreur d’estimation

m(

α

λα − 1)

+ mε

(

α

λα)

egale a 0. Ce qui implique dans le meme temps∑

α λα = 1 et

α λα = 0 : cette estimation est donc impossible.

1Cette symetrie n’existait pas dans le cas d’une erreur non systematique, dans la

mesure ou la derive du signal etait inconnue, mais la derive du bruit etait nulle.

Ici, toutes deux sont egalement inconnues.

Page 261: g é o Statistique

[8] – Introduction au filtrage d’erreurs 259

Ce qui est instructif au-dela de ce calcul trivial, c’est que l’on montreainsi qu’il est impossible, sur la seule base de donnees bruitees, deseparer dans la derive globale ce qui est du a l’erreur systematique, etce qui provient de la vraie derive du signal. Ce resultat, etabli surdes derives constantes dans l’espace, subsisterait naturellement avec desmodeles de type Cokrigeage Universel.

Il est de meme evident, compte-tenu du role parfaitement symetriquejoue par les deux composantes, qu’il serait tout aussi impossibled’estimer le bruit en ne disposant de donnees que sur le signalbruite.

2.3. Estimations optimalesLe systeme de Cokrigeage etant suppose regulier, l’estimation descoefficients optimaux de la Derive aussi bien que le Cokrigeage dusignal deviennent des problemes classiques, qui ne reservent plus Ces resultats peuvent

s’etablir presqueimmediatement,a titre d’exercice.

de surprises. Tout au plus peut-on detailler les sytemes correspondantsavec les notations du present paragraphe.

Ainsi, la coestimation optimale des coefficients de la Derive s’ecrit —pour l = 0 ou l = 1,

A∗l

=

S0

λ0

l(dy) Z(y, 0) +

S1

λ1

l(dy) Z(y, 1)

ou λj

l(dy) est solution du systeme

S0

λ0

l(dy) K(x, y) +

S1

λ1

l(dy) K(x, y) + µ

l0= 0 (∀x ∈ S

0)

S0

λ0

l(dy) K(x, y) +

S1

λ1

l(dy)

(

K(x, y) +Kε(x, y))

+ µl1

= 0 (∀x ∈ S1)

Sj

λj

l(dy) = δj

l (∀j ∈ 0, 1)

Quant aux ponderateurs du cokrigeage de Y (x0), definis par

Y ∗(x0) = Z∗(x

0, 0) =

S0

λ0

(dy)Z(y, 0) +

S1

λ1

(dy)Z(y, 1)

ils sont solutions de

S0

λ0

(dy) K(x, y) +

S1

λ1

(dy) K(x, y) + µ0

= K(x, x0) (∀x ∈ S

0)

S0

λ0

(dy) K(x, y) +

S1

λ1

(dy)(

K(x, y) +Kε(x, y))

+ µ1

= K(x, x0) (∀x ∈ S

1)

Sj

λj

(dy) = δj0 (∀j ∈ 0, 1)

Page 262: g é o Statistique

260 Aide-Memoire de geostatistique lineaire :

Page 263: g é o Statistique

Troisieme partie

Bibliographie,

Notations, Index,

Table

Page 264: g é o Statistique

262 Aide-Memoire de geostatistique lineaire :

Page 265: g é o Statistique

Bibliographie

Bartlett, M. S. (1961) An introduction to stochastic processes.CUP, Cambridge.

Bochner, S. (1932) Vorlesungen uber Fourierische Integrale. Akad.Verlagsges., Leipzig.

Bochner, S. (1942) Stochastic processes. Ann. Math. 48.

Chauvet, P. et A. Galli (1982) Universal Kriging. Cours C-96, Centrede Geostatistique, Ecole des Mines de Paris.

Chauvet, P. (1987a) Reflexions sur les ponderateurs negatifs dukrigeage. Sciences de la Terre, Ser. Inf., (1988) 28.

Chauvet, P. (1987b) Elements d’analyse structurale des FAI-k a 1dimension. These de Docteur-Ingenieur en Sciences et TechniquesMinieres, Ecole des Mines de Paris.

Chauvet, P. (1992) Traitement des donnees a support spatial : laGeostatistique et ses usages. Rapport technique N-28/92/G, Centrede Geostatistique, Ecole des Mines de Paris.

Clark, I. (1979) Practical geostatistics. Elsevier Applied Sciences,London.

Cramer, H. (1937) Random variables and probability distributions.CUP, Cambrige.

David, M. (1977) Geostatistical ore reserve estimation. Elsevier–North Holland, Amsterdam.

De Wijs, H.J. (1951) Statistics of ore distribution. Part I : Frequencydistribution of assay values. Geologie en Mijnbouw, Vol. 13, n11,Nov. 1951, pp.365–375.

De Wijs, H.J. (1951) Statistics of ore distribution. Part II : Theory ofbinomial distribution applied to sampling and engineering problems.Geologie en Mijnbouw, Vol. 15, n1, 1953, pp.12–24.

Dong, A. (1990) Estimation geostatistique des phenomenes regispar des equations aux derivees partielles. These de Docteur enGeostatistique, Ecole des Mines de Paris.

Doob, J. L. (1953) Stochastic processes. Wiley & sons, New-York.

Fortet, R. et A. Blanc-Lapierre (1953) Theorie des fonctionsaleatoires. Masson, Paris.

Formery, Ph. (1964) Cours de geostatistique. Ecole des Mines deParis.

Gandin, S. (1965) Analyse objective. Organisation MeteorologiqueMondiale, Moscou.

Gnedenko, B. V. (1962) Theorie des probabilites. Dunod, Paris.

Grzebyk, M. (1993) Ajustement d’une coregionalisation stationnaire.These de Docteur en Geostatistique, Ecole des Mines de Paris.

Journel, A (1974) Simulation conditionnelle de gisements miniers.Theorie et pratique. These, Universite de Nancy.

Page 266: g é o Statistique

264 Aide-Memoire de geostatistique lineaire :

Journel, A. (1977) Kriging in terms of projections. Journal of IAMG,Vol.9 n6, Dec. 1977, pp563-586.

Journel, A. (1978) Mining geostatistics. Academic Press, Londres.

Krige, D.G. (1951) A statistical approach to some mine valuation andallied problems on the Witwatersrand. Master’s Thesis, University ofWitwatersrand.

Lajaunie, Ch. et R. Bejaoui (1991) Sur le krigeage des fonctionscomplexes. Rapport technique N-23/91/G, Centre de Geostatistique,Ecole des Mines de Paris.

Langlais, V. (1990) Estimation sous contraintes d’inegalites. Thesede Docteur en Geostatistique, Ecole des Mines de Paris.

Lantuejoul, Ch. (1990) Ergodicite et portee integrale. Rapporttechnique N-17/90/G, Centre de Geostatistique, Ecole des Mines deParis.

Levy, P. (1937) Theorie de l’addition des Variables Aleatoires.Gauthier–Villars, Paris.

Levy, P. (1948) Processus stochastiques et mouvement Brownien.Gauthier–Villars, Paris.

Matern, B. (1986) Spatial Variations. Springer, Berlin (Lecture notesin statistics 36).

Journel, A. (1977) Application des methodes statistiques al’estimation des gisements. Annales des Mines, Vol.XII, pp50-75.

Matheron, G. (1956) Theorie lognormale de l’echantillonnagesystematique des gisements. Note geostatistique n14, Centre deGeostatistique, Ecole des Mines de Paris.

Matheron, G. (1957) Theorie lognormale de l’echantillonnagesystematique des gisements. Annales des Mines, Vol.IX, pp566-584.

Matheron, G. (1962a) Traite de geostatistique appliquee (tome I).Technip, Paris.

Matheron, G. (1962b) Traite de geostatistique appliquee (tome III).B.R.G.M..

Matheron, G. (1963a) Traite de geostatistique appliquee (tome II).Technip, Paris.

Matheron, G. (1963b) Principle of geostatistics. Economic Geology,Vol 58, pp1246-1266.

Matheron, G. (1965) Les variables regionalisees et leur estimation.Masson, Paris.

Matheron, G. (1968) Osnovy Prikladnoi Geostatistiki.Mir, Moscou.

Matheron, G. (1969a) Theorie des ensembles aleatoires. Les Cahiersdu Centre de Morphologie Mathematique, n4, Ecole des Mines deParis.

Matheron, G. (1969b) Cours de Geostatistique. Les Cahiers du Centrede Morphologie Mathematique, n2, Ecole des Mines de Paris.

Matheron, G. (1969c) Presentation des variables regionalisees. Revuede l’Industrie Minerale, Aout 1969, pp663-675.

Matheron, G. (1969d) Le Krigeage universel. Les Cahiers du Centrede Morphologie Mathematique, n1, Ecole des Mines de Paris.

Matheron, G. et Ch. Huijbregts (1970) Universal Kriging. Rapporttechnique N-180, Centre de Geostatistique, Ecole des Mines de Paris.

Page 267: g é o Statistique

Bibliographie 265

Matheron, G. (1971a) La theorie des ensembles aleatoires et sesapplications en stereologie. Rapport technique N-235, Centre deGeostatistique, Ecole des Mines de Paris.

Matheron, G. (1971b) La theorie des fonctions aleatoires intrinsequesgeneralisees. Note geostatistique n117, Centre de Geostatistique,Ecole des Mines de Paris.

Matheron, G. (1971c) La theorie des variables regionalisees et sesapplications. Les Cahiers du Centre de Morphologie Mathematique,n5, Ecole des Mines de Paris.

Matheron, G. (1973) Le krigeage disjonctif . Rapport technique N-360, Centre de Geostatistique, Ecole des Mines de Paris.

Matheron, G. (1975a) Random sets and integral geometry. Wiley &Sons, New-York.

Matheron, G. (1975b) Hasard, echelle et structure. Annales des Mines,Novembre 1975, pp7-10, Paris.

Matheron, G. (1976) Les concepts de base de la geostatistiqueminiere. in Advanced Geostatistics in the Mining Industry

(M.Guarascio ed.), pp3-10, Reidel, Dordrecht.

Matheron, G. (1978) Estimer et choisir. Les Cahiers du Centre deMorphologie Mathematique, n7, Ecole des Mines de Paris.

Matheron, G. (1979) Comment translater les catastrophes ou lastructure des F.A.I. generales. Rapport technique N-617, Centre deGeostatistique, Ecole des Mines de Paris.

Matheron, G. (1980) Splines et krigeage : leur equivalence formelle.Rapport technique N-667, Centre de Geostatistique, Ecole des Minesde Paris.

Matheron, G. (1981) Remarques sur le krigeage et son dual. Rapporttechnique N-695, Centre de Geostatistique, Ecole des Mines de Paris.

Matheron, G. (1982) Pour une analyse krigeante des donneesregionalisees. Rapport technique N-732, Centre de Geostatistique,Ecole des Mines de Paris.

Matheron, G. (1989) Estimating and choosing. Springer, Berlin.

Matheron, G. et W. Kleingeld (1987) The evolution of geostatistics.in Proc. 20eme APCOM, Johannesburg, Vol.3, pp9-12.

Rendu, J.M. (1978) An introduction to geostatistical methods ofmineral evaluation. South African Institute of Mining and MetallurgyMonograph Series, Johannesburg.

Riesz, F. (1945) Sur la theorie ergodique. Comm. Math. Helvetici 17,pp221-239.

Seguret, S. (1991) Geostatistique des phenomenes a tendanceperiodique. These de Docteur en Geostatistique, Ecole des Mines deParis.

Rivoirard, J. (1984) Le comportement des poids de krigeage. Thesede Docteur-Ingenieur en Sciences et Techniques Minieres, Ecole desMines de Paris.

Sandjivy, L. (1987) Analyse krigeante des donnees de prospectiongeochimique. These de Docteur-Ingenieur en Sciences et TechniquesMinieres, Ecole des Mines de Paris.

Sibson, R. (1981) A brief description of natural neighbourinterpolation. in Interpreting Multivariate Data(V.Barnett ed.),Wiley & Sons, New-York.

Page 268: g é o Statistique

266 Aide-Memoire de geostatistique lineaire :

Sichel, H. S. (1949) Mine valuation and maximum likelihood.Master’s Thesis, University of Witwatersrand.

Sichel, H. S. (1952) New methods in the statistical evaluation ofmine sampling data. Transactions of the Institution of Mining andmetallurgy, Londres.

Wackernagel, H. (1985) L’inference d’un modele lineaire engeostatistique multivariable. These de Docteur-Ingenieur en Scienceset Techniques Minieres, Ecole des Mines de Paris.

Wackernagel, H. (1992) Cours de geostatistique multivariable. CoursC-146, Centre de Geostatistique, Ecole des Mines de Paris.

Wiener, N. (1949) Extrapolation, interpolation, and smoothing ofstationary time series with engineering applications. MIT Press,Cambridge, Mass..

Wold, H. (1938) A study in the analysis of stationary time series.Almqvst and Wiksell, Uppsala.

Page 269: g é o Statistique

Notations

Presentation

Cette liste rappelle les notations les plus frequemment utiliseesdans ce document, notations qui sont aussi dans la mesure dupossible celles que l’on rencontre dans la bibliographie citee enreference.

Toutefois, meme si l’on a cherche au maximum dans le textea garder des ecritures coherentes et depourvues d’ambiguıte, ilconvient de ne pas etre esclave des notations. Cette liste ne sauraitetre ni exhaustive, ni depourvue d’exceptions : il ne s’agit qued’une indication d’ensemble, qui ne peut dispenser, en cas dedoute, de se reporter aux definitions.

1. Rappel preliminaireRappelons une convention dans ce document : les mots ou expressions quiy font l’objet d’une definition figurent par la suite avec des majuscules, Il est possible que

cette convention soitpercue parfois commeagacante. Toute suggestionpour une alternativesera bienvenue. . .

et sont par ailleurs repertories dans l’index. Le lecteur sait ainsi que toutmot qui apparaıt avec des majuscules anormales figure dans l’Index,et qu’il est donc possible d’en retrouver aisement la Definition.

2. Conventions generales

2.1. AbreviationsVoici quelques abreviations, courantes dans ce document ainsi que dansl’ensemble de la litterature geostatistique francophone.

CG Covariance Generalisee.

CLA Combinaison Lineaire Autorisee.

FA Fonction Aleatoire.

FAI Fonction Aleatoire Intrinseque.

FAI-k Fonction Aleatoire Intrinseque d’ordre k.

FASt Fonction Aleatoire Stationnaire.

FASt-2 Fonction Aleatoire Stationnaire d’ordre 2.

KD Krigeage Disjonctif.

KI Krigeage Intrinseque.

KO Krigeage Ordinaire.

KS Krigeage Simple.

KU Krigeage Universel.

MLC Modele Lineaire de Coregionalisation.

VA Variable Aleatoire.

VR Variable Regionalisee.

La plupart de ces abreviations sont classiques. Il faut pourtant noterque dans certaines publications, l’abreviation KI est utilisee pour

Page 270: g é o Statistique

268 Aide-Memoire de geostatistique lineaire :

designer le Krigeage d’Indicatrice. Mais dans cet Aide–Memoire, il nepourra jamais y avoir d’ambiguıte : KI y signifie toujours KrigeageIntrinseque, au sens des FAI-k.

2.2. Convention de sommationOn a parfois explicite les sommations simples ou multiples figurant dansles formules. Toutefois, afin de ne pas alourdir les ecritures, on a souventutilise la convention usuelle consistant a ne pas faire figurer les signes desommations portant sur un indice figurant une fois en haut et une foisen bas.

Ainsi,

λαUZα signifie

α λαUZα

alflx signifie

l alflx

λαKα βλβ signifie

α,β λαKαβλ

β

et l’expression plus complexe

(zα − alflα) Qαβ (zβ − asf

sβ)

signifie

α,β

(

(

zα −∑

l

alflα

)

Qαβ(

zβ −∑

s

asfsβ

)

)

)

2.3. Identification des KrigeagesLes differents systemes de Krigeage rencontres dans le texte sontreferences par une lettre : [O], [I ], etc. qui est reprise en indice pourcaracteriser la solution correspondante : λα

O, σ2

I, etc. Les indices utilises

dans ce document sont :

[A] Krigeage Aleatoire.

[B] Krigeage Dual.

[D] Estimation de la Derive.

[I ] Krigeage Intrinseque.

[M ] Estimation de la moyenne (cas d’une Derive constantedans l’espace).

[O] Krigeage Ordinaire.

[R] Estimation du Residu.

[S] Krigeage Simple.

[U ] Krigeage Universel.

[∆] Estimation du terme correctif de Derive.

2.4. Majuscules, minusculesAu niveau de la modelisation du Phenomene Regionalise, les lettresminuscules sont reservees au Modele Primaire (Variable Regionalisee),et les lettres majuscules au modele probabiliste (Fonction Aleatoire). Lepassage d’une majuscule a une minuscule correspond a une operationde Realisation ; le passage d’une minuscule a une majuscule correspond

Page 271: g é o Statistique

Notations 269

a une Randomisation — une Immersion Probabiliste, selon laterminologie judicieusement suggeree par F. Maisonneuve.

Ainsi en particulier, avec les notations habituelles,

z designe la Variable Regionalisee z(x). C’est unefonction deterministe de l’espace geographique.

Z designe la Fonction Aleatoire Z(x, ω), fonctiondefinie a la fois sur l’espace geographique et surun espace probabilise (Ω,A, P ) qui n’a en generalpas besoin d’etre precise.

C’est aussi pour respecter cette convention de notation que l’on ecritavec une majuscule M∗ l’estimateur (probabiliste dans le modele) de Chapitre 6,

paragraphe 3.5.l’esperance m , quantite qui quant a elle est deterministe — donc noteeavec une minuscule.

3. Symboles alpha–numeriquesal Coefficients de la Derive dans les modeles non

stationnaires :

m(x) = alflx

bα Coefficient de Kαx dans la formulation duale duKrigeage.

cl Coefficient de la fonction de base f lx dans la

formulation duale du Krigeage :

z∗(x) =∑

α

bαKαx +∑

l

cl flx

C Fonction de covariance. Se reporter a K, qui est plussouvent utilisee dans ce texte.

Cov [•] Covariance. Dans ce document, il n’est question quede covariances centrees :

Cov [X,Y ] = E[

(

X−E [X ])(

Y−E [Y ])

]

E [•] Esperance mathematique :

E [X ] =

uPX

(du)

dx, dy Element differentiel dans l’espace de travail (espacegeographique) ; — voir remarque a x, y.

f l Fonctions de Base de la Derive dans les modelesnon stationnaires. Dans la tres grande majoritedes cas, ces fonctions sont des monomes. De plus,le formalisme du Krigeage Universel a modelesous-jacent intrinseque requiert que la premiere deces fonctions (indicee traditionnellement 0) soit laconstante dans l’espace :

f0x = 1

Page 272: g é o Statistique

270 Aide-Memoire de geostatistique lineaire :

h Vecteur de l’espace geographique.

k Ordre d’une FAI-k. C’est le degre des polynomes quisont filtres par les Combinaisons Lineaires Autoriseesd’ordre k.

k designe parfois aussi le nombre de fonctions debase de la Derive. Bien que ces deux utilisationssoient fondamentalement contradictoires, les risquesde confusion sont en general peu importants.

K Fonction de Covariance Generalisee. Dans le presenttexte, on designe egalement parfois par K la fonctionde covariance en modele FASt-2.

SiK est une covariance (ou une CG) stationnaire, elleest fonction du seul vecteur h, ce qui se note K(h).Dans le cas le plus general, elle est fonction de deuxpoints, et on utilise l’ecriture simplifiee Kxy plutotque K(x, y).

Remarque : en Geostatistique Transitive, et dansChapitre 2.

ce chapitre seulement, K designe le CovariogrammeGeometrique. Le contexte ne laisse pas de place a unequelconque confusion.

l, s, t Indices usuels des fonctions de base de la Derive.

m,m(x) Fonction de Derive. Constante dans l’espace dansle modele du Krigeage Ordinaire, m(x) admet ledeveloppement

m(x) = alflx

dans le modele du Krigeage Universel.

S, v, V,W Domaines de regularisation.

Var [•] Variance :

Var [X ] = E[

X2]

−(

E [X ])2

x, y Coordonnees — en general, de points a estimer.On adopte ici une notation simplifiee, adaptee aucas mono–dimensionnel. En realite, x represente unjeu (x1, · · · , xN ) de N coordonnees, si N est ladimension de l’espace geographique. On adoptela meme simplification pour la representation del’element differentiel dx.

Y (x) Residu, dans le modele du Krigeage Universel.

z(x), Z(x) Representation du Phenomene Regionalise : z(x)pour la Variable Regionalisee(deterministe), et Z(x)pour la Fonction Aleatoire associee. Dans une etudereelles, les donnees disponibles sont representees parles valeurs zα prises par la fonction z(x) aux pointsde donnees xα.

Z(λ) FAI-k. Alors que la notation Z(x) represente uneFonction Aleatoire definie sur l’espace de travail

(l’espace geographique), Z designe une FA definiesur un espace abstrait de mesures.

α, β, ε Les indices grecs sont usuellement reserves pourdesigner les points de donnees, en particulier dansl’ecriture des sytemes de Krigeage. Ainsi, Zα designe

Page 273: g é o Statistique

Notations 271

la valeur Z(xα) de la FA Z au point xα ; Kαβ est lacovariance entre Z(xα) et Z(xβ) :

Kαβ = Cov [Z(xα), Z(xβ)] = Cov [Zα, Zβ]

δαβ Symbole de Kronecker :

δαβ = 1 si α = β

= 0 si α 6= β

δa(dx) Mesure de Dirac au point a : pour toute fonctionϕ(x),

ϕ(x)δa(dx) = ϕ(a)

γ Variogramme. Un variogramme stationnaire, est noteγ(h) ; dans le cas le plus general, on ecrit γxy plutotque γ(x, y).

λα Ponderateur de la donnee α dans l’estimation parKrigeage. On ne precise que rarement que ceponderateur est bien sur une fonction de la quantitea estimer. Il serait plus complet, par exemple pourl’estimation d’un point x, d’ecrire λα(x) :

z∗(x) =∑

α

λα(x) zα

Le ponderateur peut etre parfois complete par unindice qui rappelle le type de Krigeage dont il estsolution: λα

Opour un Krigeage Ordinaire, λα

U

pour un Krigeage Universel, λαI

pour un KrigeageIntrinseque, etc.

En notation continue, λ devient une mesure λ(dt).On a alors

z∗(x) =

z(t)λ(dt)

λmPoids de la moyenne. C’est le complement a 1 dela somme des poids de Krigeage Simple :

λm = 1 −∑

α

λαS

λαl Ponderateur de la donnee α dans l’estimation du

coefficient al de la Derive.

Λk Ensemble des Combinaisons Lineaires Autoriseesd’ordre k. C’est l’espace vectoriel des mesures λ(dx)verifiant

f l(x)λ(dx) = 0

pour tout monome f l(x) de degre ≤ k

Page 274: g é o Statistique

272 Aide-Memoire de geostatistique lineaire :

σ2 Designe en general une variance. Dans certainscas, σxy est utilise pour designer une fonction decovariance au meme titre que Cxy ou Kxy.

σ2(V |W ) Variance de Dispersion du domaine V dans ledomaine W .

σE(A,B) Variance d’Extension du domaine A au domaine B— ou du domaine B au domaine A. . .

4. Symboles divers

S

(x) Fonction indicatrice de l’ensemble S : c’est la fonction(de x) qui vaut 1 si x ∈ S, et 0 si x 6∈ S.

S

(x) = 1 si x ∈ S

= 0 si x 6∈ S

∗ Place en exposant, un asterisque designe de facongenerale une operation d’Estimation. Ainsi, Z∗(x)signifie estimateur de Z(x). Sauf mentioncontraire, il s’agit de l’estimation par Krigeage.

ˆ Comme ∗, mais designe un estimateur quelconque(moindres carres, par exemple).

| Utilise avec des Variables Aleatoires, representele conditionnement. Ainsi, E [X | Y = y] signifieE [X ] conditionnellement a Y = y.

˜ Un place sur le symbole d’une FA (Z(x) par

exemple) designe la FAI-k Z dont Z(x) est uneRepresentation particuliere.

[V ] Mesure du domaine V : longeur dans R1, aire dans

R2, etc. :

[V ] =

V

dx

¯ La barre placee sur une fonction signifie la valeurmoyenne de cette fonction sur le domaine precise.Ainsi,

Z(V ) =1

[V ]

V

Z(x) dx

Lorsque la fonction concernee a deux arguments, ils’agit de la moyenne sur les deux domaines. Ainsi parexemple,

γ(V,W ) =1

[V ] [W ]

V

W

γ(x−y) dx dy

Page 275: g é o Statistique

Index

Additives (variables regionalisees) . . . . . . . . . . . . . . . . . . . . . . . . . . . 40Analyse krigeante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142, 174Analyse structurale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20, 23Analyse variographique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20, 23Autokrigeable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173Caracteristique intrinseque . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127Champ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12Changement de support . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68Changements de support . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41Cokrigeage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143Cokrigeage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152Combinaison Lineaire Autorisee . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42Combinaisons Lineaires Autorisees d’ordre k (CLA-k) . . . . . . . . . 125Compatible avec les derives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136Composantes structurales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175Conditions d’optimalite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99Configuration de krigeage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79Contrainte d’universalite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80Coregionalisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143Correction de derive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115Correlation intrinseque . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171Covariance croisee . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147Covariance de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48Covariance exponentielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192Covariance triangulaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192Covariogramme experimental . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33Covariogramme geometrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30Covariogramme modelise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35Covariogramme transitif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29Decalage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267Dephasage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148Derive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62, 95Derive aleatoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110Derive de FAI-k . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129Derive externe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181Demi-variogramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62Descente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32De type positif conditionnel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130De type positif conditionnel strict . . . . . . . . . . . . . . . . . . . . . . . . . . 131Dispersion statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48Echelle de travail . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21Effet de bord . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75Effet de pepite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31Ergodicite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20Erreur d’estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32, 44Erreurs partielles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73Esperance conditionnelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189Espace probabilise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16Estimateur des moindres carres . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117Estimateur sans biais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

Page 276: g é o Statistique

274 Aide-Memoire de geostatistique lineaire :

Estimation globale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72Estimation locale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72Exponentielles-polynomes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125Expression duale (du krigeage) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135Facteurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177FAI-k . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94FAI-k sans derive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129Filtrage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253Fonction Aleatoire Intrinseque . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61Fonction Aleatoire Intrinseque d’ordre k (FAI-k) . . . . . . . . . . . . . 126Fonction de forme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180Fonction indicatrice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30Fonctions auxiliaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76Fonctions de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97, 125Formulation duale du Krigeage Universel . . . . . . . . . . . . . . . . . . . . 215Formule de Krige . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49Geostatistique intrinseque . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15, 94Geostatistique transitive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14Grandeur regionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23Heterotopie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145Hypothese anticipatrice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34Hypothese ergodique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19Independance lineaire des fonctions de base sur les donnees . . . . 103Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267Interpolateur exact . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87Intervalle de confiance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45Isotopie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145Isotrope . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31Krigeage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78Krigeage aleatoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195Krigeage intrinseque . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131Krigeage Ordinaire (KO) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85, 86Krigeage Simple (KS) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84Krigeage Universel (KU) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94Loi spatiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39Maximum de vraisemblance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226Mesure autorisee . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42Modele gigogne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142Modele lineaire de coregionalisation . . . . . . . . . . . . . . . . . . . . . . . . . 176Modele primaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13Modeles elementaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175Modeles globaux non stationnaires . . . . . . . . . . . . . . . . . . . . . . . . . . . 93Modeles topo-probabilistes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9, 15Montee . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32Multiplicateurs de Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85Parametre conventionnel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24, 89Parametre methodologique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36Partie irreguliere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31Partie reguliere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31Phenomene regionalise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11Poids de la moyenne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202Portee . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30Portee integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59Principe d’economie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23Principe de composition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76Principe des grandeurs regionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24Probleme global . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53Probleme local . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54Propriete d’orthogonalite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104Propriete d’orthogonalite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155Regle de substitution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

Page 277: g é o Statistique

Index 275

Realisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16Regularisee . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31Residu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95Randomisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17Reconstruction operatoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18, 23Relation d’additivite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49Representation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126Representation glissante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45, 55Representation transitive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33Sans biais (estimateur) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44Separation des variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154, 164Seuil de realisme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14Situation prealeatoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36Sous-jacente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98Stationnarite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19Stationnarite d’ordre 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18Strictement intrinseque . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63Systeme dual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136Terme de ligne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76Terme de section . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76Terme de tranche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76Terme d’extension . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35Terme fluctuant . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35Terme regulier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35Theoreme d’additivite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114, 116Theoreme de Bochner . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31Theoreme de l’esperance totale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189Theoreme des Representations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127Theoreme de superposition des figures de Krigeage . . . . . . . . . . . . 88Translate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46Transposee . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31Type positif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30Type positif conditionnel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65Variable regionalisee (VR) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12Variance de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48Variance d’estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33, 46Variance d’extension . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44Variogramme croise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149Variogramme des residus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118Variographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20, 23Voisinage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54Voisinage glissant . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54Zitterbewegung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

Page 278: g é o Statistique

276 Aide-Memoire de geostatistique lineaire :

Page 279: g é o Statistique

Sommaire

Avertissement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

Elements de Geostatistique Lineaire

Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1. Bref rappel historique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2. Trois ages de la geostatistique . . . . . . . . . . . . . . . . . . . . . . . 7

3. Un point de vocabulaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

4. Sommaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

Chapitre 1

Variables Regionalisees et Fonctions Aleatoires . . . . . . . . . . . . 11

1. Les deux niveaux de modele . . . . . . . . . . . . . . . . . . . . . . . . 111.1. Point de depart : le phenomene regionalise . . . . . . . . . . . 11

1.2. Premiere etape : la Variable Regionalisee . . . . . . . . . . . . 12

1.3. Les lecons du modele primaire . . . . . . . . . . . . . . . . . . . . . 13

1.4. Les outils du modele primaire . . . . . . . . . . . . . . . . . . . . . . 14

1.5. Le modele topo-probabiliste . . . . . . . . . . . . . . . . . . . . . . . . 15

1.6. Notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2. Geostatistique Intrinseque : problemes et methodes 162.1. LE probleme methodologique . . . . . . . . . . . . . . . . . . . . . . 16

2.2. Element de solution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2.3. Mecanismes de passage . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

3. Deux notions essentielles . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183.1. Stationnarite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

3.2. Ergodicite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

3.3. Recapitulation preliminaire . . . . . . . . . . . . . . . . . . . . . . . . 19

3.4. Parallele entre les deux niveaux de modeles . . . . . . . . . . 20

3.5. Notion d’echelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

3.6. Une illustration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

4. Structure d’une etude en Geostatistique Intrinseque 224.1. Rappel prealable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

4.2. Phase d’analyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

4.3. Phase de synthese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

Page 280: g é o Statistique

278 Aide-Memoire de geostatistique lineaire :

Chapitre 2

Geostatistique Transitive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

1. Le Covariogramme Transitif . . . . . . . . . . . . . . . . . . . . . . . . . 291.1. Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

1.2. Proprietes theoriques immediates . . . . . . . . . . . . . . . . . . . 29

1.3. Positivite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

1.4. Comportement a l’origine . . . . . . . . . . . . . . . . . . . . . . . . . . 31

1.5. Regularisations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

2. Application a un probleme d’estimation . . . . . . . . . . . . . 322.1. Position du probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

2.2. Implantation de la maille . . . . . . . . . . . . . . . . . . . . . . . . . . 32

2.3. Proprietes de l’Erreur d’Estimation . . . . . . . . . . . . . . . . . 33

2.4. Necessite d’une modelisation . . . . . . . . . . . . . . . . . . . . . . . 33

3. Modelisation du Covariogramme Transitif . . . . . . . . . . . 343.1. Contraintes sur le modele . . . . . . . . . . . . . . . . . . . . . . . . . . 34

3.2. Les formules d’approximation . . . . . . . . . . . . . . . . . . . . . . 35

3.3. Une situation prealeatoire . . . . . . . . . . . . . . . . . . . . . . . . . 36

3.4. Remarque sur la stationnarite . . . . . . . . . . . . . . . . . . . . . . 37

3.5. Les trois Covariogrammes . . . . . . . . . . . . . . . . . . . . . . . . . 37

Chapitre 3

Buts et moyens de la Geostatistique Lineaire (1) . . . . . . . . . . 39

1. Limites de la geostatistique lineaire . . . . . . . . . . . . . . . . . 391.1. Cadre de travail . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

1.2. Limites du modele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

1.3. Utilisation du modele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

1.4. Commentaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

2. Mecanismes de calcul des variances . . . . . . . . . . . . . . . . . 422.1. Les Combinaisons Lineaires Autorisees . . . . . . . . . . . . . . 42

2.2. Moments d’une CLA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

2.3. Proprietes de la covariance stationnaire . . . . . . . . . . . . . 43

3. Variance d’extension . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443.1. Notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

3.2. Formule de la Variance d’Extension . . . . . . . . . . . . . . . . . 44

3.3. Analyse de la formule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

3.4. Cas particulier d’un reseau de prelevements fini . . . . . . 46

4. Variance de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 464.1. Dispersion statistique de v dans V . . . . . . . . . . . . . . . . . 47

4.2. Passage a la version probabiliste . . . . . . . . . . . . . . . . . . . . 48

4.3. Variance de dispersion de v dans V . . . . . . . . . . . . . . . . . 48

4.4. Resultats complementaires . . . . . . . . . . . . . . . . . . . . . . . . . 49

4.5. Formule de Krige . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

Chapitre 4

Stationnarite et ergodicite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

1. Les deux niveaux de modele . . . . . . . . . . . . . . . . . . . . . . . . 531.1. Signification et necessite de l’hypothese stationnaire . . 53

1.2. Les problemes globaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

1.3. Les problemes locaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

Page 281: g é o Statistique

Sommaire 279

1.3.1. Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 541.3.2. Un exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 551.3.3. Remarques finales . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

2. Vers un affaiblissement de l’hypothese stationnaire . 562.1. Modele sans variance a priori . . . . . . . . . . . . . . . . . . . . . . 56

2.2. Combinaisons lineaires autorisees . . . . . . . . . . . . . . . . . . . 57

3. L’ergodicite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 583.1. Permanence d’une hypothese de stationnarite . . . . . . . . 58

3.2. Estimation de l’esperance . . . . . . . . . . . . . . . . . . . . . . . . . . 58

3.3. La portee integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

3.4. Reconstruction operatoire . . . . . . . . . . . . . . . . . . . . . . . . . 59

Chapitre 5

Buts et moyens de la Geostatistique Lineaire (2) . . . . . . . . . . 61

1. Mecanismes de calcul en hypothese intrinseque . . . . . 611.1. Le modele intrinseque . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

1.2. Combinaisons lineaires autorisees . . . . . . . . . . . . . . . . . . . 62

1.3. Mecanismes de calcul . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

1.4. Proprietes du variogramme stationnaire . . . . . . . . . . . . . 65

2. Formules des variances . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 652.1. Variance d’Extension . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

2.2. Variance de Dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

2.3. Autre presentation du variogramme . . . . . . . . . . . . . . . . . 66

3. Regularisations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 673.1. Resultats generaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

3.2. Formule de changement de support . . . . . . . . . . . . . . . . . 68

Chapitre 6

Estimations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

1. Alternative global/local en estimation . . . . . . . . . . . . . . 711.1. Qu’appelons-nous estimation ? . . . . . . . . . . . . . . . . . . . . . 71

1.2. Estimation globale, estimation locale . . . . . . . . . . . . . . . . 72

2. L’estimation globale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 722.1. Echantillonnage aleatoire pur . . . . . . . . . . . . . . . . . . . . . . 73

2.2. Echantillonnage aleatoire stratifie . . . . . . . . . . . . . . . . . . . 75

2.3. Remarque sur la geometrie . . . . . . . . . . . . . . . . . . . . . . . . 75

2.4. Maille reguliere a implantation preferentielle . . . . . . . . . 76

2.5. Maille reguliere a implantation flottante . . . . . . . . . . . . . 76

2.6. Une remarque instructive . . . . . . . . . . . . . . . . . . . . . . . . . . 77

3. L’estimation locale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 773.1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

3.2. Les etapes du krigeage . . . . . . . . . . . . . . . . . . . . . . . . . . . . 783.2.1. L’erreur d’estimation . . . . . . . . . . . . . . . . . . . . . . . . . 783.2.2. Etape 1 : contrainte de linearite . . . . . . . . . . . . . . . . 793.2.3. Etape 2 : contrainte d’autorisation . . . . . . . . . . . . . . 793.2.4. Etape 3 : contrainte d’universalite . . . . . . . . . . . . . . 803.2.5. Sens de la contrainte d’universalite . . . . . . . . . . . . . . 803.2.6. Etape 4 : contrainte d’optimalite . . . . . . . . . . . . . . . 813.2.7. L. A. U. O. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

Page 282: g é o Statistique

280 Aide-Memoire de geostatistique lineaire :

3.3. Quelques exemples de krigeage ponctuel . . . . . . . . . . . . . 833.3.1. Krigeage stationnaire a moyenne connue . . . . . . . . . 833.3.2. Krigeage stationnaire a moyenne inconnue . . . . . . . . 843.3.3. Krigeage Intrinseque . . . . . . . . . . . . . . . . . . . . . . . . . 863.3.4. Quelques commentaires . . . . . . . . . . . . . . . . . . . . . . . 86

3.4. Proprietes du systeme de Krigeage . . . . . . . . . . . . . . . . . . 873.4.1. Le Krigeage, interpolateur exact . . . . . . . . . . . . . . . . 873.4.2. Superposition des figures de Krigeage . . . . . . . . . . . . 873.4.3. Relation d’orthogonalite et de lissage . . . . . . . . . . . . 88

3.5. Evaluation optimale de l’esperance mathematique . . . . 89

Chapitre 7

Vers les modeles non stationnaires . . . . . . . . . . . . . . . . . . . . . . . . . . 93

1. Introduction a la non-stationnarite . . . . . . . . . . . . . . . . . . 931.1. Rappel sur le role d’une hypothese stationnaire . . . . . . 93

1.2. Idee directrice de la Geostatistique Non Stationnaire . . 94

1.3. Comment tester la non-stationnarite ? . . . . . . . . . . . . . . . 94

2. Le Krigeage Universel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 952.1. La dichotomie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

2.1.1. Les donnees disponibles . . . . . . . . . . . . . . . . . . . . . . 952.1.2. Contrainte au niveau de la Variable Regionalisee . . . 962.1.3. Contrainte au niveau de la Fonction Aleatoire . . . . . 962.1.4. Structure de la Derive . . . . . . . . . . . . . . . . . . . . . . . . 962.1.5. Hypotheses communes aux differents modeles de KU 97

2.2. KU a modele sous-jacent stationnaire d’ordre 2 . . . . . . 982.2.1. Signification du modele . . . . . . . . . . . . . . . . . . . . . . . 982.2.2. Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 982.2.3. Presentation matricielle . . . . . . . . . . . . . . . . . . . . . . . 99

2.3. KU a modele sous-jacent intrinseque strict . . . . . . . . . . 1002.3.1. Particularite de ce modele . . . . . . . . . . . . . . . . . . . . 1002.3.2. Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1002.3.3. Presentation matricielle . . . . . . . . . . . . . . . . . . . . . . 1012.3.4. Plaidoyer pour une demarche rigoureuse . . . . . . . . . 102

2.4. Proprietes du Krigeage Universel . . . . . . . . . . . . . . . . . . 1022.4.1. Proprietes generales . . . . . . . . . . . . . . . . . . . . . . . . . 1022.4.2. Independance lineaire des fonctions de base . . . . . . 1022.4.3. Une invariance des ponderateurs du KU . . . . . . . . . 1032.4.4. Proprietes d’orthogonalite . . . . . . . . . . . . . . . . . . . . 104

3. Le statut de la Derive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1053.1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

3.2. Evaluation optimale de la Derive : idee directrice . . . . 105

3.3. Modele sous-jacent stationnaire . . . . . . . . . . . . . . . . . . . 106

3.4. Retour sur l’independance lineaire desfonctions de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

3.5. Modele sous-jacent intrinseque strict . . . . . . . . . . . . . . . 107

3.6. Vers un travail en accroissements . . . . . . . . . . . . . . . . . . 108

4. Les coefficients de la Derive . . . . . . . . . . . . . . . . . . . . . . . 1084.1. Evaluation des coefficients : modele stationnaire . . . . . 109

4.2. Evaluation des coefficients : modele intrinseque . . . . . . 109

4.3. Le probleme du terme constant . . . . . . . . . . . . . . . . . . . . 1104.3.1. Modele de Derive aleatoire . . . . . . . . . . . . . . . . . . . 1104.3.2. Estimation d’une Derive aleatoire . . . . . . . . . . . . . . 1104.3.3. Premiere estimation d’une moyenne mobile . . . . . . 1114.3.4. Seconde estimation d’une moyenne mobile . . . . . . . 1114.3.5. Element de reflexion . . . . . . . . . . . . . . . . . . . . . . . . 1114.3.6. Retour au coefficient a0 . . . . . . . . . . . . . . . . . . . . . 1114.3.7. Dernier regard sur la Derive . . . . . . . . . . . . . . . . . . 112

Page 283: g é o Statistique

Sommaire 281

5. Complement sur les systemes du Krigeage Universel 1125.1. Hypothese et notations . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

5.2. Matrice inverse du Krigeage Universel . . . . . . . . . . . . . . 113

5.3. Consequence : additivite des estimations . . . . . . . . . . . 114

5.4. Correction de Derive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

5.5. Additivite des variances . . . . . . . . . . . . . . . . . . . . . . . . . . 115

5.6. Commentaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116

6. Etapes et problemes de l’Analyse Variographique . . 1166.1. L’estimateur des moindres carres . . . . . . . . . . . . . . . . . . 117

6.2. Le variogramme des residus . . . . . . . . . . . . . . . . . . . . . . . 118

6.3. Problemes de biais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

6.4. Problemes d’indetermination . . . . . . . . . . . . . . . . . . . . . . 119

6.5. Conclusion provisoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

Chapitre 8

Geostatistique Intrinseque . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

1. Introduction aux FAI-k . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1231.1. Idee directrice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

1.2. Vers des Combinaisons Lineaires Autorisees . . . . . . . . . 123

1.3. Definition des CLAk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

1.4. FAI-k et representation . . . . . . . . . . . . . . . . . . . . . . . . . . . 1251.4.1. Notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1251.4.2. Premiere definition . . . . . . . . . . . . . . . . . . . . . . . . . 1261.4.3. Deuxieme definition . . . . . . . . . . . . . . . . . . . . . . . . . 1261.4.4. Representation d’une FAI-k : definition . . . . . . . . . 1261.4.5. Equivalence entre les deux definitions de FAI-k . . . 1261.4.6. Theoreme des representations : enonce . . . . . . . . . . 1271.4.7. Application : caracteristiques intrinseques . . . . . . . 1271.4.8. Un exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1281.4.9. Commentaire sur les CLA-k . . . . . . . . . . . . . . . . . . 128

2. Covariances Generalisees : theoreme fondamental . 1282.1. Derive d’une FAI-k . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

2.2. Covariance Generalisee : definition . . . . . . . . . . . . . . . . . 129

2.3. Theoreme d’existence et d’unicite . . . . . . . . . . . . . . . . . . 130

2.4. Fonctions de type positif conditionnel . . . . . . . . . . . . . . 130

3. Le Krigeage Intrinseque . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1313.1. L.A.U.O. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

3.2. Le systeme de Krigeage Intrinseque . . . . . . . . . . . . . . . . 132

3.3. Proprietes du systeme de Krigeage Intrinseque . . . . . . 1333.3.1. Superposition des figures de Krigeage . . . . . . . . . . . 1333.3.2. Orthogonalite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1333.3.3. Lissage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

3.4. Conditions de regularite du systeme de Krigeage . . . . 135

4. Presentation duale du Krigeage . . . . . . . . . . . . . . . . . . . . 1354.1. Le Krigeage comme interpolateur . . . . . . . . . . . . . . . . . . 135

4.2. Systeme de Krigeage dual . . . . . . . . . . . . . . . . . . . . . . . . 136

4.3. Interpretation des equations duales . . . . . . . . . . . . . . . . 1364.3.1. Recherche d’un nouvel interpolateur . . . . . . . . . . . . 136

4.3.2. Role des contraintes bα f lα = 0 . . . . . . . . . . . . . . 137

4.3.3. Caracterisation du systeme dual . . . . . . . . . . . . . . . 137

4.4. Equivalence splines–krigeage . . . . . . . . . . . . . . . . . . . . . . 137

Page 284: g é o Statistique

282 Aide-Memoire de geostatistique lineaire :

Chapitre 9

Introduction a la Geostatistique Multivariable . . . . . . . . . . . . 141

1. Position du probleme et notations . . . . . . . . . . . . . . . . . 1411.1. Remarque preliminaire . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

1.2. Necessite d’un modele multivariable :un exemple simpliste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143

1.3. Deux considerations generales sur le multivariable . . . 145

1.4. Notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146

2. Mise en place de la fonction structurale . . . . . . . . . . . 1472.1. Le modele FASt-2 d’esperance nulle . . . . . . . . . . . . . . . . 147

2.2. Proprietes elementaires des covariances croisees . . . . . 148

2.3. Indications sur le modele intrinseque strict . . . . . . . . . 150

2.4. Liens entre covariances et variogrammes croises . . . . . 151

3. Cokrigeage de FASt-2 d’esperances nulles . . . . . . . . . 1523.1. Construction du systeme de cokrigeage simple . . . . . . 152

3.2. Proprietes du systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1533.2.1. Structure du systeme . . . . . . . . . . . . . . . . . . . . . . . . 1533.2.2. Conditions de regularite . . . . . . . . . . . . . . . . . . . . . 1533.2.3. Separation des variables . . . . . . . . . . . . . . . . . . . . . 1543.2.4. Le cokrigeage, interpolateur exact . . . . . . . . . . . . . . 1553.2.5. Superposition des figures de cokrigeage . . . . . . . . . . 1553.2.6. Relation d’orthogonalite . . . . . . . . . . . . . . . . . . . . . 155

3.3. Elements de reflexion generale sur le cokrigeage . . . . . 155

4. Le cokrigeage universel . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1584.1. Dernier retour sur le modele intrinseque . . . . . . . . . . . . 158

4.2. Les equations du cokrigeage universel . . . . . . . . . . . . . . 1594.2.1. Description de la derive . . . . . . . . . . . . . . . . . . . . . . 1594.2.2. Construction du systeme . . . . . . . . . . . . . . . . . . . . . 160

4.3. Complements sur le cokrigeage universel . . . . . . . . . . . 1614.3.1. Proprietes algebriques du cokrigeage universel . . . . 1614.3.2. Regularite du systeme . . . . . . . . . . . . . . . . . . . . . . . 1624.3.3. Coestimation optimale des coefficients de la derive . 1624.3.4. Presentation duale du cokrigeage universel . . . . . . . 163

5. Recherche de simplification du cokrigeage universel 1635.1. Position du probleme et hypotheses simplificatrices . . 163

5.2. Principal resultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164

5.3. Adaptation des notations : cokrigeage . . . . . . . . . . . . . . 165

5.4. Adaptation des notations : coefficients des derives . . . 166

5.5. Transformation lineaire reguliere des variables . . . . . . 166

5.6. Cokrigeage des variables transformees . . . . . . . . . . . . . . 168

5.7. Coefficients des derives des variables transformees . . . 170

5.8. Application : la correlation intrinseque . . . . . . . . . . . . . 1715.8.1. Definition du modele . . . . . . . . . . . . . . . . . . . . . . . . 1715.8.2. Transformation des variables . . . . . . . . . . . . . . . . . . 1715.8.3. Simplification du cokrigeage universel . . . . . . . . . . . 1725.8.4. Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173

5.9. Perspectives : l’autokrigeabilite . . . . . . . . . . . . . . . . . . . . 173

6. Principes de l’analyse krigeante . . . . . . . . . . . . . . . . . . . . 1746.1. Presentation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174

6.2. Le modele lineaire de coregionalisation . . . . . . . . . . . . . 1756.2.1. Le modele structural . . . . . . . . . . . . . . . . . . . . . . . . 1756.2.2. Decomposition des variables . . . . . . . . . . . . . . . . . . 1766.2.3. Commentaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1766.2.4. Calage du modele lineaire de coregionalisation . . . . 177

Page 285: g é o Statistique

Sommaire 283

6.3. Estimation des facteurs . . . . . . . . . . . . . . . . . . . . . . . . . . 178

6.4. Remarque finale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179

7. Notion de derive externe . . . . . . . . . . . . . . . . . . . . . . . . . . . 1807.1. Justification, et modele . . . . . . . . . . . . . . . . . . . . . . . . . . . 180

7.2. Variographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181

7.3. Krigeage avec derive externe . . . . . . . . . . . . . . . . . . . . . . 181

7.4. Remarques finales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182

Annexes

Chapitre 1

Esperance conditionnelle : mecanismes d’utilisation . . . . . 189

1. Theoreme et mise en œuvre . . . . . . . . . . . . . . . . . . . . . . . 1891.1. Rappel du theoreme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189

1.2. Quelques formules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189

1.3. Les etapes de la mise en œuvre . . . . . . . . . . . . . . . . . . . . 190

1.4. Remarque sur la variance conditionnelle . . . . . . . . . . . . 190

1.5. Generalisation a plusieurs variables conditionnantes . 190

2. Application aux calculs de variogrammes . . . . . . . . . . 1912.1. Generation d’un modele triangulaire . . . . . . . . . . . . . . . 191

2.2. Generation d’un modele exponentiel . . . . . . . . . . . . . . . 192

3. Introduction au krigeage aleatoire . . . . . . . . . . . . . . . . . 1923.1. Presentation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192

3.2. Linearite, autorisation et universalite . . . . . . . . . . . . . . 193

3.3. Optimalite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1933.3.1. Demarche generale . . . . . . . . . . . . . . . . . . . . . . . . . 1933.3.2. Simplification pour des implantations

uniformes independantes . . . . . . . . . . . . . . . . . . . . . 1943.3.3. Expression finale pour des implantations

uniformes independantes . . . . . . . . . . . . . . . . . . . . . 194

3.4. Systeme du Krigeage Aleatoire . . . . . . . . . . . . . . . . . . . . 195

3.5. Remarque importante . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195

Chapitre 2

Complements sur le theoreme d’additivite . . . . . . . . . . . . . . . . 197

1. Estimation des residus et Krigeage Simple . . . . . . . . . 1971.1. Hypotheses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197

1.2. Conditions d’orthogonalite . . . . . . . . . . . . . . . . . . . . . . . . 1981.2.1. Krigeage ordinaire . . . . . . . . . . . . . . . . . . . . . . . . . . 1981.2.2. Estimation de la moyenne . . . . . . . . . . . . . . . . . . . . 1981.2.3. Recapitulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199

1.3. Estimation du Residu . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199

1.4. Estimation des Residus et Krigeage Simple . . . . . . . . . 200

1.5. Quelques relations d’inegalite entre variances . . . . . . . 201

1.6. Recapitulation sur les variances et covariances . . . . . . 202

1.7. Valeurs particulieres de la somme des poids de KS . . . 2021.7.1. Somme egale a 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . 2021.7.2. Somme egale a 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . 2031.7.3. Somme egale a 1/2 . . . . . . . . . . . . . . . . . . . . . . . . . 203

2. Theoreme d’additivite pour le modele intrinseque . 2032.1. Expression du theoreme au niveau des estimateurs . . 203

Page 286: g é o Statistique

284 Aide-Memoire de geostatistique lineaire :

2.2. Expression du theoreme au niveau des variances . . . . . 205

2.3. Illustration sur un cas simple . . . . . . . . . . . . . . . . . . . . . 206

3. Generalisation a des KU de degres differents . . . . . . 2073.1. Notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207

3.2. Additivite des estimateurs du Krigeage . . . . . . . . . . . . . 208

3.3. Additivite des variances . . . . . . . . . . . . . . . . . . . . . . . . . . 209

3.4. Formulaire des estimateurs de coefficients de la Derive 210

Chapitre 3

Aspect dual du Krigeage Universel . . . . . . . . . . . . . . . . . . . . . . . . 213

1. Presentation duale du Krigeage Universel . . . . . . . . . 2131.1. Complement sur l’estimation du residu . . . . . . . . . . . . . 213

1.2. Estimation de la Derive et Krigeage Universel . . . . . . . 214

2. Caracterisation des coefficients du KU . . . . . . . . . . . . . 214

3. Interet pratique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215

4. Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216

Chapitre 4

Demonstration du theoreme des Representations . . . . . . . . 217

1. Hypotheses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217

2. Enonce du theoreme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217

3. Construction d’une representation particuliere . . . . . 2173.1. Choix d’un systeme de ponderateurs . . . . . . . . . . . . . . . 217

3.2. Construction d’une CLA d’ordre k . . . . . . . . . . . . . . . . . 217

3.3. Construction d’une Fonction Aleatoirenon stationnaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218

3.4. Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219

4. Caracterisation de l’ensemble des representations . 2194.1. Enonce . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219

4.2. Condition suffisante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219

4.3. Condition necessaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219

Chapitre 5

Demonstration du theoreme de regularite du KI . . . . . . . . . 221

1. Enonce du theoreme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221

2. Remarque preliminaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221

3. Condition necessaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2213.1. Necessite de la seconde condition . . . . . . . . . . . . . . . . . . 221

3.2. Effet du non-respect de la premiere condition . . . . . . . 222

3.3. Necessite de la premiere condition . . . . . . . . . . . . . . . . . 222

3.4. Resultat complementaire . . . . . . . . . . . . . . . . . . . . . . . . . 2233.4.1. Consequence du theoreme precedent . . . . . . . . . . . . 2233.4.2. Reciproque . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2233.4.3. Enonce . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223

4. Condition suffisante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223

Page 287: g é o Statistique

Sommaire 285

Chapitre 6

Equivalence Spline-Krigeage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225

1. Estimation des coefficients de la derive . . . . . . . . . . . . 2251.1. Systeme d’estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225

1.2. Estimateur du maximum de vraisemblance(cas gaussien) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226

1.3. Point de vue general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226

1.4. Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227

2. Notations Generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2272.1. Indices et ensembles concernes . . . . . . . . . . . . . . . . . . . . 227

2.2. Matrices de covariances . . . . . . . . . . . . . . . . . . . . . . . . . . 2272.2.1. Proprietes d’une sous-matrice de covariance . . . . . . 2272.2.2. Notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228

2.3. Une identite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228

2.4. Identification des termes . . . . . . . . . . . . . . . . . . . . . . . . . . 229

3. Krigeage Simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2293.1. Systeme d’estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229

3.2. Minimisation d’une integrale d’espace . . . . . . . . . . . . . . 229

4. Krigeage Universel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2304.1. Systeme d’estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230

4.2. Minimisation d’une integrale d’espace . . . . . . . . . . . . . . 230

5. Krigeage Intrinseque (FAI-k) . . . . . . . . . . . . . . . . . . . . . . . 2315.1. Position du probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231

5.2. Donner un sens aux Splines . . . . . . . . . . . . . . . . . . . . . . . 231

5.3. Une bijection essentielle . . . . . . . . . . . . . . . . . . . . . . . . . . 232

5.4. Proprietes de la matrice Bij . . . . . . . . . . . . . . . . . . . . . . 233

5.5. Equivalence Spline–Krigeage . . . . . . . . . . . . . . . . . . . . . . 2345.5.1. Annonce de la methode et du resultat . . . . . . . . . . 2345.5.2. Definition de la matrice Bij . . . . . . . . . . . . . . . . . . 2345.5.3. Expression des solutions du systeme des Splines . . . 2355.5.4. Consequence de la singularite de Buv . . . . . . . . . . 2355.5.5. Condition necessaire de singularite

du systeme de Splines . . . . . . . . . . . . . . . . . . . . . . . 2365.5.6. Reciproque . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2365.5.7. Recapitulatif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2365.5.8. Explicitation de la solution des Splines . . . . . . . . . . 2365.5.9. Explicitation de la solution du KI . . . . . . . . . . . . . . 237

5.5.10. Explicitation des ponderateurs du KI . . . . . . . . . . . 2375.5.11. Resultat complementaire . . . . . . . . . . . . . . . . . . . . . 238

Chapitre 7

Etude de la bathymetrie sur le site du Titanic . . . . . . . . . . . 239

1. Presentation des donnees . . . . . . . . . . . . . . . . . . . . . . . . . . 239

2. Calcul des variogrammes . . . . . . . . . . . . . . . . . . . . . . . . . . . 240

3. Analyse Variographique non stationnaire . . . . . . . . . . . 2403.1. Approche automatique . . . . . . . . . . . . . . . . . . . . . . . . . . . 240

3.2. Modification des parametres par defaut . . . . . . . . . . . . 240

3.3. Une solution acceptable . . . . . . . . . . . . . . . . . . . . . . . . . . 241

3.4. Recherche d’allegement des calculs . . . . . . . . . . . . . . . . . 241

4. Elements de conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242

Page 288: g é o Statistique

286 Aide-Memoire de geostatistique lineaire :

Chapitre 8

Introduction au filtrage d’erreurs . . . . . . . . . . . . . . . . . . . . . . . . . . 253

1. Filtrage d’une erreur non systematique . . . . . . . . . . . . 2531.1. Hypotheses et notations . . . . . . . . . . . . . . . . . . . . . . . . . . 253

1.2. Systeme de filtrage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254

1.3. Remarque sur la regularite du systeme . . . . . . . . . . . . . 254

1.4. Comparaison aux krigeages monovariables . . . . . . . . . . 255

1.5. Cas particulier d’un bruit blanc . . . . . . . . . . . . . . . . . . . 255

1.6. Estimation de la derive . . . . . . . . . . . . . . . . . . . . . . . . . . . 256

2. Filtrage d’une erreur systematique . . . . . . . . . . . . . . . . . 2572.1. Hypotheses et notations . . . . . . . . . . . . . . . . . . . . . . . . . . 257

2.2. Regularite du systeme de cokrigeage . . . . . . . . . . . . . . . 258

2.3. Estimations optimales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259

Bibliographie, Notations, Index, Table

Bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263

Notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267

1. Rappel preliminaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267

2. Conventions generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2672.1. Abreviations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267

2.2. Convention de sommation . . . . . . . . . . . . . . . . . . . . . . . . 268

2.3. Identification des Krigeages . . . . . . . . . . . . . . . . . . . . . . . 268

2.4. Majuscules, minuscules . . . . . . . . . . . . . . . . . . . . . . . . . . . 268

3. Symboles alpha–numeriques . . . . . . . . . . . . . . . . . . . . . . . 269

4. Symboles divers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272

Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273

Table . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277