utilisation du métamodèle processus gaussien pour l'analyse de

51
1 AgroParisTech – le 23/10/2008 Utilisation du métamodèle processus gaussien pour l’analyse de sensibilité d’une sortie spatiale d’un code de calcul Application Application à à un code de transport hydrog un code de transport hydrog é é ologique ologique Amandine Marrel Amandine Marrel Thèse effectuée au LMTE du CEA Cadarache* Directrice de thèse : B. Laurent Laboratoire de Modélisation des Transferts dans l’Environnement Dept. de Génie Mathematique, INSA de Toulouse

Upload: nguyendung

Post on 05-Jan-2017

225 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Utilisation du métamodèle processus gaussien pour l'analyse de

1AgroParisTech – le 23/10/2008

Utilisation du métamodèle processus

gaussien pour l’analyse de sensibilité

d’une sortie spatiale d’un code de calcul

Application Application àà un code de transport hydrogun code de transport hydrogééologiqueologique

Amandine MarrelAmandine Marrel

Thèse effectuée au LMTE du CEA Cadarache* Directrice de thèse : B. Laurent

Laboratoire de Modélisation des Transferts dans l’Environnement Dept. de Génie Mathematique, INSA de Toulouse

Page 2: Utilisation du métamodèle processus gaussien pour l'analyse de

2AgroParisTech – le 23/10/2008

Introduction : modélisation du transfert de polluan tsDe la caractérisation à la modélisation numérique…

Identification des phénomènes

Identification des paramètres géologiques et physiques (caractéristiques du milieu) et chimiques (caractéristiques du milieu et du polluant)

Modélisation numérique : implémentation du scénario de transport

Transport généralisé Chimie transport

CaractCaractéérisation : risation : in situ, en labo ou biblio

Incertitude sur les paramIncertitude sur les paramèètres :tres :loi a priori (jugement d’expert),

loi empirique (mesures expérimentales)

Equations de transport (Equations de transport (ééquations Darcy, Richardsquations Darcy, Richards……))

Code de calcul de transport hydrogCode de calcul de transport hydrogééologique :ologique :Marthe, Marthe, PorflowPorflow, , HytecHytec……

Page 3: Utilisation du métamodèle processus gaussien pour l'analyse de

3AgroParisTech – le 23/10/2008

Introduction : propagation des incertitudes

Propagation des incertitudes :Propagation des incertitudes : Incertitudes lors de la caractérisation Caractérisation partielle Paramètres fixés a priori

Code de calculCode de calculEx : Marthe, Porflow, …

ParamParamèètrestres et variables et variables dd’’entrentrééee

Ex : porosité, perméabilité, coefficient de diffusion…

……

Sortie ou variable Sortie ou variable dd’’intintéérêtrêt

Ex : concentration en polluant

……

Incertitudes sur Incertitudes sur les entrles entrééeses

Incertitudes sur la Incertitudes sur la sortiesortie

Incertitude sur la Incertitude sur la prise de dprise de déécision finalecision finale

Page 4: Utilisation du métamodèle processus gaussien pour l'analyse de

4AgroParisTech – le 23/10/2008

Introduction : propagation des incertitudes

Gestion des incertitudes : Comment propager les incertitudes sur la sortie du code ?

Quelles sont les incertitudes les plus préjudiciables ?

Quelles sont les variables les plus influentes ?

Incertitude au final sur la sortie ?

Estimation de la marge de confiance sur la prise de décision ?

ProblèmeCode complexe & coûteux

Grand nombre de variables d’entrée

Grand nombre de simulations nécessaires pour les études de sensibilité et de propagation d’incertitude

Exploitation directe Exploitation directe du code difficiledu code difficile

Utilisation dUtilisation d’’un un mméétamodtamodèèlele pour approximer le code pour approximer le code

Page 5: Utilisation du métamodèle processus gaussien pour l'analyse de

5AgroParisTech – le 23/10/2008

DDéétermination termination des paramdes paramèètres tres

AdAdééquation expquation expéériences riences simulsimuléées et observes et observééeses

Introduction : un outil statistique multifonctionne l…

PhénomèneEx : Transport en ZNS …

Code de calculEx : Marthe, Porflow …

Variables et paramètres d’entréeEx : porosité, perméabilité, Kd …

X1, …, Xd

Expérience«observée»

Expérience«simulée»

Métamodèle :Ex :Processus gaussiens

Expérience« prédite »

Exploitation du Exploitation du mméétamodtamodèèlele

Analyse de sensibilité

Métamodèle

)( XfY SRSR =

Distribution desentrées

Distribution de la sortie

Propagation d’incertitudes Calibration

Page 6: Utilisation du métamodèle processus gaussien pour l'analyse de

6AgroParisTech – le 23/10/2008

Introduction : un outil statistique multifonctionne l…

Le métamodèle

Fonction statistique représentative du code de calcul

Construit à partir de n simulations du code

Temps d’évaluation très faible par rapport à celui du code

Outil multifonctionnel : analyse de sensibilité, propagation d’incertitudes, calibration

Construction en grande dimension

Contrôle de la qualitContrôle de la qualitéé dd’’approximation (ajustement au code)approximation (ajustement au code)

Ex : Polynômes, splines, réseaux de neurones, …

Choix : MMéétamodtamod èèlele Processus Gaussiens (PG)Processus Gaussiens (PG)

Page 7: Utilisation du métamodèle processus gaussien pour l'analyse de

7AgroParisTech – le 23/10/2008

Introduction : mise en œuvre du métamodèle PG

Problématiques

Construction en grande dimension

grand nombre d’entrées pour un faible nombre de simulations

Développement d’un algorithme couplant estimation et sélection

Analyse de sensibilité et propagation d’incertitudes

Comparaison de 2 approches : prédicteur seul et modèle stochastique

Extension à des sorties spatiales

Sortie fonction de l’espace dans les problèmes environnementaux

Métamodèle et analyse de sensibilité fonctionnels

Page 8: Utilisation du métamodèle processus gaussien pour l'analyse de

8AgroParisTech – le 23/10/2008

Introduction : mise en œuvre du métamodèle PG

Problématiques

Construction en grande dimension

grand nombre d’entrées pour un faible nombre de simulations

Développement d’un algorithme couplant estimation et sélection

Analyse de sensibilité et propagation d’incertitudes

Comparaison de 2 approches : prédicteur seul et modèle stochastique

Extension à des sorties spatiales

Sortie fonction de l’espace dans les problèmes environnementaux

Métamodèle et analyse de sensibilité fonctionnels

Page 9: Utilisation du métamodèle processus gaussien pour l'analyse de

9AgroParisTech – le 23/10/2008

Introduction : mise en œuvre du métamodèle PG

Problématiques

Construction en grande dimension

grand nombre d’entrées pour un faible nombre de simulations

Développement d’un algorithme couplant estimation et sélection

Analyse de sensibilité et propagation d’incertitudes

Comparaison de 2 approches : prédicteur seul et modèle stochastique

Extension à des sorties spatiales

Sortie fonction de l’espace dans les problèmes environnementaux

Métamodèle et analyse de sensibilité fonctionnels

Page 10: Utilisation du métamodèle processus gaussien pour l'analyse de

10AgroParisTech – le 23/10/2008

1.1. PrPréésentation du cas rsentation du cas r ééel du site de el du site de KurchatovKurchatovModélisation géologique

Modélisation par un code de transport hydrogéologique

2.2. MMéétamodtamod èèlele PG PG DéfinitionAlgorithme de construction en grande dimension

Application au cas du site de Kurchatov

3.3. Analyse de sensibilitAnalyse de sensibilit éé avec avec mméétamodtamod èèlele PG PG Double approcheSimulation des lois des indicesApplication au cas du site de Kurchatov

4. Extension aux sorties spatialesChoix du métamodèle fonctionnelApplication au cas du site de Kurchatov

PLAN

Page 11: Utilisation du métamodèle processus gaussien pour l'analyse de

11AgroParisTech – le 23/10/2008

1.1. PrPréésentation du cas rsentation du cas r ééel du site de el du site de KurchatovKurchatovModélisation géologique

Modélisation par un code de transport hydrogéologique

2. Métamodèle PG DéfinitionAlgorithme de construction en grande dimension

Application au cas du site de Kurchatov

3. Analyse de sensibilité avec métamodèle PG : Double approcheSimulation des lois des indicesApplication au cas du site de Kurchatov

4. Extension aux sorties spatialesChoix du métamodèle fonctionnelApplication au cas du site de Kurchatov

PLAN

Page 12: Utilisation du métamodèle processus gaussien pour l'analyse de

12AgroParisTech – le 23/10/2008

STDR de STDR de KurchatovKurchatov (banlieue de Moscou):(banlieue de Moscou):

Stockage de déchets radioactifs solides de 1943 à 1974

Reconnaissance du site vers 1990 : réseau de 20 piézomètres

Contamination nappe supérieure 90Sr

Objectif :Objectif :

Estimer lEstimer l’’impact de la contamination impact de la contamination

sur lsur l’’environnementenvironnement

ModModéélisation :lisation :

Développement d’un scénario de transport généralisé de 90Sr

sur le site entre 2002 et 2010, avec le logiciel MARTHE

Identification des paramètres de transport de ce modèle

cf. Volkova et al., Stochastic Environmental Research and Risk Assesment, 2008

Présentation du cas réel du site de Kurchatov

Page 13: Utilisation du métamodèle processus gaussien pour l'analyse de

13AgroParisTech – le 23/10/2008

ModModéélisation glisation gééologiqueologique

Identification de 20 paramIdentification de 20 paramèètres :tres :PermPermééabilitabilitéé, porosit, porositéé, coefficient , coefficient KdKd, ,

intensitintensitéé dd’’infiltrationinfiltration……

&&

Incertitudes associIncertitudes associééeses

Présentation du cas réel du site de Kurchatov

zones d’absence de la couche 2 (zones numérotées de 1 à 4)

présence de la couche 2

localisation d’infiltrations modérées

au niveau de canalisations

localisation d’infiltrations fortes

au niveau de canalisations

piézomètresp4ap4a

Page 14: Utilisation du métamodèle processus gaussien pour l'analyse de

14AgroParisTech – le 23/10/2008

Jeu de donnJeu de donnéées MARTHE :es MARTHE : 20 param20 paramèètres dtres d’’entrentréée :e :

perméabilité, dispersivités, Kd, porosité, intensités d’infiltration, …

Sortie : spatiale discrSortie : spatiale discréétistiséée (64x64 = 4096 sites) e (64x64 = 4096 sites) Carte de concentration calculée par le logiciel MARTHE en fin d’année 2010

Etape 1 : 20 piézomètres = 20 sorties scalaires

Etape 2 : sortie spatiale = sortie fonctionnelle

Présentation du cas réel du site de Kurchatov

300 simulations LHS300 simulations LHS

Page 15: Utilisation du métamodèle processus gaussien pour l'analyse de

15AgroParisTech – le 23/10/2008

1. Présentation du cas réel du site de KurchatovModélisation géologique

Modélisation par un code de transport hydrogéologique

2.2. MMéétamodtamod èèlele PGPGDéfinitionAlgorithme de construction en grande dimension

Application au cas du site de Kurchatov

3. Analyse de sensibilité avec métamodèle PG : Double approcheSimulation des lois des indicesApplication au cas du site de Kurchatov

4. Extension aux sorties fonctionnellesChoix du métamodèle fonctionnelApplication au cas du site de Kurchatov

PLAN

Page 16: Utilisation du métamodèle processus gaussien pour l'analyse de

16AgroParisTech – le 23/10/2008

Definition :Definition :

Processus Gaussien défini sur

Y(x,ω) = F(x) + Z(x,ω)

Regression Regression PartiePartie stochastiquestochastique

Choix paramChoix paraméétriques :triques :

– f : polynôme de degré 1

– R : processus stationnaire avec covariance exponentielle généralisée + effet de pépite

( ) ux

d

i

p

iiiiux =

=

+

−−== ∑ 1²exp u-xR u) R(x,1

εθ

∑=

+=d

iix

1i0 F(x) ββ

Ω×dRZ processus stochastique avec :

EEΩΩ[[Z(xZ(x)] = 0)] = 0

CovCovΩΩ((Z(xZ(x), ), Z(uZ(u)) = )) = σσ²²R(R(xx, , uu) )

où σ² est la variance

et R la fonction de corrélation

Z~Z~NN(0, (0, σσ²²R)R)

Métamodèle PG : définition

Page 17: Utilisation du métamodèle processus gaussien pour l'analyse de

17AgroParisTech – le 23/10/2008

Loi jointe et loi conditionnelle :Loi jointe et loi conditionnelle :

– Métamodèle PG : Y(x,ω) = F(x) + Z(x,ω)

– Base d’apprentissage (BA) de n simulations : (XBA,YBA)

– Loi jointe :

– Métamodèle PG conditionnel :

( ) ( )[ ]xxRxxRxr n ,,...,,)( avec )()1(=

[ ] ( )( ) kiBABABABAkin xxRRXFFxxX ,

)()()()1( , , )( ,,..., ===

PGxYBABA YX ~),( ,ω

[ ] [ ]BABABAYX FYRxrxFxYEBABA

ββω −+= −Ω

1

, )()(),(

( ) ( ))()(),(²),(,),( 1

,, vrRurvuRvYuYCov BAt

YXYX BABABABA

−Ω += σωω

)²,(~ BABABA RFY σβN

[ ]BABA YXxYExY ,),()(ˆ : Predicteurdu Notation ωΩ=

Métamodèle PG : définition

Page 18: Utilisation du métamodèle processus gaussien pour l'analyse de

18AgroParisTech – le 23/10/2008

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1−4

−2

0

2

4

6

8

Métamodèle PG : Exemple

Exemple de construction dExemple de construction d’’un un mméétamodtamodèèlele PGPG

– Fonction théorique :

– Base d’apprentissage : LHS de 8 points

( ) ( )XXY ππ 8sin4cos +=

YY

XX

Page 19: Utilisation du métamodèle processus gaussien pour l'analyse de

19AgroParisTech – le 23/10/2008

Méthodologie de construction du métamodèle PG

Estimation des paramètres par maximum de vraisemblance

Algorithme séquentiel :

Algorithme stochastique suivi d’une étape de descente(Hookes & Jeeves, DACE matlab)

Insertion progressive des variables d’entrée (Welch et al.)

Double sélection des variables d’entrée

- Minimisation du critère AICC régression

- Maximisation du Q2 calculé par validation croisée covariance

Validation finale du modèle par Q2

( )ε, β,θ,p,σ

( )( )∑

=

=

−−= N

ii

N

iii

YY

YYYYQ

1

2

1

1)ˆ,(2

Cf. Marrel et al., Computational Statistics and Data Analysis, 2008.

Métamodèle PG : algorithme de construction

( )2

12ˆˆ,ˆˆln2

21

21

−−−+++−=

mmN

mmNσ,pθ,βLAICC m1 : nbre de

variables dans la régression m2 : nbre de variables dans la covariance

Page 20: Utilisation du métamodèle processus gaussien pour l'analyse de

20AgroParisTech – le 23/10/2008

Métamodèle PG : algorithme de construction

Procédure de modélisation par les processus gaussiens

Etape 1 : Tri des variables d’entrée

Etape 2 : Boucle sur les variables dans la fonction de covariance

Etape 2.1 : Boucle sur les variables dans la régression Estimation des paramètres β, θ, σ Calcul du critère AICC

Etape 2.1 : Sélection du modèle de régression optimalAICC minimal

Etape 2.2 : Calcul du Q2 par validation croisée sur la BA

Etape 3 : Sélection du modèle de covariance optimalQ2 maximal

Etape 4 : Validation finale du modèle sur la BT (calcul du Q2)

Page 21: Utilisation du métamodèle processus gaussien pour l'analyse de

21AgroParisTech – le 23/10/2008

Etape 5 : Simplification et optimisation du modEtape 5 : Simplification et optimisation du modèèlele

Tracé du Q2 (base de test ou validation croisée) en fonction du nombre de paramètres d’entrée dans la covariance

Tri des variables par saut de Q2 décroissant Nouvel ordre pour les variables d’entrée dans la fonction de covariance

Procédure d’estimation des paramètres relancée avec le nouvel ordre Estimation optimisée des paramètres de corrélation liés aux variables les plus influentes

[ ] [ ] ,,,,, ,, *9

*8

*5

*2

*4

*16

*1 xxxxxxx KK ⇒

Métamodèle PG : algorithme de construction

Page 22: Utilisation du métamodèle processus gaussien pour l'analyse de

22AgroParisTech – le 23/10/2008

5 10 15 200

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Comparaison avec le logiciel GEM-SA (O’Hagan)

•• Fonction gFonction g--Sobol Sobol àà dd entrentréées :es :

•• Base dBase d’’apprentissage : LHS apprentissage : LHS àà N = 10*d simulations, 50 rN = 10*d simulations, 50 rééppéétitions.titions.

Métamodèle PG : Application au site de Kurchatov

IntIntéérêt de lrêt de l’’algorithme algorithme dd’’autant plus significatif autant plus significatif que la dimension augmenteque la dimension augmente

QQ22

[ ]∏=

=+

+−=

d

ii

id diUX

iXXXg

11 ;01 ...1pour ~ avec

i1

24),...,(

d : Dimension des entrd : Dimension des entréées Xes X

Page 23: Utilisation du métamodèle processus gaussien pour l'analyse de

23AgroParisTech – le 23/10/2008

Comparaison de 3 métamodèles pour les 20 piézomètres:

RRéégression lingression linééaire aire

BoostingBoosting dd’’arbres de rarbres de réégressiongression

MMéétamodtamodèèlele PGPG

Métamodèle PG : Application au site de Kurchatov

Meilleures performances Meilleures performances obtenues avec le obtenues avec le mméétamodtamodèèlele PGPG

QQ22

Page 24: Utilisation du métamodèle processus gaussien pour l'analyse de

24AgroParisTech – le 23/10/2008

Développement d’un algorithme de construction

Procédure estimation/sélection en grande dimension :

- estimation séquentielle des paramètres du PG

- Double sélection des variables d’entrée

Perspectives

Autres critères possibles : LASSO au lieu d’AICC

Etude non exhaustive des fonctions de covariances

⇒ fonction présentant un meilleur rapport souplesse/nombre de paramètres ?

Métamodèle PG : conclusion et perspectives

EfficacitEfficacitéé de lde l’’algorithme et algorithme et prpréédictivitdictivitéé du PG du PG

éévaluvaluéées sur des exemples analytiques et sur un cas res sur des exemples analytiques et sur un cas rééelel

Page 25: Utilisation du métamodèle processus gaussien pour l'analyse de

25AgroParisTech – le 23/10/2008

1. Présentation du cas réel du site de KurchatovModélisation géologique

Modélisation par un code de transport hydrogéologique

2. Métamodèle PG DéfinitionAlgorithme de construction en grande dimension

Application au cas du site de Kurchatov

3. Analyse de sensibilitAnalyse de sensibilit éé avec avec mméétamodtamod èèlele PG PG Double approcheSimulation des lois des indicesApplication au cas du site de Kurchatov

4. Extension aux sorties spatialesChoix du métamodèle fonctionnelApplication au cas du site de Kurchatov

PLAN

Page 26: Utilisation du métamodèle processus gaussien pour l'analyse de

26AgroParisTech – le 23/10/2008

Analyse de sensibilitAnalyse de sensibilitéé globaleglobale

basée sur la décomposition de la variance :

poids total de la variance dpoids total de la variance d’’une entrune entréée e

dans la variance de la sortiedans la variance de la sortie

relation entrées/sortie ni linéaire, ni monotone :

calcul des indices de Sobolcalcul des indices de Sobol

DDééfinitions pour une fonction dfinitions pour une fonction dééterministeterministe

– Effet principaux :

– Indices de Sobol :

– Notation :

Analyse de sensibilité avec métamodèle PG

)(

)]([

)(

)]/),,(([ 1

gVar

XaVar

gVar

XXXgEVarS iXidX

iii ==

K

[ ]id

d

ijjjdiiii XXXgEdxxxXxxgXa /),,(),,,,,,()( 1

,1111 KKK == ∏∫

≠=+−

),,( 1 dXXg K

[ ]diii XXXXX ,,,,, 111 KK +−− =

Page 27: Utilisation du métamodèle processus gaussien pour l'analyse de

27AgroParisTech – le 23/10/2008

PG conditionnel PG conditionnel àà la BA :la BA :

Calcul des indices de Sobol :Calcul des indices de Sobol :

Analyse de sensibilité avec PG : 2 approches

[ ]LSLS YXXYEXY ,),()(ˆ ωΩ=

LSLS YXXY ,),( ω

a(Xa(Xii) : fonction d) : fonction dééterministe de Xterministe de Xii

SSii : indices d: indices dééterministeterministe

a(Xa(Xii,,ωω) : Processus Gaussien de X) : Processus Gaussien de XiiVVii : variable al: variable alééatoireatoire

A partir du prédicteur seulA partir du modèle global

PGxYLSLS YX ~),( ,ω [ ]

LSLS YXxYExY ,),()(ˆ ωΩ=

( )LSLSLSLS YXYX vYuYCov ,, ),(,),( ωωΩ

[ ]( )[ ]

=

=

iYXXXi

iYXXi

XXYEVarV

XXYEXa

LSLSii

LSLSi

/),()(

/),(),(

,

,

ωω

ωω

)~

(),(

~

,

ii

YXX

ii SE

XYVarE

VS

LSLS

ΩΩ

=⇒= µω

[ ]

=

=

)ˆ(

)]/)(ˆ([

/)(ˆ)(

YVar

XXYEVarS

XXYEXa

X

iXXi

iXi

ii

i

Page 28: Utilisation du métamodèle processus gaussien pour l'analyse de

28AgroParisTech – le 23/10/2008

Calcul des indices de Sobol :Calcul des indices de Sobol :

ImplImpléémentation :mentation :

Calculs analytiques

Intégrales numériques

Hypothèses : entrées indépendantes & covariance produit de covariance monodim

Si : o(dn²) intégrales simples

: o(dn²) intégrales simples et d² doubles

Analyse de sensibilité avec PG : 2 approches

( )( )[ ])(

/),(

,

,

LSLS

LSLSii

YXX

iYXXXi

YEVar

XXYEEVarS

Ω

Ω−=ω

A partir du prédicteur (Chen et al., 2005)A partir du modèle global (Oakley & O’Hagan, 2004)

( )[ ]( )LSLS

LSLSii

YXX

iYXXX

i XYVarE

XXYEVarE

,

,

),(

/),(

ωω

µΩ

Ω −=

[ ]LSLS YXXYEXY ,),()(ˆ ωΩ=

LSLS YXXY ,),( ω

Page 29: Utilisation du métamodèle processus gaussien pour l'analyse de

29AgroParisTech – le 23/10/2008

Fonction gFonction g--Sobol Sobol àà 5 entr5 entréées : es :

Analyse de sensibilité avec PG : 2 approches

[ ]∏=

=+

+−=

5

11 ;051 5...1pour ~ avec

i1

24),...,(

ii

i iUXiX

XXg

S1 S1

Pour chaque approche :Moyenne empirique en traits pleins Quantiles 0.05 et 0.95 en pointillés

Marrel et al., A paraître dans Reliability Engineering and System Safety, 2008.

Page 30: Utilisation du métamodèle processus gaussien pour l'analyse de

30AgroParisTech – le 23/10/2008

0 0.01 0.02 0.03 0.04 0.05 0.06

Distribution of S4

S4

Fonction gFonction g--Sobol Sobol àà 5 entr5 entréées : es :

Base d’apprentissage de n = 50 simulations, S1théo = 0.72 et S4théo = 0.0072.

DDééveloppement dveloppement d’’un algorithme de simulation de la loi de Sun algorithme de simulation de la loi de Sii

Analyse de sensibilité avec PG : simulation des lois des indices

[ ]∏=

=+

+−=

5

11 ;051 ~et ]99,9,5.4,1,0[ avec

1

24),...,(

ii

i

ii UXaa

aXXXg

Construction d’intervalles de confiance

0.65 0.7 0.75 0.8 0.85 0.9 0.95 1

Distribution of S1

S1

Page 31: Utilisation du métamodèle processus gaussien pour l'analyse de

31AgroParisTech – le 23/10/2008

Analyse de sensibilitAnalyse de sensibilitéé pour un pipour un piéézomzomèètretre

Ex : Indices de Sobol au niveau du piézomètre p104 (Q2 = 93%)

Estimation des indices + construction des intervalles de prédiction

[ 10 ; 17 ]21315Infiltration

forte

[ 56 ; 83 ]86976Kd couche1

[ 5 ; 11 ]288Perméabilité

couche1

IC- 90%(PG global)(PG global)(PG global)

Si

(PG prédicteur)(en %) ]

~[ ii SEΩ=µ ]

~[ ii SStdΩ=σ )

~( iS

Analyse de sensibilité avec PG : Application au site de Kurchatov

Cohérence des résultats des 2 approches

Faible chevauchement des IC avec approche modèle global information sup. sur l’ordre d’influence des variables

Page 32: Utilisation du métamodèle processus gaussien pour l'analyse de

32AgroParisTech – le 23/10/2008

Localisation du piLocalisation du piéézomzomèètre p104 tre p104

Analyse de sensibilité avec PG : Application au site de Kurchatov

Page 33: Utilisation du métamodèle processus gaussien pour l'analyse de

33AgroParisTech – le 23/10/2008

1. Pr1. Préésentation du cas rsentation du cas r ééel du site de el du site de KurchatovKurchatovModélisation géologique

Modélisation par un code de transport hydrogéologique

2. MMéétamodtamod èèlele PG PG DéfinitionAlgorithme de construction en grande dimension

Application au cas du site de Kurchatov

3. Analyse de sensibilitAnalyse de sensibilit éé avec avec mméétamodtamod èèlele PGPGDouble approcheSimulation des lois des indicesApplication au cas du site de Kurchatov

4 . Extension aux sorties spatiales4 . Extension aux sorties spatialesChoix du métamodèle fonctionnelApplication au cas du site de Kurchatov

PLAN

Page 34: Utilisation du métamodèle processus gaussien pour l'analyse de

34AgroParisTech – le 23/10/2008

Sortie spatialeSortie spatiale

Ex : Concentration en polluant sur un site, …

[ ] DuXuYXXX coded ∈⇒= ),,(,,1 K

Extension aux sorties spatiales

ANALYSE DE SENSIBILITE DANALYSE DE SENSIBILITE D’’UNE SORTIE SPATIALEUNE SORTIE SPATIALE

Page 35: Utilisation du métamodèle processus gaussien pour l'analyse de

35AgroParisTech – le 23/10/2008

Comment modComment modééliser une sortie spatiale ?liser une sortie spatiale ?

Utilisation de la discrUtilisation de la discréétisation compltisation complèète de la fonctionte de la fonction

Construction d’un métamodèle puis AS en chaque point de discrétisation

Possible mais peut être très coûteux en fonction du métamodèleSynthèse de l’information ou isolement de l’info principale

Remplacer la fonction par quelques paramRemplacer la fonction par quelques paramèètres dtres d’’intintéérêtrêt (valeur finale, max, …)

Exploitation réduite, fortement liée à la problématique de départ

KrigeageKrigeage / / CokrigeageCokrigeage (Santner et al., 2003, Fang et al., 2006)

Traitement simultané d’une grande quantité de données

DDéécomposition spectrale de la covariancecomposition spectrale de la covariance ((KarhunenKarhunen--LoeveLoeve))

DDéécomposition dans une base fonctionnellecomposition dans une base fonctionnelle (Fourier, ondelettes,(Fourier, ondelettes,……))

Extension aux sorties spatiales : choix du métamodè le

Page 36: Utilisation du métamodèle processus gaussien pour l'analyse de

36AgroParisTech – le 23/10/2008

MMéétamodtamodèèlele fonctionnel retenu :fonctionnel retenu :

Etape 1 : DEtape 1 : Déécomposition spatiale dans une base fonctionnelle composition spatiale dans une base fonctionnelle

Principaux coefficients de la dPrincipaux coefficients de la déécompositioncomposition

Etape 2 : ModEtape 2 : Modéélisation des principaux coefficients en fonction de X :lisation des principaux coefficients en fonction de X :

MMéétamodtamodèèlele PGPG

PrPréédiction :diction :

Analyse de sensibilitAnalyse de sensibilitéé, propagation d, propagation d’’incertitude, incertitude, ……

( ) ( ) ( ) ( ) ( )∫∑ −=+== D

jj

k

jjjk duuuuXYXuXuuXY φµαφαµ )(),( avec )(),(

1

Extension aux sorties spatiales : choix du métamodè le

Page 37: Utilisation du métamodèle processus gaussien pour l'analyse de

37AgroParisTech – le 23/10/2008

Quelques exemples de cartes obtenues en sortie

Extension spatiale : application au site de Kurchat ov

Concentration en 90Sr prédite en 2010

Page 38: Utilisation du métamodèle processus gaussien pour l'analyse de

38AgroParisTech – le 23/10/2008

Moyenne et variance empiriques des 300 cartes

Extension spatiale : application au site de Kurchat ov

Page 39: Utilisation du métamodèle processus gaussien pour l'analyse de

39AgroParisTech – le 23/10/2008

Etape 1 : DEtape 1 : Déécomposition spatiale des 300 cartes composition spatiale des 300 cartes Centrage des cartes (moyenne empirique)

Décomposition sur une base d’ondelette (Daubechies)

Tri des coefficients par valeur moyenne en norme L2

Etape 2 : ModEtape 2 : Modéélisation des coefficients en fonction de Xlisation des coefficients en fonction de XModModéélisation des 100 premiers lisation des 100 premiers coeffcoeff par par mméétamodtamodèèlele PG (contrôle PG (contrôle de la de la prpréédictivitdictivitéé par Qpar Q22))

ModModéélisation des coefficients 101 lisation des coefficients 101 àà 1000 par r1000 par réégression lingression linééaire aire simple (avec ssimple (avec séélection par AIC)lection par AIC)

Etape 3 : PrEtape 3 : Préédiction pour un nouveau jeu ddiction pour un nouveau jeu d’’entrentréée e x*

x* => prediction des coefficients => reconstitution de la carte

Analyse de sensibilitAnalyse de sensibilitéé ::

Obtention de cartes spatiales dObtention de cartes spatiales d’’indices de Sobolindices de Sobol

Extension spatiale : application au site de Kurchat ov

Page 40: Utilisation du métamodèle processus gaussien pour l'analyse de

40AgroParisTech – le 23/10/2008

Etape 1 : DEtape 1 : Déécomposition spatiale des 300 cartes composition spatiale des 300 cartes Centrage des cartes (moyenne empirique)

Décomposition sur une base d’ondelette (Daubechies)

Tri des coefficients par valeur moyenne en norme L2

Etape 2 : ModEtape 2 : Modéélisation des coefficients en fonction de Xlisation des coefficients en fonction de XModModéélisation des 100 premiers lisation des 100 premiers coeffcoeff par par mméétamodtamodèèlele PG (contrôle PG (contrôle de la de la prpréédictivitdictivitéé par Qpar Q22))

ModModéélisation des coefficients 101 lisation des coefficients 101 àà 1000 par r1000 par réégression lingression linééaire aire simple (avec ssimple (avec séélection par AIC)lection par AIC)

Etape 3 : PrEtape 3 : Préédiction pour un nouveau jeu ddiction pour un nouveau jeu d’’entrentréée e x*

x* => prediction des coefficients => reconstitution de la carte

Analyse de sensibilitAnalyse de sensibilitéé ::

Obtention de cartes spatiales dObtention de cartes spatiales d’’indices de Sobolindices de Sobol

Extension spatiale : application au site de Kurchat ov

Page 41: Utilisation du métamodèle processus gaussien pour l'analyse de

41AgroParisTech – le 23/10/2008

Extension fonctionnelle : application au site de Ku rchatov

Moyenne du critMoyenne du critèère MSE pour diffre MSE pour difféérentes srentes séélection de coefficientslection de coefficients

Page 42: Utilisation du métamodèle processus gaussien pour l'analyse de

42AgroParisTech – le 23/10/2008

Etape 1 : DEtape 1 : Déécomposition spatiale des 300 cartes composition spatiale des 300 cartes Centrage des cartes (moyenne empirique)

Décomposition sur une base d’ondelette (Daubechies)

Tri des coefficients par valeur moyenne en norme L2

Etape 2 : ModEtape 2 : Modéélisation des coefficients en fonction de Xlisation des coefficients en fonction de XModModéélisation des 100 premiers lisation des 100 premiers coeffcoeff par par mméétamodtamodèèlele PG (contrôle PG (contrôle de la de la prpréédictivitdictivitéé par Qpar Q22))

ModModéélisation des coefficients 101 lisation des coefficients 101 àà 1000 par r1000 par réégression lingression linééaire aire simple (avec ssimple (avec séélection par AIC)lection par AIC)

Etape 3 : PrEtape 3 : Préédiction pour un nouveau jeu ddiction pour un nouveau jeu d’’entrentréée e x*

x* => prediction des coefficients => reconstitution de la carte

Extension spatiale : application au site de Kurchat ov

Analyse de sensibilitAnalyse de sensibilitéé ::

Obtention de cartes spatiales dObtention de cartes spatiales d’’indices de Sobolindices de Sobol

Page 43: Utilisation du métamodèle processus gaussien pour l'analyse de

43AgroParisTech – le 23/10/2008

Histogramme des Q2 obtenus pour la modélisationdes 100 premiers coefficients d’ondelette

Comportement fortement nonComportement fortement non--linlinééaire des aire des coeffcoeff ::

NNéécessitcessitéé dd’’utiliser un modutiliser un modèèle le pGpG

Extension spatiale : application au site de Kurchat ov

Page 44: Utilisation du métamodèle processus gaussien pour l'analyse de

44AgroParisTech – le 23/10/2008

Extension spatiale : application au site de Kurchat ov

Moyenne du critMoyenne du critèère MSE pour diffre MSE pour difféérentes stratrentes stratéégies gies

de modde modéélisation des coefficientslisation des coefficients

Page 45: Utilisation du métamodèle processus gaussien pour l'analyse de

45AgroParisTech – le 23/10/2008

Prédictivité du métamodèle fonctionnel

(pG pour les 100 premiers coeff + reg. Lin. pour les 101 à 1000.)

Carte du Q 2 obtenu par le métamodèle fonctionnel(leave-one-out sur les 300 cartes)

QQ22

Extension spatiale : application au site de Kurchat ov

Page 46: Utilisation du métamodèle processus gaussien pour l'analyse de

46AgroParisTech – le 23/10/2008

Cartes d’indices de Sobol du 1er ordre pour 6 entrées

Extension spatiale : application au site de Kurchat ov

Perméabilité couche 1 Perméabilité couche 2 Perméabilité couche 3

Kd couche 1 Kd couche 2 Infiltration forte ( rouge)

Page 47: Utilisation du métamodèle processus gaussien pour l'analyse de

47AgroParisTech – le 23/10/2008

Cartes d’indices de Sobol pour les entrées kd1, kd2 et i3

Extension spatiale : application au site de Kurchat ov

Kd couche 1 Kd couche 2

Infiltration forte (canalisations rouges)

Page 48: Utilisation du métamodèle processus gaussien pour l'analyse de

48AgroParisTech – le 23/10/2008

Cartes d’indices de Sobol pour les entrées kd1, kd2 et i3

Extension spatiale : application au site de Kurchat ov

Kd couche 1 Kd couche 2

Infiltration forte (canalisations rouges)

Page 49: Utilisation du métamodèle processus gaussien pour l'analyse de

49AgroParisTech – le 23/10/2008

Interprétation

Influence prédominante de 3 variables :coefficients de partage des deux premières couches (kd couche 1 et kdcouche 2) et intensité des fortes infiltrations

Stratégie de re-caractérisation

Influence légère des perméabilités des couches 2 et 3

Absence d’influence des autres variables

Influence du kd de la couche 2 : répartition de la couche 2- Cohérence avec la modélisation géologique

- Importance suggérée de la répartition de la couche 2

(simulations géostat. de la forme de la 2ème couche)

Sensibilité essentiellement du 1er ordre, peu d’interactions

Extension spatiale : application au site de Kurchat ov

Page 50: Utilisation du métamodèle processus gaussien pour l'analyse de

50AgroParisTech – le 23/10/2008

Proposition dProposition d’’un un mméétamodtamodèèlele fonctionnel fonctionnel

Décomposition spatiale + modélisation PG des coefficients

Obtention de cartes d’indices de sensibilité

Interprétation globale et locale

Stratégie de re-caractérisation, aide à la décision

PerspectivesPerspectives

Extension de lExtension de l’’exploitation du exploitation du mméétamodtamodèèlele fonctionnel :fonctionnel :

Intervalle de prédiction, bandes de confiance pour la carte

Sortie spatio-temporelle ou 3D

Prise en compte de paramètres d’entrée fonction de l’espace : cartes aléatoires en entrée => Simulation géostatistique

Conclusion et perspectives

MMééthodologie applicable thodologie applicable àà dd’’autres problautres probléématiques spatialesmatiques spatialesEx : rejet de polluants atmosphEx : rejet de polluants atmosphéériques, sriques, sééquestration gquestration gééologique du CO2ologique du CO2

Page 51: Utilisation du métamodèle processus gaussien pour l'analyse de

51AgroParisTech – le 23/10/2008

Guide méthodologique Reconnaissance du site polluReconnaissance du site polluéé & & DDéégagement dgagement d’’une problune probléématiquematique

ModModéélisation glisation gééologique, identification des ologique, identification des phphéénomnomèènes et des paramnes et des paramèètrestres

CaractCaractéérisation : risation : paramparamèètres + incertitudestres + incertitudes

ModModéélisation mathlisation mathéématique et matique et numnuméériquerique

Code de calculCode de calcul

MMéétamodtamodèèlele processus gaussienprocessus gaussien

Propagation dPropagation d’’incertitudeincertitudeAnalyse de sensibilitAnalyse de sensibilitéé CalibrationCalibration

Prise de dPrise de déécision finalecision finale

Planification Planification dd’’expexpéériencerience