Transcript
Page 1: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Resolution numerique de problemes de controleoptimal par une methode homotopique simpliciale

Pierre Martinon

novembre 2005

1

Page 2: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

2

Page 3: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Methode de tir et homotopie

3

Page 4: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Introduction

On souhaite resoudre numeriquement les problemes suivants:

• Probleme de transfert orbital a poussee faible(controle bang-bang, grand nombre de revolutions)• Problemes presentant des arcs singuliers.

Methodes directes (Discretisation etat / controle)

→ Probleme d’optimisation non-lineaireA priori mal adaptees pour un grand nombre de commutations.

Methodes indirectes (Conditions necessaires)

Basees sur le Principe du Maximum de Pontriaguine.Rapides et precises dans les cas favorables.

4

Page 5: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Methode de tir

Probleme de controle optimal → Systeme d’equations non lineaires

Probleme de depart (P)

↓Probleme aux deux bouts (BVP)

↓Probleme a valeur initiale (IVP)

↓Fonction de tir S

Resoudre S(z) = 0 → Trouver une solution de (P)

5

Page 6: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Difficultes d’application pour les problemes etudies

Transfert orbital: S est peu reguliere

La fonction de tir n’est pas differentiable (ni meme definie) partout.Il faut un bon point initial pour faire converger le tir simple.

Arcs singuliers: S est multi-valuee

→ Tir multiple: requiert la connaissance de la structure du controle(nombre d’arcs singuliers en particulier).

Comment resoudre ces difficultes ?

→ On utilise une methode homotopique pour obtenir lesinformations necessaires (point initial et structure du controle),sans connaissance a priori sur la solution du probleme.

6

Page 7: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Homotopie et chemin de zeros

Parametrer le probleme (P) par λ ∈ [0, 1]:

Famille de problemes (Pλ) telle que- (P0) soit suffisamment simple a resoudre.- (P1) soit le probleme originel (P).

On definit l’homotopie H parH : (z , λ) 7→ Sλ(z)

Methode homotopique (continuation)

- Partir d’un zero z0 connu de H(·, 0)- Suivre le chemin de zeros de H jusqu’a atteindre λ = 1- On a alors un zero z1 de H(·, 1) = S1 = S .

7

Page 8: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Resultats de convergence (cf J.Gergaud)

Convergence de l’homotopie

On note y = (x , p) ∈ Rn le couple etat-etat adjoint.H : [a, b]× Rn × U → R continu et convexe par rapport a u.Soit Γ(t, x , p) l’ensemble des solutions de minu∈U H(t, x , p, u).

Sous les bonnes hypotheses (en particulier Γ a valeurs compactesconvexes non vides et scs), de toute suite de solutions (yλk

) de(BVP)λk

(λk → 1), on peut extraire une sous suite (yk) verifiant:

(i) (yk) converge uniformement vers y solution de (BVP)1.(ii) (yk) converge *-faiblement vers y dans L∞n ([0, tf ]).et (iii) (uk) converge *-faiblement dans L∞n ([0, tf ]).

8

Page 9: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Algorithme simplicial

9

Page 10: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Principe: approximation affine par morceaux du chemin

On considere une homotopie H : Rn+1 → Rn.

Simplexe et face

On appelle simplexe l’enveloppe convexe de n + 2 pointsaffinement independants de Rn+1. On appelle k-face l’enveloppeconvexe de k sommets d’un simplexe (face pour k = n + 1).

Triangulation

On appelle triangulation toute famille denombrable T desimplexes de Rn+1 verifiant:• L’intersection de deux simplexes est soit une k-face soit vide.• T est localement finie.

Illustration des triangulations K1 et J310

Page 11: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Etiquetage des sommets

On definit l’etiquetage l par l(v i ) = H(z i , λi ), avec v i = (z i , λi ).On definit HT par interpolation affine sur les sommets dessimplexes de T .

Face completement etiquetee

Une face [v1, .., vn+1] est dite completement etiquetee ssi ellecontient un zero de HT , ceci restant vrai a une certaineperturbation pres (precisement, elle contient une solution vε del’equation HT (v) = ~ε pour tout ε > 0 suffisamment petit, avec~ε = (ε, .., εn)).

Propriete fondamentale

Tout simplexe possede soit aucune, soit exactement deux facescompletement etiquetees.

11

Page 12: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Algorithme simplicial general

Simplexe de depart donne (face completement etiquetee en λ = 0).Tant que l’on n’a pas atteint λ = 1- Determiner la seconde face compl. etiquetee du simplexe courant.- Construire l’unique simplexe partageant cette face (pivotage)→ nouveau simplexe courant.Fin Tant que

x*

x0

followed zero path zero of homotopy PL approximation completely labeled face transverse simplex

Illustration schematique en dimension 2

12

Page 13: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Proprietes

• Le chemin suivi ne reboucle pas sur lui-meme• Il est possible de suivre un chemin de rang non maximal• Adaptation possible au cas multi-value

Convergence pour H multi-valuee (cf Allgower-Georg)

On considere un algorithme simplicial utilisant une selection de Hcomme etiquetage et une triangulation raffinee de Rn × [0, 1[.Sous les hypotheses suivantes:(i) les faces generees restent dans K × [0, 1] (K compact).(ii) l’algorithme ne redescend pas en λ = 0.

Alors si H est scs et a valeurs convexes compactes, l’algorithmegenere une suite (zi , λi ) telle que λi → 1, et il existe une sous-suitequi converge vers (z , 1) tel que 0 ∈ H(z , 1).

13

Page 14: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Exemples de suivis pour diverses triangulations

−1.6 −1.55 −1.5 −1.45 −1.4 −1.35−1.5

−1.4

−1.30

0.2

0.4

0.6

0.8

1

Z1(0)

Z2(0)

Lam

bda

Lambda = 1X = −1.4185 −1.4173Simplx: 30

−1.6 −1.55 −1.5 −1.45 −1.4 −1.35−1.5

−1.4

−1.30

0.2

0.4

0.6

0.8

1

Z1(0)

Z2(0)

Lam

bda

Lambda = 1X = −1.4185 −1.4173Simplx: 33

−1.55 −1.5 −1.45 −1.4 −1.35 −1.3−1.5

−1.4

−1.30

0.2

0.4

0.6

0.8

1

Z1(0)

Z2(0)

Lam

bda

Lambda = 1X = −1.418 −1.4169Simplx: 32

Triangulations uniformes K1, J1,D1

−1.55 −1.5 −1.45 −1.4−1.55

−1.5

−1.45

−1.4

0

0.2

0.4

0.6

0.8

1

Z1(0)

Z2(0)

Lam

bda

Lambda = 1X = −1.4142 −1.4142Simplx: 100

−1.55 −1.5 −1.45 −1.4

−1.55

−1.5

−1.45

−1.4

0

0.2

0.4

0.6

0.8

1

Z1(0)

Z2(0)

Lam

bda

Lambda = 1X = −1.4142 −1.4142Simplx: 513

Triangulations raffinees J3 et J4

14

Page 15: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Homotopie de jonction

Objectif:

On souhaite pouvoir trouver une face etiquetee pour une taille detriangulation donnee, a un niveau λj donne.

Utilite:

• Initialisation du suivi de chemin (premiere face en λ = 0)• Changer de triangulation au cours du suivi• Raffinage de solution en λ = 1

Principe:

Homotopie intermediaire a λj fixe: on essaye de connecter uneapplication affine bien choisie a H(·, λj), en utilisant la taille detriangulation voulue. Le choix de l’application affine permetd’initialiser facilement cette homotopie de jonction.

15

Page 16: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Triangulation adaptative

Objectif: ameliorer la rapidite et/ou la precision du suivi

Triangulations raffinees ? Delicates a utiliser en pratique(taille figee des le depart, independamment du chemin)

Idee: adapter dynamiquement la triangulation au chemin suivi

A certains “etages” λ = λi du suivi de chemin:- on determine la nouvelle taille δ souhaitee.- on effectue une homotopie de jonction pour trouver une faceetiquetee de taille δ au niveau λi .- le suivi continue avec la nouvelle taille jusqu’au prochain etage.

2 mecanismes pour choisir la nouvelle taille:

Controle de deviation: adapter la taille a la precision du suivi.Deformation anisotropique: mieux coller a la direction du chemin.

16

Page 17: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Controle de deviation

Norme de H aux zeros de HT : indication de la precision du suivi.Suivant la qualite de cette indication, on dilate ou retrecituniformement la triangulation.

−1.8 −1.7 −1.6 −1.5 −1.4 −1.3 −1.6−1.4

−1.20

0.2

0.4

0.6

0.8

1

Illustration sur un exemple simple

Effet souhaite:

Accelerer le suivi, sans trop degrader la precision.

17

Page 18: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Deformation anisotropique

On evalue le poids relatif de chaque dimension dans le chemin suividepuis l’etage precedent. On agrandit (diminue) la triangulationsuivant les dimensions majoritaires (minoritaires).

δ1 = δ2 δ2 ← 2δ2 δ1 ← δ12 (δ1, δ2)← ( δ1

2 , 2δ2)

Effet souhaite:

Meilleure precision, permet d’equilibrer le controle de deviation.

18

Page 19: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Raffinage de solutions

Objectif: ameliorer la solution en λ = 1.

Premiere idee: triangulation raffinee avant λ = 1 pour finir le suivi

−1.6 −1.55 −1.5 −1.45 −1.4 −1.35 −1.3−1.6

−1.5

−1.4

−1.3

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Z2(0)

Z1(0)

Lam

bda

Lambda = 1X = −1.4144 −1.4144Simplx: 103

Inconvenient: on retrouve lesproblemes des triangulationsraffinees.

Seconde idee: effectuer une suite de jonctions en λ = 1

avec des triangulations successives de taille decroissante(cf algorithme de redemarrage de Merril)Efficace en general, mais cout des jonctions souvent eleve.

19

Page 20: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Conclusion

• L’utilisation des homotopies de jonction permet d’initialiserfacilement l’algorithme simplicial, et de realiser les changements detaille de la triangulation adaptative

• Pour la triangulation adaptative, on a tente de preserver larobustesse de l’algorithme simplicial (pas de derivees, memesreglages numeriques pour tous les problemes)

20

Page 21: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Transfert orbital

21

Page 22: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Presentation du probleme

Probleme de transfert orbital (CNES)

Orbite initiale: ellipse faiblement inclinee (7 degres)Orbite finale: geostationnaire geosynchroneCritere: maximisation de la masse finale (charge utile)On considere des propulseurs a poussee faible.

−50 0 50−40

−30

−20

−10

0

10

20

30

40

Difficultes:

• Critere masse → controle bang-bang• Poussee faible → grand nombre de revolutions

22

Page 23: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Formulation du probleme

Modelisation des forces: force centrale + poussee du propulseur{r = −µ0

r|r |3 + u

m

m = −TMaxIspg0

|u|

µ0 = GmT constante gravitationnelle de la Terre.TMax la poussee maximale (|u| ≤ 1).Isp l’impulsion specifique du propulseur.

Pour la resolution pratique (cf T.Haberkorn):

- on minimise la consommation de carburant.- coordonnees non cartesiennes, issues des parametres orbitaux.- integration suivant la longitude et non le temps.- temps final et longitude finale fixes.

23

Page 24: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Homotopie sur le critere

Critere “energie vers masse”

On part d’un critere quadratique (minimisation d’une “energie”)pour arriver au critere consommation:

Jλ = Min

∫ tf

t0

λ|u(t)|+ (1− λ)|u(t)|2 dt.

Homotopie: fonction de tir correspondante pour λ ∈ [0, 1]

H : (z , λ) 7→ Sλ(z)

• λ < 1: controle continu (Hamiltonien strictement convexe)• λ = 1: controle bang-bang (on retrouve le probleme originel)

24

Page 25: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Suivi de chemin et resultats

Initialisation en λ = 0:

On effectue un tir en integrant a pas fixe (Runge Kutta 4).Cette solution suffit pour la premiere jonction du simplicial.

Resultats

Tmax Norme initiale Simplexes Temps Objectif Norme finale

10N 3.29 10−4 1336 20 121.21 3.43 10−10

5N 1.55 10−4 1909 51 121.58 4.63 10−10

1N 3.09 10−3 840 132 121.78 8.02 10−11

0.5N 3.58 10−3 2028 548 121.69 1.12 10−9

0.2N 6.34 10−3 912 661 121.71 3.21 10−9

0.1N 8.33 10−3 775 1252 121.70 1.75 10−6

Le suivi se deroule sans difficultes majeures jusqu’en λ = 1.Le nombre de simplexes ne semble pas lie a la poussee TMax .Le tir donne des resultats coherents avec ceux de T.Haberkorn.

25

Page 26: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Transfert a TMax = 10 Newtons

Solution en λ = 1

10 20 30 40 50−1

0

1CONTROL

10 20 30 40 50−1

0

1

10 20 30 40 50−1

0

1

10 20 30 40 500

0.5

1|u|

0

50

P

STATE

−101

e x

−0.020

0.02

e y

−0.10

0.1

h x

−202

x 10−3

h y

050

100

L

130014001500

m

20 40130132134

t f−5

05

COSTATE

−1000

100

−505

37.437.637.8

−1−0.8

−505

−0.10

0.1

20 400

0.5

x 10−10

−50 0 50

−40

−30

−20

−10

0

10

20

30

40

Evolution du controle le long du chemin

10 20 30 40 500

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

TIME

λ=0λ=0.5λ=1

CONT

ROL N

ORM

26

Page 27: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Comparaison des integrateurs: Trajectoires pour 10,1,0.1NRK

F45

−50 0 50

−40

−30

−20

−10

0

10

20

30

40

−40 −20 0 20 40−40

−30

−20

−10

0

10

20

30

40

−40 −20 0 20 40−40

−30

−20

−10

0

10

20

30

40

DO

P853

−40 −20 0 20 40−40

−30

−20

−10

0

10

20

30

40

−40 −20 0 20 40−40

−30

−20

−10

0

10

20

30

40

−40 −20 0 20 40−40

−30

−20

−10

0

10

20

30

40

OD

EX

−50 0 50−40

−30

−20

−10

0

10

20

30

40

−50 0 50−40

−30

−20

−10

0

10

20

30

40

−40 −20 0 20 40−40

−30

−20

−10

0

10

20

30

40

27

Page 28: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Pas d’integration suivant la poussee TMax

Pour chacun des trois integrateurs, on a:

Integration steps × TMax ≈ C te

10−1100101

103

104

105

Tmax

(N)

STE

PS

RKF45, DOP835 and ODEX Integration steps vs TMax

RKF45DOP853ODEX

Note: echelle logarithmique pour les deux axes

Confirme la tres grande regularite du probleme par rapport a Tmax

(on avait deja tf × TMax ≈ C te , Lf × TMax ≈ C te)

28

Page 29: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Trajectoire et pas - RKF45

• RKF45: methodes de Runge Kutta imbriquees (4,5)

10 20 30 40 50−0.5

0

0.5

1RKF45: SWITCHING FUNCTION and INTEGRATION STEPSIZE

TIME

SWITCHSTEPSIZE

10 20 30 40 5010

−10

10−8

10−6

10−4

10−2

100

RKF45: Integrator Stepsize

Time

h

• Disposition reguliere des points, 3 plages de valeurs du pas• Plus grand pas sur les arcs sans poussee (seule L evolue)• Pas extremement faible aux commutations (10−9)

29

Page 30: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Trajectoire et pas - DOP853

• DOP853: methodes de Runge Kutta imbriquees (8,5-3)

10 20 30 40 50−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

1.2DOP853: SWITCHING FUNCTION and INTEGRATION STEPSIZE

TIME

SWITCHSTEPSIZE

10 20 30 40 5010

−10

10−8

10−6

10−4

10−2

100

DOP853: Integrator Stepsize

Time

h

• Similarite avec RKF45 dans la repartition de points• Globalement, plus grand pas que pour RKF45 (ordre plus eleve)• Toujours tres faible pas aux commutations

30

Page 31: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Trajectoire et pas - ODEX

• ODEX: Extrapolation (ordre variable)

5 10 15 20 25 30 35 40 45 50−2

0

2

4

6

8

10

12

14

ODEX: SWITCH, STEPSIZE AND ORDER

TIME

Ord

er

SWITCHSTEPSIZEORDER

10 20 30 40 5010

−10

10−8

10−6

10−4

10−2

100

101

ODEX: Integrator Stepsize

Timeh

• Disposition moins reguliere des points• Presence de tres grands pas (extrapolation, ordre eleve)• Toujours tres faible pas aux commutations• Ordre generalement eleve (≥ 8), redescend aux commutations

31

Page 32: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Triangulation adaptative

Nombre de simplexes parcourus le long du chemin(uniforme / adaptatif) pour TMax = 10, 5, 1, 0.5, 0.2 et 0.1N

0 0.2 0.4 0.6 0.8 10

500

1000

1500

2000

2500

SP

LX

LAMBDA

10N − UNIFORM AND ADAPTIVE TRIANGULATIONS (K1 0.1 / 0.01)

UNIFORMADAPTIVE

0 0.2 0.4 0.6 0.8 10

200

400

600

800

1000

1200

1400

1600

1800

2000

LAMBDAS

PLX

5N − UNIFORM AND ADAPTIVE TRIANGULATIONS (K1 0.1)

UNIFORMADAPTIVE

0 0.2 0.4 0.6 0.8 10

200

400

600

800

1000

1200

1400

1600

1800

LAMBDA

SP

LX

1N − UNIFORM AND ADAPTIVE TRIANGULATIONS (K1 0.1 / 0.01)

UNIFORMADAPTIVE

0 0.2 0.4 0.6 0.8 10

500

1000

1500

2000

2500

3000

3500

LAMBDA

SP

LX

0,5N − UNIFORM AND ADAPTIVE TRIANGULATIONS (K1 0.1 / 0.01)

UNIFORMADAPTIVE

0 0.2 0.4 0.6 0.8 10

200

400

600

800

1000

1200

1400

1600

1800

LAMBDA

SP

LX

0,2N − UNIFORM AND ADAPTIVE TRIANGULATIONS (K1 0.1 / 0.01)

UNIFORMADAPTIVE

0 0.2 0.4 0.6 0.8 10

500

1000

1500

LAMBDA

0,1N − UNIFORM AND ADAPTIVE TRIANGULATIONS (K1 0.1 / 0.01)

UNIFORMADAPTIVE

SP

LX

• Moins de simplexes parcourus (et suivi plus lisse)• Meilleure precision finale (tir plus rapide)• MAIS: le cout des jonctions annule parfois le gain ainsi realise !

32

Page 33: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Conclusion

• Resolution du probleme jusqu’a TMax = 0.1N, on retrouve desresulats coherents avec ceux de l’homotopie differentielle (pour untemps 3 a 5 fois superieur).

• Les 3 integrateurs etudies parviennent a realiser l’integration,mais les commutations (plus de 1500 a 0.1N) necessitent des pastres faibles (10−9).

• Mode adaptatif qualitativement satisfaisant (moins de simplexes,suivi plus precis) mais souffre parfois du cout numerique eleve desjonctions.

33

Page 34: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Arcs singuliers

34

Page 35: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Introduction

Arc singulier:

Intervalle non reduit a un point sur lequel la minimisation de H nedetermine pas u∗ de facon unique.

Inclusion differentielle:

ϕ la dynamique du couple etat-etat adjoint y = (x , p).Γ l’expression du controle optimal, Γ est multi-valuee et on a

(BVP)

{y ∈ Φ(y) = ϕ(y , Γ(y)) pp sur [t0, tf ]Conditions aux limites

Resolution par Tir multiple:

Requiert typiquement la connaissance de la structure singuliere(nombre, localisation approximative et nature des arcs).

35

Page 36: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Probleme 1: peche optimale

(P1)

Min

∫ 100 ( c

x(t) − E ) u(t) Umax dt

x(t) = rx(t) (1− x(t)k ) − u(t) Umax

0 ≤ u(t) ≤ 1 ∀t ∈ [0, 10]x(0) = 70.106 x(10) libre

E = 1, c = 17.5 .106, r = 0.71, k = 80.5 .106, Umax = 20 .106

Fonction de commutation et controle optimal:

ψ(t) =c

x(t)− E − p(t),

u∗(t) = 0 si ψ(t) > 0u∗(t) = 1 si ψ(t) < 0u∗(t) ∈ [0, 1] si ψ(t) = 0.

Sur un arc singulier: via ψ = 0

u∗sing = k r2 ( c

x−p) Umax

(cx −

ck − p + 2px

k −2px2

k2

)36

Page 37: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Probleme 2: regulateur quadratique

(P2)

Min 12

∫ 50 (x2

1 (t) + x22 (t)) dt

x1(t) = x2(t)x2(t) = u(t)−1 ≤ u(t) ≤ 1 ∀t ∈ [0, 5]x(0) = (0, 1)x(5) libre.

Fonction de commutation et controle optimal:

ψ(t) = p2(t),

{u∗(t) = − sign p2(t) si ψ(t) 6= 0u∗(t) ∈ [−1, 1] si ψ(t) = 0.

Sur un arc singulier: via ψ = 0

u∗sing (t) = x1(t)

37

Page 38: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Homotopie sur le critere: perturbation quadratique

Ajout d’une perturbation quadratique au critere (λ ∈ [0, 1])

On regularise ces problemes en ajoutant un terme en u2 au critere(note: c

x − E < 0).

(Jλ1 ) Min

∫ 10

0

(c

x− E

)(u − (1− λ) u2) Umax dt

(Jλ2 ) Min

1

2

∫ 5

0(x2

1 + x22 ) + (1− λ)u2 dt

• λ < 1: Hamiltonien strictement convexe, u∗ fonction continue.• λ = 1: on retrouve les deux problemes de depart.

38

Page 39: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Suivi de chemin

Initialisation en λ = 0 sans difficulte, le suivi commence bien.Evolution du controle et de la fonction de commutation ?

0 2 4 6 8 100.4

0.5

0.6

0.7

0.8

0.9

1CONTROL EVOLUTION

TIME

U

0 2 4 6 8 10−0.8

−0.7

−0.6

−0.5

−0.4

−0.3

−0.2

−0.1

0SWITCHING FUNCTION EVOLUTION

TIME

ψ

(P1): u et ψ pour λ = 0, 0.5, 0.75, 0.9 et 0.95

On devine l’apparition d’un arc singulier quand λ→ 1:

- controle u demeure non extremal- ψ se rapproche de 0

39

Page 40: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Mais le suivi se degrade brutalement quand λ se rapproche de 1

Instabilite numerique lorsque ψ proche de 0.

0 2 4 6 8 10−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1SWITCHING FUNCTION

TIME

ψ

CROSSINGTURNING BACK

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1CONTROL EVOLUTION

TIME

U

CROSSINGTURNING BACK

λ = 1 - Deux structures de controle - (P1)

• Suivant le signe de ψ en sortie: 2 controles bang-bang differents.• Quand λ→ 1, 2 structures aux sommets des simplexes.• L’algorithme converge en λ = 1, mais perd la structure singuliere.• En λ = 1: Discontinuite de S au voisinage de l’arc singulier.

40

Page 41: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Formulation BVP discretise

On discretise les equations du BVP:

Schema Euler ou Trapezes (→ homotopie a valeurs convexes).(xi , pi ) inconnues, ui obtenus par les CN usuelles.Conditions de raccordement aux ti : continuite de x , p

Matchcond

{xi − (xi−1 + h ∂x

∂t (ti−1, xi−1, pi−1, u∗i−1))

pi − (pi−1 + h ∂p∂t (ti−1, xi−1, pi−1, u

∗i−1))

Note: finesse de discretisation limitee par la taille du probleme.

Resultats

• Converge sans difficultes en λ = 1.• Bonne approximation de x , p.• Detection de la structure singuliere sur ψ.• Raccordements: erreurs residuelles liees aux ui sur l’arc singulier.

41

Page 42: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Resolution precise

Tir multiple adapte au cas singulier

Utilise l’expression algebrique du controle singulier using .Les bornes des arcs singuliers sont des inconnues.Initialisation avec les informations obtenues par les homotopies.

0 5 10

0.7

0.8

0.9

1U

0 5 10−0.5

−0.4

−0.3

−0.2

−0.1

Psi

SWITCHING FUNCTION

0 5 103

3.5

4

4.5

5

5.5

6

6.5

7x 10

7 X

0 5 10−0.7

−0.6

−0.5

−0.4

−0.3

−0.2

−0.1

0P

0 2 4−1

−0.5

0

0.5U

0 2 4−0.5

0

0.5

1

1.5

Psi

SWITCHING FUNCTION0 5

0

0.1

0.2

0.3

0.4

X1

0 5−0.5

0

0.5

1X2

0 5−0.5

0

0.5

1P1

0 5−0.5

0

0.5

1

1.5P2

• Solution precise, convergence quasi instantanee.• On retrouve clairement les arcs singuliers prevus.• Demande un bon point initial (structure correcte).

42

Page 43: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Qualite des solutions approchees ?

Comparaison des formulations

- Tir simple (λ = 0.95 et 0.925, avant la perte de structure)- BVP discretise (50 et 20 points, Trapezes avec raffinage)- Solution de reference

0 5 100

0.5

1CONTROL

0 5 10−0.5

−0.4

−0.3

−0.2

−0.1

TIME

Psi

SWITCHING FUNCTION ψ

0 5 103

3.5

4

4.5

5

5.5

6

6.5

7x 10

7 X

0 5 10−0.7

−0.6

−0.5

−0.4

−0.3

−0.2

−0.1

0P

STRUCTUREDSINGLE (λ=0.95)DISCRETIZED

0 2 4−1

−0.5

0

0.5

1CONTROL

0 2 4−0.5

0

0.5

1

1.5

2

TIME

Psi

SWITCHING FUNCTION ψ0 5

0

0.1

0.2

0.3

0.4

STATE X1

0 5−0.5

0

0.5

1STATE X2

0 5−0.5

0

0.5

1COSTATE P1

0 5−1

0

1

2COSTATE P2

STRUCTUREDSINGLE (λ=0.925)DISCRETIZED

• Solution discretisee tres proche (sauf pour le controle singulier...)43

Page 44: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Formulation Controle discretise

Inspiree des methodes directes:

- le controle discretise fait partie des inconnues, x , p sont integres.- conditions sur les ui : ui ∈ Γ(ti , xi , pi ) (a formaliser...).

0 2 4 6 80.5

1

1.5U

0 2 4 6 8−0.5

−0.4

−0.3

−0.2

−0.1

Psi

ψ

0 53

3.5

4

4.5

5

5.5

6

6.5

7x 10

7 X

0 5

−0.6

−0.5

−0.4

−0.3

−0.2

−0.1

0P

0 2 4−1.5

−1

−0.5

0

0.5

1Control u1

0 2 4−0.5

0

0.5

1

1.5

Psi

Switching function ψ0 2 4

0

0.1

0.2

0.3

0.4

State x1

0 2 4−0.5

0

0.5

1State x2

0 2 4−0.5

0

0.5

1Costate p1

0 2 4−0.5

0

0.5

1

1.5Costate p2

Controle discretise (RK4 - 50 points) - (P1) et (P2)

• Bonne approximation de x , p, ψ.• Approximation du controle singulier sans l’expression algebrique.• MAIS: implementation delicate des conditions sur les ui .

44

Page 45: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Comparaison avec une methode directe

Discretisation de x et de u

Pb controle optimal → Pb optimisation non lineaireResolution avec KNITRO (sous-problemes barriere, SQP).

0 5 100.6

0.65

0.7

0.75

0.8

0.85

0.9

0.95

1Control

time

U

0 5 103

3.5

4

4.5

5

5.5

6

6.5

7x 10

7

time

X

State

0 1 2 3 4 5

−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

Control

time

U

0 50

0.2

0.4

time

X1

State

0 5−0.5

0

0.5

1

time

X2

Methode directe (RK4 - 1000 points) - (P1) et (P2)

• On retrouve la structure singuliere.• Solution un peu bruitee sur les arcs singuliers (commutations).

45

Page 46: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Conclusion

• Les deux homotopies (tir simple et BVP discretise) convergent.

• Tir simple: devine la structure singuliere mais la perd en λ = 1.

• Formulation BVP discretise: bonne approximation de x , p et ψ

• Resolution precise par une methode de type tir multiple.

• Formulation controle discretise: a formaliser, mais premiersresultats numeriques encourageants.

• Methode directe: resultats coherents pour un temps comparable.

46

Page 47: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Conclusions et Perspectives

47

Page 48: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Conclusions generales

• Pour les problemes etudies (transfert orbital et arcs singuliers),l’homotopie a permis de determiner la structure du controle etd’obtenir un point initial satisfaisant, sans connaissance a priori.

• Grace a ces informations, on parvient ensuite a resoudreprecisement les problemes par les methodes de tir.

• L’algorithme simplicial et les methodes de tir utilisees ont eteimplementees dans un unique programme (Simplicial), utilise pourtoute les experimentations numeriques (sauf methodes directes).Codes externes utilises: HYBRD, RKF45 (Shampine/Watts),DOP853 (Hairer/Wanner), ODEX (Hairer/Wanner)

48

Page 49: Résolution numérique de problèmes de contrôle optimal ... · ... approximation affine par morceaux du chemin ... Simplexe et face ... On ´evalue le poids relatif de chaque dimension

Perspectives

• Algorithme simplicial:- ameliorer cout des jonctions pour l’adaptatif et le raffinage- introduire des mecanismes d’acceleration (cf Newton / secante)

• Travailler sur la methode de tir elle-meme:- adaptation de l’integration (detection des discontinuites)- meilleur calcul des derivees (IND)

• Poursuivre sur les formulations discretisees:- schemas de discretisation plus evolues(symplectique ? cf Bonnans/Laurent-Varin)- mieux formaliser la formulation controle discretise

• Comparaison plus poussee avec les methodes directes

• Contraintes d’etat (formulation, homotopie ?)

49


Top Related