dynamique et contrôle des systèmes nicolas pcas.ensmp.fr/~tcsysdyn/lect6.pdf · 2009-04-29 · k...

43
Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR Automatique Dynamique et Contrôle des Systèmes NICOLAS PETIT Centre Automatique et Systèmes Unité Mathématiques et Systèmes MINES ParisTech [email protected] 25 mars 2009 Amphi 6

Upload: others

Post on 05-Aug-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

AutomatiqueDynamique et Contrôle des Systèmes

NICOLAS PETIT

Centre Automatique et SystèmesUnité Mathématiques et Systèmes

MINES [email protected]

25 mars 2009Amphi 6

Page 2: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Plan de l’amphi 6

1 Stabilisation et placement de pôles

2 Optimisation de transitoires

3 Contrôleur LQ

4 Régulateur LQR

Page 3: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Stabilisation et placement de pôles

ddt

x = Ax + Bu

x ∈ Rn, A: matrice n × n, B: matrice n ×mEn boucle ouverte: on peut trouver une loi horaire[0, tf ] 3 t 7→ u(t) amenant le système de tout pointx(0) = p à tout point x(tf ) = q sous hypothèse decommandabilité

C = (B,AB, . . .An−1B) est de rang n = dim(x)

En boucle fermée: on cherche à modifier le système parbouclage

u = Kx

en particulier à le stabiliser. (A + BK )

Page 4: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Stabilisation et placement de pôles

ddt

x = Ax + Bu

x ∈ Rn, A: matrice n × n, B: matrice n ×mEn boucle ouverte: on peut trouver une loi horaire[0, tf ] 3 t 7→ u(t) amenant le système de tout pointx(0) = p à tout point x(tf ) = q sous hypothèse decommandabilité

C = (B,AB, . . .An−1B) est de rang n = dim(x)

En boucle fermée: on cherche à modifier le système parbouclage

u = Kx

en particulier à le stabiliser. (A + BK )

Page 5: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Page 6: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Exemple de stabilisation

A =

1 2 3−1 4 01 2 2

, B =

010

A + BK = A + B (k1 k2 k3) =

1 2 3−1 + k1 4 + k2 k3

1 2 2

Valeurs propres souhaitées −1, −2, −3On identifie le polynôme caractéristiques3 + (−k2 − 7)s2 + (−2k1 + 3k2 − 2k3 + 13)s +−2k1 + k2 + 6 = 0à (s + 1)(s + 2)(s + 3) = s3 + 6s2 + 11s + 6 = 0

3 équations linéaires à 3 inconnues

Page 7: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Exemple de stabilisation

A =

1 2 3−1 4 01 2 2

, B =

010

A + BK = A + B (k1 k2 k3) =

1 2 3−1 + k1 4 + k2 k3

1 2 2

Valeurs propres souhaitées −1, −2, −3On identifie le polynôme caractéristiques3 + (−k2 − 7)s2 + (−2k1 + 3k2 − 2k3 + 13)s +−2k1 + k2 + 6 = 0à (s + 1)(s + 2)(s + 3) = s3 + 6s2 + 11s + 6 = 0

3 équations linéaires à 3 inconnues

Page 8: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Exemple de stabilisation

A =

1 2 3−1 4 01 2 2

, B =

010

A + BK = A + B (k1 k2 k3) =

1 2 3−1 + k1 4 + k2 k3

1 2 2

Valeurs propres souhaitées −1, −2, −3On identifie le polynôme caractéristiques3 + (−k2 − 7)s2 + (−2k1 + 3k2 − 2k3 + 13)s +−2k1 + k2 + 6 = 0à (s + 1)(s + 2)(s + 3) = s3 + 6s2 + 11s + 6 = 0

3 équations linéaires à 3 inconnues

Page 9: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Si le système est commandable, on aura toujours une solution.Avec une seule commande: formule d’Ackermann

K = [0 ...0 1] C−1P(A)

où P est le polynôme caractéristique désiré, C la matrice decommandabilité

Placement de pôles

Si la paire (A,B) est commandable alors, pour toute matriceréelle F de taille n × n, il existe une matrice m × n, K (nonnécessairement unique si m > 1), telle que le spectre deA + BK coïncide avec celui de F

Comment choisir les valeurs propres? à parties réelles <0, trèsnegatives le système sera très rapide, éloignées des valeurspropres en boucle ouverte on trouvera des gains forts.

Page 10: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Si le système est commandable, on aura toujours une solution.Avec une seule commande: formule d’Ackermann

K = [0 ...0 1] C−1P(A)

où P est le polynôme caractéristique désiré, C la matrice decommandabilité

Placement de pôles

Si la paire (A,B) est commandable alors, pour toute matriceréelle F de taille n × n, il existe une matrice m × n, K (nonnécessairement unique si m > 1), telle que le spectre deA + BK coïncide avec celui de F

Comment choisir les valeurs propres? à parties réelles <0, trèsnegatives le système sera très rapide, éloignées des valeurspropres en boucle ouverte on trouvera des gains forts.

Page 11: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Si le système est commandable, on aura toujours une solution.Avec une seule commande: formule d’Ackermann

K = [0 ...0 1] C−1P(A)

où P est le polynôme caractéristique désiré, C la matrice decommandabilité

Placement de pôles

Si la paire (A,B) est commandable alors, pour toute matriceréelle F de taille n × n, il existe une matrice m × n, K (nonnécessairement unique si m > 1), telle que le spectre deA + BK coïncide avec celui de F

Comment choisir les valeurs propres? à parties réelles <0, trèsnegatives le système sera très rapide, éloignées des valeurspropres en boucle ouverte on trouvera des gains forts.

Page 12: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Si le système est commandable, on aura toujours une solution.Avec une seule commande: formule d’Ackermann

K = [0 ...0 1] C−1P(A)

où P est le polynôme caractéristique désiré, C la matrice decommandabilité

Placement de pôles

Si la paire (A,B) est commandable alors, pour toute matriceréelle F de taille n × n, il existe une matrice m × n, K (nonnécessairement unique si m > 1), telle que le spectre deA + BK coïncide avec celui de F

Comment choisir les valeurs propres? à parties réelles <0, trèsnegatives le système sera très rapide, éloignées des valeurspropres en boucle ouverte on trouvera des gains forts.

Page 13: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Liens avec la forme normale

ddt

x = Ax + Bu, (dim B = n × 1)

Changement de variables z = Mx , v = Ex + Nu mettant lesystème sous forme normale de Brunovsky

ddt

z1 = z2, . . . ,ddt

zn−1 = zn,ddt

zn = v

c.-à-d. dn

dtn z1 = vForme canonique

A1 =

0 1 0 ... 00 0 1 ... ...... ... ... ...0 ... 0 0 10 ... 0 0 0

,B1 =

00...1

Page 14: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Liens avec la forme normale

ddt

x = Ax + Bu, (dim B = n × 1)

Changement de variables z = Mx , v = Ex + Nu mettant lesystème sous forme normale de Brunovsky

ddt

z1 = z2, . . . ,ddt

zn−1 = zn,ddt

zn = v

c.-à-d. dn

dtn z1 = vForme canonique

A1 =

0 1 0 ... 00 0 1 ... ...... ... ... ...0 ... 0 0 10 ... 0 0 0

,B1 =

00...1

Page 15: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

En boucle fermée, v = K1z: on obtient A1 + B1K1

A1 + B1K1 =

0 1 0 ... 00 0 1 ... ...... ... ... ...0 ... 0 0 1k0 k1 ... ... kn−1

Polynôme caractéristique

sn − kn−1sn−1 − ...− k1s − k0 = 0

à identifier au polynôme désiré.Enfin, changement de variables inverse pour revenir dans lesvariables d’origine (x ,u)

Page 16: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Optimisation de transitoires

Exemple: réentrée atmosphérique, optimisation d’unetrajectoire (loi horaire)

Page 17: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

“Rebonds atmosphériques”, osc. phugoïde, Zhukovskii 1949

Page 18: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Linéarisé tangent autour d’une trajectoire (xr(t), ur(t))

OptimisationLa trajectoire elle même est issue d’une optimisation

∆x(0) = ∆x0

ddt ∆x(t) =

(∂f∂x

(xr (t),ur (t))

)︸ ︷︷ ︸

A(t)

·∆x(t) +

(∂f∂u

(xr (t),ur (t))

)︸ ︷︷ ︸

B(t)

·∆u(t)

ddt

x = A(t)x + B(t)u(t)

Problème à résoudre

Étant donné un point de départ (perturbation), on cherche lesmeilleures corrections (autour de la trajectoire)

Page 19: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Optimisation de dimension finie

min x ∈ Rn

h1(x) = 0, . . . ,hp(x) = 0

J(x)

- on rajoute des multiplicateurs de Lagrange λ = (λ1, ..., λp) ∈ Rp

- on introduit le Lagrangien

L(x , λ) = J(x) +

p∑i=1

λihi(x) = J(x) + λT h(x)

- on explicite les conditions de stationnarité du Lagrangien enfaisant comme si les variables x et λ pouvaient varier librement.Ces conditions sont δL = 0 pour toutes variationsinfinitésimales δx et δλ des variables x et λ

Page 20: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Optimisation de dimension finie

min x ∈ Rn

h1(x) = 0, . . . ,hp(x) = 0

J(x)

- on rajoute des multiplicateurs de Lagrange λ = (λ1, ..., λp) ∈ Rp

- on introduit le Lagrangien

L(x , λ) = J(x) +

p∑i=1

λihi(x) = J(x) + λT h(x)

- on explicite les conditions de stationnarité du Lagrangien enfaisant comme si les variables x et λ pouvaient varier librement.Ces conditions sont δL = 0 pour toutes variationsinfinitésimales δx et δλ des variables x et λ

Page 21: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Optimisation de dimension finie

min x ∈ Rn

h1(x) = 0, . . . ,hp(x) = 0

J(x)

- on rajoute des multiplicateurs de Lagrange λ = (λ1, ..., λp) ∈ Rp

- on introduit le Lagrangien

L(x , λ) = J(x) +

p∑i=1

λihi(x) = J(x) + λT h(x)

- on explicite les conditions de stationnarité du Lagrangien enfaisant comme si les variables x et λ pouvaient varier librement.Ces conditions sont δL = 0 pour toutes variationsinfinitésimales δx et δλ des variables x et λ

Page 22: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Optimisation de dimension finie

min x ∈ Rn

h1(x) = 0, . . . ,hp(x) = 0

J(x)

- on rajoute des multiplicateurs de Lagrange λ = (λ1, ..., λp) ∈ Rp

- on introduit le Lagrangien

L(x , λ) = J(x) +

p∑i=1

λihi(x) = J(x) + λT h(x)

- on explicite les conditions de stationnarité du Lagrangien enfaisant comme si les variables x et λ pouvaient varier librement.Ces conditions sont δL = 0 pour toutes variationsinfinitésimales δx et δλ des variables x et λ

Page 23: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Théorème de stationnaritéSi (x∗, λ∗) est un point stationnaire du LagrangienL(x , λ) = J(x) + λT h(x) (i.e. ∂L

∂x = 0, ∂L∂λ = 0, (n+p équations))alors x∗ est un point stationnaire de J sous les contraintes h,i.e. un candidat à être solution de

min x ∈ Rn

h1(x) = 0, . . . ,hp(x) = 0

J(x)

Page 24: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Calcul des variations et adjoint

minx ,u

l(x(tf )) +

∫ tf

0L(x(t),u(t)) dt

[0, tf ] 3 t 7→ (x(t),u(t)) ∈ Rn × Rm

x(0) = x0

f1(x(t),u(t))− ddt x1(t) = 0, t ∈ [0, tf ]

...fn(x(t),u(t))− d

dt xn(t) = 0, t ∈ [0, tf ]

On introduit le Lagrangien

L(x ,u, λ) = l(x(tf )) +

∫ tf

0L(x(t),u(t)) dt

+n∑

i=1

∫ tf

0λi(t)

(fi(x(t),u(t))− d

dtxi(t)

)dt

Page 25: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Le Lagrangien L est une fonctionnelle

On écrit les conditions de stationnarité de L pour toutesvariations

t 7→ δλ(t)t 7→ δu(t)t 7→ δx(t) (δx(0) = 0)

Page 26: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Conditions de stationnarité (1)

Pour toute fonction t 7→ δλ(t) ∈ Rn on doit avoir

δL =

∫ tf

0δλT (t)

(f (x(t),u(t))− d

dtx(t)

)dt = 0

La seule possibilité 1 est qu’à chaque instant t ∈ [0, tf ],

f (x(t),u(t))− ddt

x(t) = 0

1On se reportera au lemme de du Bois-Reymond.

Page 27: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Conditions de stationnarité (2)

Pour toute fonction t 7→ δu(t) ∈ Rm, on doit avoir

δL =

∫ tf

0

(∂L∂u

∣∣∣∣(x(t),u(t))

δu(t) + λT (t)∂f∂u

∣∣∣∣(x(t),u(t))

δu(t)

)dt = 0

En mettant δu en facteur on obtient

δL =

∫ tf

0

(∂L∂u

∣∣∣∣(x(t),u(t))

+ λT (t)∂f∂u

∣∣∣∣(x(t),u(t))

)δu(t) dt = 0

Ceci donne la condition de stationnarité sur u

∂L∂u

(x ,u) + λT ∂f∂u

(x ,u) = 0, t ∈ [0, tf ]

Page 28: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Conditions de stationnarité (3)

Pour toute fonction t 7→ δx(t) ∈ Rn telle que δx(0) = 0, on doitavoir

0 = δL =∂l∂x

(x(tf ))δx(tf )+∫ tf

0

[∂L∂x

∣∣∣∣(x(t),u(t))

δx(t) + λT (t)

(∂f∂x

∣∣∣∣(x(t),u(t))

δx(t)− ddtδx(t)

)]dt

Intégration par partie

−∫ tf

0λT (t)

ddtδx(t) dt = −[λT δx ]tf0 +

∫ tf

0

ddtλT (t) δx(t) dt

= −λT (tf )δx(tf ) +

∫ tf

0

ddtλT (t) δx(t) dt

(car δx(0) = 0)

Page 29: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Pour toute fonction t 7→ δx(t) telle que δx(0) = δx(tf ) = 0, on a∫ tf

0

[∂L∂x

∣∣∣∣(x(t),u(t))

+ λT (t)∂f∂x

∣∣∣∣(x(t),u(t))

+ddtλT (t)

]δx(t) dt = 0

On en déduit

∂L∂x

∣∣∣∣(x(t),u(t))

+ λT (t)∂f∂x

∣∣∣∣(x(t),u(t))

+ddtλT (t) = 0

c.-à-d. (∂L∂x

)T

(x ,u)

+

(∂f∂x

)T

(x ,u)

λ+ddtλ = 0, t ∈ [0, tf ]

Enfin, avec δx(tf ) 6= 0 on obtient de δL = 0 la condition finale

λ(tf ) =∂l∂x

(x(tf ))

Page 30: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Problème aux deux bouts

En somme, les conditions de stationarité sont, pour t ∈ [0, tf ]

ddt

x(t)= f (x(t),u(t))

ddtλ(t)= −

(∂f∂x

)T

(x(t),u(t))λ(t)−

(∂L∂x

)T

(x(t),u(t))

0=

(∂L∂u

)(x(t),u(t))

+ λT(∂f∂u

)(x(t),u(t))

avec comme conditions au bord

x(0) = x0, λ(tf ) =∂l∂x

(x(tf ))

Il s’agit d’un problème aux deux bouts, ce n’est pas unproblème de Cauchy

Page 31: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Contrôleur LQ

En particulier, pour un système linéaire (instationnaire)

ddt

x(t) = A(t)x(t) + B(t)u

et un coût quadratique à minimiser

12

xT (tf )Sf x(tf ) +12

∫ tf

0

(xT (t)Rx(t) + uT (t)Qu(t)

)compromis tolérance sur l’erreur d’état, effort sur la commandeSf , R sont sym. positives, Q est sym. définie pos.

Page 32: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Problème aux deux bouts

f = Ax + Bu, L = 12(xT Rx + uT Qu) et l = 1

2xT Sf x

ddt

x(t) = A(t)x(t)− BQ−1BTλ(t)

ddtλ(t) = −Rx(t)− AT (t)λ(t)

avec les conditions limites bilatérales

x(0) = x0, λ(tf ) = Sf x(tf )

L’état adjoint λ est de la même dimension que x . Lacommande optimale est alors donnée par

u(t) = −Q−1BT (t)λ(t)

Solution explicite sous forme linéaire

λ(t) = S(t)x(t)

avec S(tf ) = Sf

Page 33: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

En substituant, on obtient

ddt

S(t)x(t) + S(t)A(t)x(t)− S(t)B(t)Q−1BT (t)S(t)x(t)

= −Rx(t)− AT (t)S(t)x(t)

Il suffit alors de choisir S solution de l’équation différentiellematricielle de Riccati en temps rétrograde (quadratique enl’inconnue S)

ddt

S(t) = −S(t)A(t) + S(t)B(t)Q−1BT (t)S(t)− R − AT (t)S(t)

S(tf ) = Sf

pour obtenir finalement la commande optimale

u(t) = −Q−1BT (t)S(t)x(t)

Page 34: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Énoncé

Contrôleur LQ

Soit ddt x(t) = A(t)x(t) + B(t)u avec x(0) comme condition

initiale, et le critère à minimiser

J =12

xT (tf )Sf x(tf ) +12

∫ tf

0

(xT (t)Rx(t) + uT (t)Qu(t)

)dt

où A(t) est une matrice n × n, B(t) est une matrice n ×m, Sf etR sont symétriques positives, Q est symétrique définie positive.La solution à ce problème de minimisation est la loi de feedbackoptimal

u(t) = −Q−1BT (t)S(t)x(t)

où S est définie par l’équation différentielle deRiccati rétrograde, et la valeur du critère qui lui est associée estJopt = 1

2xT (0)S(0)x(0)

Page 35: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Corrections optimales:

∆u(t) = −Q−1BT (t)S(t)∆x(t)

Coût total de la correction:

12

xT (0)S(0)x(0)

Page 36: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Régulateur LQR

Passage à la limite tf → +∞ on va utiliser la commande LQ enfeedback, l’horizon étant naturellement glissant

∫ +∞

0

(xT (t)Rx(t) + uT (t)Qu(t)

)dt

où R est sym. positive, Q sym. définie positive et le systèmeest linéaire stationnaire

ddt

x(t) = Ax(t) + Bu

où l’état x ∈ Rn, la commande u ∈ Rm et les matrices A et Bsont de tailles n × n et n ×m

Page 37: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Régulateur LQR

minu

∫ +∞

0

(xT (t)Rx(t) + uT (t)Qu(t)

)dt ,

ddt

x(t) = Ax(t) + Bu

i) (A,B) est commandable ii) R est sym. pos. iii) Q est sym. déf.pos. iv) ∃ une racine de R telle que (R1/2,AT ) est commandableSolution: loi de feedback optimal

u(t) = −Q−1BT S0x(t)

où S0 est l’unique solution symétrique stabilisante de l’équation deRiccati algébrique

0 = SA + AT S − SBQ−1BT S + R

et la valeur du critère qui lui est associée est xT (0)S0x(0)

Page 38: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Preuve: construction d’une solution

1 comparaison avec un placement de pôles: exp. stabilisant,il fournit une intégrale convergente. t 7→ minu

∫ t0 est

majorée et croissante donc convergente. Limite:xT (0)Σ∞x(0)

2 Σ∞ est solution de l’équation de Riccati algébrique

0 = SA + AT S − SBQ−1BT S + R3 Σ∞ est sym. déf. pos. sous l’hypothèse de commandabilité4 V (x) = xT Σ∞x est fonction de Lyapounov. L’ensemble

ddt V (x) = 0 est donné par

R1/2x(0) = 0 = R1/2Ax(0) = ... = R1/2An−1x(0)

qui est réduit à {0}5 Unicité de la solution de l’éq. de Riccati stabilisante:

lemme d’algèbre linéaire6 Calcul du coût optimum

Page 39: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

ExempleProblème

Considérons le système ddt x = −1

τ x + u et le critère quadratiqueà minimiser 1

2

∫ +∞0 (ax2 + bu2)dt où a ≥ 0, b > 0

SolutionL’équation (ici scalaire) de Riccati algébrique associée est

0 = −2τ

S − S2

b+ a

possède 2 solutions S± = −bτ ±

√b2

τ2 + ab. La commande

associée est u =(

1τ ∓

√1τ2 + a

b

)x . La commande optimale

correspond à S+

a→ +∞, max|u| → +∞

Page 40: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Propriété de robustesse

minu

∫ +∞

0

(xT (t)Rx(t) + uT (t)Qu(t)

)dt ,

ddt

x(t) = Ax(t) + Bu

K (sI − A)−1B

Page 41: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Lieu de Nyquist

K (sI − A)−1B = Q−1BT S0(sI − A)−1B

Lieu de Nyquist (s parcourt +ı∞→ −ı∞) (cas mono-entrée)

‖1 + K (sI − A)−1B‖2 = (1 + K (sI − A)−1B)T

(I + K (sI − A)−1B)

= 1 +1Q

(sI − A)−1TR(sI − A)−1

en utilisant l’équation de Riccati algébrique

Page 42: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

‖1 + K (sI − A)−1B‖2 ≥ 1

Page 43: Dynamique et Contrôle des Systèmes NICOLAS Pcas.ensmp.fr/~TCsysdyn/lect6.pdf · 2009-04-29 · K = [0 :::0 1]C 1P(A) où Pest lepolynôme caractéristique désiré, Clamatrice de

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

Résumé

1 Stabilisation et placement de pôles: sous hypothèse decommandabilité, direct sous la forme normale,

2 Optimisation de transitoires: problème aux deux bouts

3 Contrôleur LQ: solution explicite dans le cas linéairequadratique, feedback instationnaire, équation deRiccati différentielle

4 Régulateur LQR: cas limite tf → +∞, feedbackstationnaire, équation de Riccati algébrique. Le LQRrépond indirectement à la question, où placer les valeurspropres?