dynamique et contrôle des systèmes nicolas pcas.ensmp.fr/~tcsysdyn/lect6.pdf · 2009-04-29 · k...

Stabilisation et placement de pôles Optimisation de transitoires Contrôleur LQ Régulateur LQR

AutomatiqueDynamique et Contrôle des Systèmes

NICOLAS PETIT

Centre Automatique et SystèmesUnité Mathématiques et Systèmes

MINES [email protected]

25 mars 2009Amphi 6


Plan de l’amphi 6

1 Stabilisation et placement de pôles

2 Optimisation de transitoires

3 Contrôleur LQ

4 Régulateur LQR


Stabilisation et placement de pôles

ddt

x = Ax + Bu

x ∈ Rn, A: matrice n × n, B: matrice n ×mEn boucle ouverte: on peut trouver une loi horaire[0, tf ] 3 t 7→ u(t) amenant le système de tout pointx(0) = p à tout point x(tf ) = q sous hypothèse decommandabilité

C = (B,AB, . . .An−1B) est de rang n = dim(x)

En boucle fermée: on cherche à modifier le système parbouclage

u = Kx

en particulier à le stabiliser. (A + BK )


Exemple de stabilisation

A =

1 2 3−1 4 01 2 2

, B =

010

A + BK = A + B (k1 k2 k3) =

1 2 3−1 + k1 4 + k2 k3

1 2 2

Valeurs propres souhaitées −1, −2, −3On identifie le polynôme caractéristiques3 + (−k2 − 7)s2 + (−2k1 + 3k2 − 2k3 + 13)s +−2k1 + k2 + 6 = 0à (s + 1)(s + 2)(s + 3) = s3 + 6s2 + 11s + 6 = 0

3 équations linéaires à 3 inconnues


Si le système est commandable, on aura toujours une solution.Avec une seule commande: formule d’Ackermann

K = [0 ...0 1] C−1P(A)

où P est le polynôme caractéristique désiré, C la matrice decommandabilité

Placement de pôles

Si la paire (A,B) est commandable alors, pour toute matriceréelle F de taille n × n, il existe une matrice m × n, K (nonnécessairement unique si m > 1), telle que le spectre deA + BK coïncide avec celui de F

Comment choisir les valeurs propres? à parties réelles <0, trèsnegatives le système sera très rapide, éloignées des valeurspropres en boucle ouverte on trouvera des gains forts.


Liens avec la forme normale

ddt

x = Ax + Bu, (dim B = n × 1)

Changement de variables z = Mx , v = Ex + Nu mettant lesystème sous forme normale de Brunovsky

ddt

z1 = z2, . . . ,ddt

zn−1 = zn,ddt

zn = v

c.-à-d. dn

dtn z1 = vForme canonique

A1 =

0 1 0 ... 00 0 1 ... ...... ... ... ...0 ... 0 0 10 ... 0 0 0

,B1 =

00...1


En boucle fermée, v = K1z: on obtient A1 + B1K1

A1 + B1K1 =

0 1 0 ... 00 0 1 ... ...... ... ... ...0 ... 0 0 1k0 k1 ... ... kn−1

Polynôme caractéristique

sn − kn−1sn−1 − ...− k1s − k0 = 0

à identifier au polynôme désiré.Enfin, changement de variables inverse pour revenir dans lesvariables d’origine (x ,u)


Optimisation de transitoires

Exemple: réentrée atmosphérique, optimisation d’unetrajectoire (loi horaire)


“Rebonds atmosphériques”, osc. phugoïde, Zhukovskii 1949


Linéarisé tangent autour d’une trajectoire (xr(t), ur(t))

OptimisationLa trajectoire elle même est issue d’une optimisation

∆x(0) = ∆x0

ddt ∆x(t) =

(∂f∂x

(xr (t),ur (t))

)︸︷︷︸

A(t)

·∆x(t) +

(∂f∂u

(xr (t),ur (t))

)︸︷︷︸

B(t)

·∆u(t)

ddt

x = A(t)x + B(t)u(t)

Problème à résoudre

Étant donné un point de départ (perturbation), on cherche lesmeilleures corrections (autour de la trajectoire)


Optimisation de dimension finie

min x ∈ Rn

h1(x) = 0, . . . ,hp(x) = 0

J(x)

- on rajoute des multiplicateurs de Lagrange λ = (λ1, ..., λp) ∈ Rp

- on introduit le Lagrangien

L(x , λ) = J(x) +

p∑i=1

λihi(x) = J(x) + λT h(x)

- on explicite les conditions de stationnarité du Lagrangien enfaisant comme si les variables x et λ pouvaient varier librement.Ces conditions sont δL = 0 pour toutes variationsinfinitésimales δx et δλ des variables x et λ


Théorème de stationnaritéSi (x∗, λ∗) est un point stationnaire du LagrangienL(x , λ) = J(x) + λT h(x) (i.e. ∂L

∂x = 0, ∂L∂λ = 0, (n+p équations))alors x∗ est un point stationnaire de J sous les contraintes h,i.e. un candidat à être solution de

min x ∈ Rn

h1(x) = 0, . . . ,hp(x) = 0

J(x)


Calcul des variations et adjoint

minx ,u

l(x(tf )) +

∫ tf

0L(x(t),u(t)) dt

[0, tf ] 3 t 7→ (x(t),u(t)) ∈ Rn × Rm

x(0) = x0

f1(x(t),u(t))− ddt x1(t) = 0, t ∈ [0, tf ]

...fn(x(t),u(t))− d

dt xn(t) = 0, t ∈ [0, tf ]

On introduit le Lagrangien

L(x ,u, λ) = l(x(tf )) +

∫ tf

0L(x(t),u(t)) dt

+n∑

i=1

∫ tf

0λi(t)

(fi(x(t),u(t))− d

dtxi(t)

)dt


Le Lagrangien L est une fonctionnelle

On écrit les conditions de stationnarité de L pour toutesvariations

t 7→ δλ(t)t 7→ δu(t)t 7→ δx(t) (δx(0) = 0)


Conditions de stationnarité (1)

Pour toute fonction t 7→ δλ(t) ∈ Rn on doit avoir

δL =

∫ tf

0δλT (t)

(f (x(t),u(t))− d

dtx(t)

)dt = 0

La seule possibilité 1 est qu’à chaque instant t ∈ [0, tf ],

f (x(t),u(t))− ddt

x(t) = 0

1On se reportera au lemme de du Bois-Reymond.



Pour toute fonction t 7→ δu(t) ∈ Rm, on doit avoir

δL =

∫ tf

0

(∂L∂u

∣∣∣∣(x(t),u(t))

δu(t) + λT (t)∂f∂u

∣∣∣∣(x(t),u(t))

δu(t)

)dt = 0

En mettant δu en facteur on obtient

δL =

∫ tf

0

(∂L∂u

∣∣∣∣(x(t),u(t))

+ λT (t)∂f∂u

∣∣∣∣(x(t),u(t))

)δu(t) dt = 0

Ceci donne la condition de stationnarité sur u

∂L∂u

(x ,u) + λT ∂f∂u

(x ,u) = 0, t ∈ [0, tf ]



Pour toute fonction t 7→ δx(t) ∈ Rn telle que δx(0) = 0, on doitavoir

0 = δL =∂l∂x

(x(tf ))δx(tf )+∫ tf

0

[∂L∂x

∣∣∣∣(x(t),u(t))

δx(t) + λT (t)

(∂f∂x

∣∣∣∣(x(t),u(t))

δx(t)− ddtδx(t)

)]dt

Intégration par partie

−∫ tf

0λT (t)

ddtδx(t) dt = −[λT δx ]tf0 +

∫ tf

0

ddtλT (t) δx(t) dt

= −λT (tf )δx(tf ) +

∫ tf

0

ddtλT (t) δx(t) dt

(car δx(0) = 0)


Pour toute fonction t 7→ δx(t) telle que δx(0) = δx(tf ) = 0, on a∫ tf

0

[∂L∂x

∣∣∣∣(x(t),u(t))

+ λT (t)∂f∂x

∣∣∣∣(x(t),u(t))

+ddtλT (t)

]δx(t) dt = 0

On en déduit

∂L∂x

∣∣∣∣(x(t),u(t))

+ λT (t)∂f∂x

∣∣∣∣(x(t),u(t))

+ddtλT (t) = 0

c.-à-d. (∂L∂x

)T

(x ,u)

+

(∂f∂x

)T

(x ,u)

λ+ddtλ = 0, t ∈ [0, tf ]

Enfin, avec δx(tf ) 6= 0 on obtient de δL = 0 la condition finale

λ(tf ) =∂l∂x

(x(tf ))


Problème aux deux bouts

En somme, les conditions de stationarité sont, pour t ∈ [0, tf ]

ddt

x(t)= f (x(t),u(t))

ddtλ(t)= −

(∂f∂x

)T

(x(t),u(t))λ(t)−

(∂L∂x

)T

(x(t),u(t))

0=

(∂L∂u

)(x(t),u(t))

+ λT(∂f∂u

)(x(t),u(t))

avec comme conditions au bord

x(0) = x0, λ(tf ) =∂l∂x

(x(tf ))

Il s’agit d’un problème aux deux bouts, ce n’est pas unproblème de Cauchy


Contrôleur LQ

En particulier, pour un système linéaire (instationnaire)

ddt

x(t) = A(t)x(t) + B(t)u

et un coût quadratique à minimiser

12

xT (tf )Sf x(tf ) +12

∫ tf

0

(xT (t)Rx(t) + uT (t)Qu(t)

)compromis tolérance sur l’erreur d’état, effort sur la commandeSf , R sont sym. positives, Q est sym. définie pos.


Problème aux deux bouts

f = Ax + Bu, L = 12(xT Rx + uT Qu) et l = 1

2xT Sf x

ddt

x(t) = A(t)x(t)− BQ−1BTλ(t)

ddtλ(t) = −Rx(t)− AT (t)λ(t)

avec les conditions limites bilatérales

x(0) = x0, λ(tf ) = Sf x(tf )

L’état adjoint λ est de la même dimension que x . Lacommande optimale est alors donnée par

u(t) = −Q−1BT (t)λ(t)

Solution explicite sous forme linéaire

λ(t) = S(t)x(t)

avec S(tf ) = Sf


En substituant, on obtient

ddt

S(t)x(t) + S(t)A(t)x(t)− S(t)B(t)Q−1BT (t)S(t)x(t)

= −Rx(t)− AT (t)S(t)x(t)

Il suffit alors de choisir S solution de l’équation différentiellematricielle de Riccati en temps rétrograde (quadratique enl’inconnue S)

ddt

S(t) = −S(t)A(t) + S(t)B(t)Q−1BT (t)S(t)− R − AT (t)S(t)

S(tf ) = Sf

pour obtenir finalement la commande optimale

u(t) = −Q−1BT (t)S(t)x(t)


Énoncé

Contrôleur LQ

Soit ddt x(t) = A(t)x(t) + B(t)u avec x(0) comme condition

initiale, et le critère à minimiser

J =12

xT (tf )Sf x(tf ) +12

∫ tf

0


)dt

où A(t) est une matrice n × n, B(t) est une matrice n ×m, Sf etR sont symétriques positives, Q est symétrique définie positive.La solution à ce problème de minimisation est la loi de feedbackoptimal

u(t) = −Q−1BT (t)S(t)x(t)

où S est définie par l’équation différentielle deRiccati rétrograde, et la valeur du critère qui lui est associée estJopt = 1

2xT (0)S(0)x(0)


Corrections optimales:

∆u(t) = −Q−1BT (t)S(t)∆x(t)

Coût total de la correction:

12

xT (0)S(0)x(0)


Régulateur LQR

Passage à la limite tf → +∞ on va utiliser la commande LQ enfeedback, l’horizon étant naturellement glissant

∫ +∞

0


)dt

où R est sym. positive, Q sym. définie positive et le systèmeest linéaire stationnaire

ddt

x(t) = Ax(t) + Bu

où l’état x ∈ Rn, la commande u ∈ Rm et les matrices A et Bsont de tailles n × n et n ×m


Régulateur LQR

minu

∫ +∞

0


)dt ,

ddt

x(t) = Ax(t) + Bu

i) (A,B) est commandable ii) R est sym. pos. iii) Q est sym. déf.pos. iv) ∃ une racine de R telle que (R1/2,AT ) est commandableSolution: loi de feedback optimal

u(t) = −Q−1BT S0x(t)

où S0 est l’unique solution symétrique stabilisante de l’équation deRiccati algébrique

0 = SA + AT S − SBQ−1BT S + R

et la valeur du critère qui lui est associée est xT (0)S0x(0)


Preuve: construction d’une solution

1 comparaison avec un placement de pôles: exp. stabilisant,il fournit une intégrale convergente. t 7→ minu

∫ t0 est

majorée et croissante donc convergente. Limite:xT (0)Σ∞x(0)

2 Σ∞ est solution de l’équation de Riccati algébrique

0 = SA + AT S − SBQ−1BT S + R3 Σ∞ est sym. déf. pos. sous l’hypothèse de commandabilité4 V (x) = xT Σ∞x est fonction de Lyapounov. L’ensemble

ddt V (x) = 0 est donné par

R1/2x(0) = 0 = R1/2Ax(0) = ... = R1/2An−1x(0)

qui est réduit à {0}5 Unicité de la solution de l’éq. de Riccati stabilisante:

lemme d’algèbre linéaire6 Calcul du coût optimum


ExempleProblème

Considérons le système ddt x = −1

τ x + u et le critère quadratiqueà minimiser 1

2

∫ +∞0 (ax2 + bu2)dt où a ≥ 0, b > 0

SolutionL’équation (ici scalaire) de Riccati algébrique associée est

0 = −2τ

S − S2

b+ a

possède 2 solutions S± = −bτ ±

√b2

τ2 + ab. La commande

associée est u =(

1τ ∓

√1τ2 + a

b

)x . La commande optimale

correspond à S+

a→ +∞, max|u| → +∞


Propriété de robustesse

minu

∫ +∞

0


)dt ,

ddt

x(t) = Ax(t) + Bu

K (sI − A)−1B


Lieu de Nyquist

K (sI − A)−1B = Q−1BT S0(sI − A)−1B

Lieu de Nyquist (s parcourt +ı∞→ −ı∞) (cas mono-entrée)

‖1 + K (sI − A)−1B‖2 = (1 + K (sI − A)−1B)T

(I + K (sI − A)−1B)

= 1 +1Q

(sI − A)−1TR(sI − A)−1

en utilisant l’équation de Riccati algébrique


‖1 + K (sI − A)−1B‖2 ≥ 1


Résumé

1 Stabilisation et placement de pôles: sous hypothèse decommandabilité, direct sous la forme normale,

2 Optimisation de transitoires: problème aux deux bouts

3 Contrôleur LQ: solution explicite dans le cas linéairequadratique, feedback instationnaire, équation deRiccati différentielle

4 Régulateur LQR: cas limite tf → +∞, feedbackstationnaire, équation de Riccati algébrique. Le LQRrépond indirectement à la question, où placer les valeurspropres?

dynamique et contrôle des systèmes nicolas pcas.ensmp.fr/~tcsysdyn/lect6.pdf · 2009-04-29 · k...

Documents