habilitation a diriger des recherches` l’universit´e de nice … · 2004-11-09 · habilitation...

158
HABILITATION ` A DIRIGER DES RECHERCHES Pr´ esent´ ee ` a l’Universit´ e de Nice-Sophia Antipolis par Pascal Morin sur le th` eme : Stabilisation de syst` emes non lin´ eaires critiques et application ` a la commande de v´ ehicules Soutenue le 21 Octobre 2004 devant le jury compos´ e de : MM. Pierre Bernhard Pr´ esident MM. Jean-Michel Coron Rapporteur Alessandro De Luca Rapporteur Pierre Rouchon Rapporteur MM. Witold Respondek Examinateur Claude Samson Examinateur

Upload: others

Post on 07-Jul-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

HABILITATION A DIRIGER DES RECHERCHES

Presentee a

l’Universite de Nice-Sophia Antipolis

par

Pascal Morin

sur le theme :

Stabilisation de systemes non lineaires critiques et application ala commande de vehicules

Soutenue le 21 Octobre 2004 devant le jury compose de :

MM. Pierre Bernhard President

MM. Jean-Michel Coron RapporteurAlessandro De Luca RapporteurPierre Rouchon Rapporteur

MM. Witold Respondek ExaminateurClaude Samson Examinateur

Page 2: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis
Page 3: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

iii

A mes parents,

a Marielle et Alain.

Page 4: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis
Page 5: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

v

Resume : La stabilite est un des principaux concepts de l’automatique. Plusieurs definitions destabilite existent, mais toutes vehiculent l’idee selon laquelle le “comportement” d’un systeme dy-namique ne change pas significativement lorsque l’on modifie legerement certaines de ses“entrees”.On comprend alors que ce concept est primordial des qu’il s’agit de prevoir ou specifier l’evolutiond’un tel systeme. Pour les systemes lineaires commandables, ou plus generalement les systemesdont les linearises aux points d’equilibre sont commandables, il est bien connu que la stabiliteasymptotique d’un point d’equilibre (voir d’une trajectoire plus generale) peut etre obtenue pardes retours d’etat lineaires. En outre, de telles commandes assurent systematiquement des niveauxde performance et de robustesse non-negligeables, deux aspects tres importants en pratique. Ilexiste cependant des systemes commandables dont les linearises ne sont pas commandables (nimeme asymptotiquement stabilisables). Ces systemes sont qualifies de “systemes critiques”; lesexemples physiques les plus classiques etant les systemes mecaniques non-holonomes (e.g. les ve-hicules a roues), ainsi que certains systemes mecaniques sous-actionnes. Pour de tels systemes, lesoutils de l’automatique lineaire ne sont plus suffisants et les techniques de stabilisation doiventetre repensees, aussi bien au niveau de leurs objectifs que des methodes de synthese de lois decommande.

Ce memoire est un condense de mes travaux de recherche, menes depuis une dizaine d’anneedans le contexte de la stabilisation des systemes critiques et des applications a la commande devehicules. De facon tres generale, la specificite de ces travaux tient essentiellement en deux points.D’une part, dans le prolongement des etudes de commandabilite qui s’appuient sur les proprietesstructurelles (algebriques) des systemes, nous essayons de mettre ces proprietes a profit pour lasynthese de retours d’etat stabilisants et l’analyse des systemes commandes associes. D’autre part,dans cette etape de synthese, une importance toute particuliere est donnee aux performances etaux proprietes de robustesse induites par les lois de commande. Cette preoccupation, motivee etorientee par les applications, n’est evidemment pas nouvelle en automatique, mais elle est souventabsente des etudes consacrees aux systemes critiques. Elle peut conduire, comme ce memoire lesuggere, a remettre en cause l’objectif de stabilite asymptotique, issu de l’automatique lineaire,au profit d’un objectif de stabilite pratique.

Mots cles : Fonction transverse, Groupe de Lie, Retour d’etat, Robustesse, Stabilisation, Systemenon lineaire, Vehicule

Page 6: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis
Page 7: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

vii

Abstract : Stability is a major concept in control. While many stability definitions exist, they allconvey the idea that small modifications of some “inputs” of a control system do not significantlyalter the system’s “outputs”. Therefore, this concept is crucial to predict or specify the evolutionof such a system. For controllable linear systems, or even for systems the linearization of which iscontrollable at equilibrium points, it is well known that the asymptotic stability of an equilibriumpoint (and possibly of more general trajectories) can be achieved by using linear state feedback.Moreover, such control laws systematically provide some significant levels of performance androbustness, two aspects also very important in practice. On the other side, there are nonlinearcontrollable systems the linearization of which at equilibrium points is not controllable (and notasymptotically stabilizable either). Many physical examples of these so called “critical systems”exist, among which one can find nonholonomic mechanical systems (e.g. wheeled mobile robots),or under-actuated mechanical systems. For such systems, the tools from linear control theory arenot sufficient, and stabilization techniques need to be reconsidered, at both the control objectivelevel and the control design techniques level.

This memoir provides an overview of my research activities during the last decade, devotedto the stabilization of nonlinear critical systems and its application to the control of vehicles.The specificity of this research essentially consists in two aspects. On the one hand, following thecontrollability studies which have revealed the importance of structural (algebraic) properties ofcontrol systems, we try to exploit these properties for the feedback design and for the closed-loopsystems analysis. On the other hand, a significant part of our effort in the feedback design isdevoted to performance and robustness issues. This effort is motivated by, and oriented towards,applications. It is obviously not new in control, but it is not so frequently found in studiesdevoted to critical systems. As a matter of fact, addressing performance and robustness issuesin this context can lead to reformulate stability objectives. More precisely, this memoir suggeststhat practical stability can be, in the present setting, an objective more viable than the classicalasymptotic stability objective associated with linear systems theory.

Keywords : Feedback, Lie group, Nonlinear system, Robustness, Stabilization, Transverse func-tion, Vehicle

Page 8: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis
Page 9: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

ix

Remerciements : La tradition veut qu’un memoire (de these ou d’habilitation) contienne tou-jours une page de remerciements. Cet exercice de style, souvent convenu, donne toujours lieu ades omissions, parfois par oubli ou negligence, plus souvent a cause des limites que la tradition aelle-meme fixees. Ces remerciements n’echapperont pas a la regle.

Je tiens d’abord a remercier les personnes qui ont accepte de faire parti de mon jury : PierreBernhard, dont la culture scientifique et la vivacite d’esprit en font un president de jury ideal ;Jean-Michel Coron, dont j’estime beaucoup la connaissance profonde des systemes non-lineaires,et dont j’apprecie tout autant la gentillesse et la disponibilite ; Alessandro De Luca, que je n’avaispas eu l’occasion de rencontrer avant cette soutenance, et dont j’ai beaucoup apprecie le point devue critique, la franchise, et les recommandations ; Pierre Rouchon, dont j’estime particulierementles contributions dans le domaine et la tres vaste culture scientifique. Je remercie tres sincerementces trois rapporteurs pour le temps qu’ils ont consacre a mon travail. Witold Respondek a accepted’etre examinateur de mon manuscrit et, comme ses remarques et questions lors de la soutenancel’ont montre, il s’est acquitte de cette tache avec beaucoup de serieux et de competence ; je l’enremercie sincerement. Il me reste a remercier Claude Samson, et ce n’est pas la tache la plusfacile en raison de tout le temps passe ensemble a reflechir sur ces problemes et de tout ce qu’ilm’a appris, du pur point de vue de l’automatique, mais aussi du point de vue de la methodescientifique. Faute de savoir (ou pouvoir) le remercier justement, j’espere simplement que cememoire lui donnera la satisfaction d’avoir transmis une certaine exigence scientifique.

En second lieu, je souhaite remercier les collegues avec qui j’ai eu l’occasion de travailler, quece soit sur le theme traite dans ce memoire ou sur d’autres problemes. En particulier je tiens aremercier H. Benzaoui, Z.-P. Jiang, R.M. Murray, R.M. M’Closkey, J.-B. Pomet, et L. Praly. Jetiens aussi a remercier tous les membres du Projet ICARE de l’INRIA, qui m’ont permis de menerce travail dans les meilleures conditions. Certains sont probablement trop loin pour recevoir cesremerciements, mais leur souvenir est proche.

Je tiens a remercier specialement certains gouroux de l’informatique a l’INRIA, en particu-lier Guillaume Artus et Jose Grimm, qui m’ont souvent permis de resoudre, aussi rapidementqu’efficacement, les problemes frequents lies a mon utilisation naıve de l’ordinateur.

Enfin, on ne se presente pas a l’habilitation a diriger des recherches sans avoir eu diversesoccasions d’encadrer ou co-encadrer des stages et theses de doctorat, et sans avoir la pretention decontinuer dans cette voie. L’experience acquise dans ce domaine m’a appris que cette tache n’estpas toujours facile, et ceci quelle que soit la bonne volonte des differentes parties. Je l’ai cependanttoujours trouvee humainement enrichissante, et ceci je le dois aux etudiants avec qui j’ai eu lachance de travailler. Que T. Alfaro, G. Artus, M. Fruchard, K. Guemkhar, D.A. Lizarraga, M.Maini, et M. Maya-Mendez soient ici remercies pour leur enthousiasme, leur bonne humeur, etleurs idees !

Page 10: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis
Page 11: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Table des matieres

Introduction 11 Problematique generale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Reperes bibliographiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

2.1 Les etudes de commandabilite . . . . . . . . . . . . . . . . . . . . . . . . . . 22.1 Les etudes de stabilisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2 Nos travaux sur le sujet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 Organisation du memoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

I Systemes, problemes, et solutions de commande 9

1 Exemples et modeles de vehicules 101.1 Quelques rappels d’automatique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.2 Rappel sur la modelisation des systemes mecaniques . . . . . . . . . . . . . . . . . 131.3 Proprietes de symetrie des vehicules et systemes d’erreur . . . . . . . . . . . . . . . 171.4 Les systemes non-holonomes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

1.4.1 L’unicycle : corps rigide non-holonome sur SE(2) . . . . . . . . . . . . . . . 201.4.2 La voiture . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221.4.3 Le chariot avec remorques a attaches centrees . . . . . . . . . . . . . . . . . 24

1.5 Les systemes sous-actionnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271.5.1 Corps rigide sous-actionne sur SO(3) : l’exemple du satellite . . . . . . . . 271.5.2 Corps rigide sous-actionne sur SE(2) : l’exemple du glisseur . . . . . . . . . 291.5.3 Corps rigide sous-actionne sur SE(3) . . . . . . . . . . . . . . . . . . . . . . 30

1.6 Les systemes non-holonomes sous-actionnes . . . . . . . . . . . . . . . . . . . . . . 31

2 Stabilisation de systemes critiques : une vue d’ensemble 352.1 Remarques generales sur la stabilisation de trajectoires . . . . . . . . . . . . . . . . 362.2 Stabilisation asymptotique de points fixes . . . . . . . . . . . . . . . . . . . . . . . 39

2.2.1 Quelques resultats generaux . . . . . . . . . . . . . . . . . . . . . . . . . . . 392.2.2 Introduction aux differentes classes de retours d’etat . . . . . . . . . . . . . 41

2.3 Stabilisation asymptotique de trajectoires admissibles non-stationnaires . . . . . . 532.3.1 Proprietes de commandabilite des systemes linearises . . . . . . . . . . . . . 532.3.2 Stabilisation asymptotique par retour d’etat lineaire . . . . . . . . . . . . . 552.3.3 Stabilisation asymptotique par retour d’etat statique non-lineaire . . . . . . 57

2.4 Stabilisation pratique de trajectoires generales . . . . . . . . . . . . . . . . . . . . . 60

xi

Page 12: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

xii

2.4.1 Stabilisation pratique et fonctions transverses . . . . . . . . . . . . . . . . . 602.4.2 Application a la stabilisation pratique de trajectoires generales . . . . . . . 622.4.3 Elements de comparaison avec les approches classiques . . . . . . . . . . . . 67

II Structures et application a la synthese de commandes 73

3 Structures et proprietes locales des systemes de commande 743.1 Series de Chen-Fliess et exponentielles de series de Lie . . . . . . . . . . . . . . . . 743.2 Approximations homogenes et structure de groupe . . . . . . . . . . . . . . . . . . 79

4 Quelques methodes de synthese de retours d’etat pour la stabilisation 854.1 Les resultats de Sussmann et Liu sur l’approximation de trajectoires . . . . . . . . 86

4.1.1 Moyenne sur un intervalle de temps fini . . . . . . . . . . . . . . . . . . . . 864.1.2 L’algorithme d’approximation de trajectoires . . . . . . . . . . . . . . . . . 88

4.2 Stabilisation exponentielle par retour d’etat homogene . . . . . . . . . . . . . . . . 914.2.1 Homogeneite et stabilite exponentielle . . . . . . . . . . . . . . . . . . . . . 914.2.2 Homogeneite et moyenne a haute frequence . . . . . . . . . . . . . . . . . . 934.2.3 Homogeneite et ajout d’un integrateur . . . . . . . . . . . . . . . . . . . . . 974.2.4 Synthese de retours d’etat stabilisants via l’algorithme de Sussmann et Liu

(Version 1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 984.2.5 Exemple d’application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

4.3 Stabilisation asymptotique par retour d’etat hybride . . . . . . . . . . . . . . . . . 1024.3.1 Une condition suffisante de robustesse aux dynamiques non modelisees . . . 1034.3.2 Synthese de retours d’etat stabilisants via l’algorithme de Sussmann et Liu

(Version 2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1054.3.3 Synthese a partir d’une approximation homogene et exemple . . . . . . . . 107

4.4 Stabilisation pratique via les fonctions transverses . . . . . . . . . . . . . . . . . . 1084.4.1 Definition et resultat de base . . . . . . . . . . . . . . . . . . . . . . . . . . 1084.4.2 Le cas des systemes sur les groupes de Lie . . . . . . . . . . . . . . . . . . . 1094.4.3 Application a la commande . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

Conclusion et perspectives 115

A Preuves et complements 117A.1 Resultats de la Partie I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

A.1.1 Extensions du theoreme de Brockett (Section 2.2.1) . . . . . . . . . . . . . 117A.1.2 Preuve de la Proposition 14 (Section 2.3.2) . . . . . . . . . . . . . . . . . . 118A.1.3 Preuve de la Proposition 15 (Section 2.3.3) . . . . . . . . . . . . . . . . . . 121A.1.4 Preuve du Lemme 2 (Section 2.4.2) . . . . . . . . . . . . . . . . . . . . . . . 123A.1.5 Preuve de la Proposition 16 (Section 2.4.2) . . . . . . . . . . . . . . . . . . 124A.1.6 Preuve du Lemme 3 (Section 2.4.2) . . . . . . . . . . . . . . . . . . . . . . . 127

A.2 Resultats de la Partie II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128A.2.1 Approximations homogenes de systemes commandables . . . . . . . . . . . 128A.2.2 Relevement de champs de vecteurs nilpotents sur un groupe . . . . . . . . . 130A.2.3 Preuve de la Proposition 24 (Section 4.3.2) . . . . . . . . . . . . . . . . . . 133

Page 13: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Notations

Tout au long de ce memoire, les notations suivantes sont utilisees.

• C∗(M ;N) designe l’espace des fonctions de M dans N , de classe C∗, avec ∗ ∈ N ∪ ∞, ω(ω signifiant analytique relle). Lorsque N = R on ecrira simplement C∗(M). On utilise lanotation C0

m pour des espaces de fonctions continues par morceaux.• Une “variete M” designe une variete differentielle de classe C∞. On note TpM l’espace

tangent a M en p ∈M .• X (M) designe l’ensemble des champs de vecteurs sur M , de classe C∞.• Etant donne une variete M , et des champs de vecteurs X0, . . . , Xm ∈ X (M), on note

L(X0, . . . , Xm) l’algebre de Lie engendree parX0, . . . , Xm, et Lk(X0, . . . , Xm) le sous-espacevectoriel de L(X0, . . . , Xm) engendre par les crochets de longueur inferieure ou egale a k, i.e.L1(X0, . . . , Xm) = spanXi : i = 1, . . . ,m, L2(X0, . . . , Xm) = spanXi, [Xj , Xk] : i, j, k =1, . . . ,m, ... Enfin, L(X0, . . . , Xm)(x0) (resp. Lk(X0, . . . , Xm)(x0)) designe X(x0) : X ∈L(X0, . . . , Xm) (resp. X(x0) : X ∈ Lk(X0, . . . , Xm).

• Etant donne X ∈ X (M) et ϕ ∈ C∞(M), on note X(ϕ) la derivee de Lie de ϕ le long de X.• Etant donne m, on appelle multi-index tout vecteur I = (i1, . . . , is) avec s ≥ 0 et ij ∈0, . . . ,m pour tout j = 1, . . . ,m. La“longueur”de I = (i1, . . . , is) est notee |I|, i.e. |I| = s.L’element I de longueur |I| = 0 est aussi note ∅. Par extension, pour tout ensemble finiJ = j1, . . . , jp, on note egalement |J | le nombre d’elements de J , i.e. |j1, . . . , jp| = p.L’ensemble i1, . . . , is des valeurs associees a un multi-index I est note I.

• Etant donne un champ de vecteur X de classe C1 sur une variete M , on note exp(tX)(p)la solution (sous reserve de son existence) au temps t de l’equation differentielle x = X(x)avec condition initiale x(0) = p. Lorsque t = 1 on notera simplement exp(X)(p). Lorsque Gest un groupe de Lie avec pour element neutre e, exp(tX)(e) sera simplement note exp(tX).

• Etant donne une fonction f ∈ C0(Rp ×M ; Rq) avec M une variete, on note f = O(xα) s’ilexiste une constante K et un voisinage O de x = 0 tels que

(x, y) ∈ O ×M =⇒ |f(x, y)| ≤ K|x|α

De facon similaire, on note f = o(xα) si la relation precedente est verifiee avec une fonctionK(x) qui tend vers zero lorsque |x| tend vers zero.

• Nous introduisons quelques notations pour certaines classes de systemes utilises tout au

xiii

Page 14: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

xiv Notations

long de ce memoire.

(S) : x = X0(x) +m∑

i=1

uiXi(x)

(S0) : x =m∑

i=1

uiXi(x)

(Sh) : x = Y0(x) +m∑

i=1

uiYi(x)

(Sh0 ) : x =

m∑i=1

uiYi(x)

(Sc) :

x1 = u1

x2 = u2

x3 = u1x2...

......

xn = u1xn−1

(S) (resp. (S0)) est une notation generique pour les systemes avec (resp. sans) derive affinesen la commande. (Sh) (resp. (Sh

0 )) est une notation generique pour une approximationhomogene de (S) (resp. de (S0)). Enfin, (Sc) est le systeme chaıne bien connu.

Page 15: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Introduction

1 Problematique generale

Ce memoire est consacre a la stabilisation des systemes de commande non-lineaires, represen-tes de facon generale par une equation differentielle du type

x = X(x, u)

avec x l’etat du systeme, u la commande, et X une application reguliere. On s’interesse plusspecifiquement aux systemes qui sont commandables mais dont le linearise en chacun des pointsd’equilibre du systeme (i.e. chaque couple (x0, u0) tel que X(x0, u0) = 0) n’est pas asymptoti-quement stabilisable, et donc a fortiori pas commandable. Suivant la terminologie de (Bacciotti,1991), ces systemes seront appeles dans la suite de ce memoire systemes critiques. Pour de telssystemes, la stabilisation asymptotique de points d’equilibre ne peut etre obtenue, ne serait-ceque localement, en appliquant les techniques classiques de l’automatique lineaire. Les travauxpresentes dans ce memoire relevent de la problematique suivante :

Quelles methodes peut-on proposer pour la stabilisation des systemes critiques, et que peut-onobtenir en terme de performance du systeme controle ?

Il n’est evidemment pas realiste d’envisager de fournir une reponse a cette question pour toutsysteme critique. De plus, parler de “performance” d’un systeme controle n’a vraiment d’interetque par rapport a un cadre applicatif. Celui ci nous est fourni par les systemes mecaniques quel’on peut qualifier de “vehicules”, c’est a dire des systemes destines a se deplacer dans le plan oul’espace. Nombre d’entre eux rentrent dans la classe des systemes critiques. Les plus connus sontles vehicules a roues : voitures, camions, etc, omnipresents dans notre quotidien. Leur modelisationcinematique conduit a l’etude de systemes critiques sans derive, du type

(S0) : x =m∑

i=1

uiXi(x)

La majeure partie de ce memoire sera consacree a ce type de systeme. Cependant, il n’est pastoujours possible de se ramener a ce cas particulier. En particulier, parmi les systemes mecaniquessous-actionnes (satellites sous-actionnes, engins de type sous-marin, etc.) on trouve des vehiculespour lesquels le modele cinematique ne suffit pas a rendre compte des non-linearites du systeme.Un modele dynamique doit alors etre considere. Cela conduit a l’etude de systemes avec derive

Page 16: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

2 Introduction

du type

(S) : x = X0(x) +m∑

i=1

uiXi(x)

Contrairement au cas precedent des systemes sans derive, on peut dire que la comprehensionde cette classe de systemes reste encore tres partielle. Notre travail n’affecte malheureusementpas vraiment ce constat, mais il nous semble cependant important, au moins d’un point de vuetheorique, de s’interesser aussi a ces systemes. Ils ne seront donc pas exclus de ce memoire.

2 Reperes bibliographiques

Afin de situer notre travail dans la litterature existante, il est utile de faire un rappel chro-nologique des etudes consacrees aux systemes critiques. Nous nous limiterons a celles consacreesa la commandabilite et a la stabilisation de ces systemes. Etant donne l’importance du nombred’etudes sur le sujet, cet expose n’a evidemment pas l’ambition d’etre complet ; il s’agit seulementici de donner des points de repere afin de mieux situer la place de notre travail, et de fournirquelques references bibliographiques qui nous paraissent importantes dans le contexte.

2.1 Les etudes de commandabilite

De facon logique, les questions de commandabilite sont les premieres a avoir ete abordees. Ence qui concerne les systemes sans derive (S0), il existe un critere algebrique simple permettantde verifier la commandabilite du systeme : c’est le theoreme de (Chow, 1939) qui fournit unecondition suffisante (et necessaire dans le cas de champs de vecteurs analytiques) de comman-dabilite locale en x0. Cette condition est classiquement connue comme la “condition de rang (del’algebre de Lie)” en x0, ou son abreviation anglaise LARC. Ce resultat est revisite et affine dansles annees 60 : (Hermann, 1963; Lobry, 1970). Ces travaux marquent l’entree en force des outilsde la geometrie differentielle dans l’automatique. Pour les systemes avec derive, les choses sontcependant beaucoup plus compliquees. Il n’existe d’ailleurs pas de definition unique de la notionde commandabilite dans ce cas. Les premiers resultats importants concernent la caracterisationde la propriete “d’accessibilite” (possibilite d’atteindre a partir d’un point x0 un ensemble d’in-terieur non vide). Dans le cas de champs analytiques, il est montre que la condition de rangest non seulement necessaire (Lobry, 1970) mais aussi suffisante (Sussmann & Jurdjevic, 1972)pour garantir la propriete d’accessibilite. Cette propriete est cependant d’un interet tres limite enpratique car elle n’implique nullement la propriete de commandabilite locale ; en particulier, ellen’implique pas que x0 lui-meme appartient a l’interieur de l’ensemble des points atteignables. Lanotion de“commandabilite locale en temps petit” (STLC en Anglais) correspond beaucoup mieuxa ce que l’on pourrait attendre d’un systeme“commandable”au sens intuitif du terme : possibilited’atteindre un voisinage de x0 en un temps arbitrairement court. Bien que cette propriete ait faitl’objet de nombreux travaux, plus particulierement dans les annees 80, on ne connaıt pas, memedans le cas analytique, de critere algebrique qui soit une condition necessaire et suffisante pourcette propriete de commandabilite. Le principal critere connu est celui de (Sussmann, 1987), quigeneralise de nombreux resultats anterieurs (Brunovsky, 1974; Hermes, 1982; Crouch & Byrnes,1986), etc. Bien qu’il ne fournisse qu’une condition suffisante de commandabilite en temps pe-tit, il constitue toutefois un outil de verification puissant. En depit de quelques developpements

Page 17: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Introduction 3

posterieurs (voir (Kawski, 1990) pour un article de synthese), il semble que les etudes sur lesujet soient un peu arrivees a leur terme. Bien qu’ils se situent dans un autre contexte, notonsque l’influence des travaux de M. Fliess (Fliess, 1975; Fliess, 1981) sur le resultat de (Sussmann,1987) a ete determinante. Remarquons enfin que pour les systemes mecaniques, des definitions decommandabilite specifiques ont ete proposees et ont aussi donne lieu a des conditions algebriquessimilaires a la condition de Sussmann : (Lewis & Murray, 1997).

Les travaux mentionnes precedemment sont avant tout des resultats d’existence, et il estdifficile d’en deduire des methodes de construction de lois de commandes en boucle ouvertepermettant d’amener l’etat du systeme d’un point a un autre. Motivees par la commande dessystemes mecaniques non-holonomes, de nombreuses etudes sur la synthese de commandes enboucle ouverte ont eu lieu dans les annees 90, principalement pour les systemes sans derive. Onpeut schematiquement distinguer deux types d’approches. Le premier repose sur l’utilisation decommandes sinusoıdales, generalement multi-frequences, qui permettent par des effets de couplaged’engendrer des deplacements dans les directions des crochets de Lie des champs de commande. Leprincipe de base est elementaire, et present dans les premieres etudes de commandabilite (Lobry,1970; Haynes & Hermes, 1970). Sa generalisation a tous les systemes sans derive commandablesest assez complexe. Elle a ete developpee dans (Sussmann & Liu, 1991; Liu, 1997a), sur la base deproprietes de moyenne a haute frequence (Kurzweil & Jarnik, 1988). Notons que cet algorithmene permet d’atteindre, en general, qu’un point “voisin” du point cible, point d’autant plus procheque les frequences utilisees sont elevees. Dans un certain nombre de cas, en particulier pour lessystemes nilpotents, on peut atteindre exactement le point cible et il n’est alors pas necessaired’utiliser des frequences elevees (Murray & Sastry, 1993). Bien que l’application en soit plusdelicate, ce type de methode peut aussi etre utilisee pour des systemes avec derive (voir e.g.(Bullo et al., 2000)). Un deuxieme type d’approche consiste a utiliser, lorsqu’elles existent, lesproprietes de platitude du systeme (Fliess et al., 1995b). Cette approche s’avere tres efficace,donne generalement des solutions de commande assez simple, et presente l’interet de s’appliqueregalement, sans difference majeure, aux systemes avec derive. Pour un article de synthese sur lesmethodes de synthese de commandes en boucle ouverte, nous renvoyons a (Laumond, 2001, Ch.1).

2.2 Les etudes de stabilisation

Les etudes de stabilisation de systemes critiques commencent au debut des annees 80. Leresultat de (Brockett, 1983) est une des premieres contributions, et aussi l’une des plus mar-quantes, dans ce domaine. La condition necessaire de stabilisabilite qu’il donne implique que lespoints d’equilibre de nombreux systemes critiques ne peuvent pas etre stabilises asymptotique-ment via des retours d’etat autonomes u(x) continus. Cependant, il existe aussi de nombreuxsystemes critiques dont les points peuvent etre stabilises asymptotiquement par de tels retoursd’etat, en utilisant des approches de type Lyapounov (eventuellement completees par des argu-ments de type LaSalle (LaSalle, 1968) ou Jurdjevic-Queen (Jurdjevic & Queen, 1978)), ou desapproches de type variete centre (Carr, 1981). L’un des premiers exemples etudies dans ce cadre,qui illustre bien les differentes approches de stabilisation possibles, est le systeme de commandeassocie aux equations d’Euler (dynamique des vitesses angulaires d’un corps rigide commandeen couple). La stabilisation asymptotique de ces vitesses a la valeur nulle, par du retour d’etatautonome regulier, peut etre obtenue en presence d’un seul couple de commande disponible (sous

Page 18: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

4 Introduction

une condition sur la direction de ce couple de commande bien sur), au lieu de trois pour un corpsrigide completement actionne (Aeyels & Szafranski, 1988; Sontag & Sussmann, 1988). Notonsque dans ce cas, le systeme n’est meme pas commandable en temps petit1 (Keraı, 1995). Versla fin des annees 80, un certain nombre d’etudes sont consacrees a la stabilisation de “systemeshomogenes” (systemes dont les champs de vecteurs sont homogenes par rapport a une famillede dilatation). Cette classe de systemes, qui generalise celle des systemes lineaires, joue un roleessentiel dans l’etude des proprietes de commandabilite. Dans (Kawski, 1989b; Dayawansa et al.,1990), il est montre que tout systeme analytique dans le plan, avec une entree de commande, estlocalement asymptotiquement stabilisable en un point par du retour d’etat autonome continu ethomogene, des lors qu’il est commandable en temps petit en ce point. Dans les dimensions supe-rieures, les choses deviennent cependant vite compliquees. En particulier, il existe en dimensiontrois des systemes analytiques avec une entree de commande qui ne sont pas stabilisables pardu retour d’etat autonome continu homogene, bien qu’ils soient commandables en temps petitet qu’ils satisfassent la condition necessaire de Brockett (Kawski, 1989a). Pour un expose plusdetaille sur les methodes de stabilisation de cette classe de systemes, ainsi que sur la stabilisationpar retour d’etat autonome des systemes critiques en general, on pourra se referer a (Bacciotti,1991).

Dans (Crouch, 1984), la commande de l’orientation d’un corps rigide sous-actionne commandeen couples (i.e. disposant de deux couples de commandes) est consideree. C’est l’une des premieresconsacrees aux systemes ne satisfaisant pas la condition necessaire de Brockett. Le principe decommande utilise, developpe precedemment dans (Hermes, 1980) et repris dans des etudes ulte-rieures, consiste a iterer une loi de commande en boucle ouverte qui, sur un intervalle de tempsdonne [tk, tk+1] amene l’etat x(tk) a une valeur x(tk+1) plus proche de l’etat desire. La commandeainsi synthetisee est du type uk(t, x(tk)). Cette etude de commande d’un systeme ne satisfaisantpas la condition de Brockett est restee relativement isolee jusqu’a ce que le developpement de larobotique mobile, a la fin des annees 80, ne remette ces systemes en avant.

Le theoreme de Brocket implique qu’il n’existe pas de retours d’etat autonomes (i.e. dutype u(x)), reguliers, qui stabilisent asymptotiquement la configuration des robots mobiles non-holonomes classiques (i.e. chariots, voitures, etc) a une valeur de reference fixe. Motive par ceresultat, un retour d’etat instationnaire regulier u(x, t), periodique par rapport a t, est proposedans (Samson, 1990) afin de stabiliser asymptotiquement la configuration d’un robot de type uni-cycle. L’etude de ce type de retours d’etat se developpe alors rapidement (voir e.g. (Pomet, 1992;Teel et al., 1992) pour des methodes de synthese . En particulier les travaux de Coron mettent enevidence l’existence de retours d’etat instationnaires reguliers permettant de stabiliser asympto-tiquement tout systeme sans derive commandable (Coron, 1992a), ainsi que l’existence de retoursd’etat instationnaires continus permettant de stabiliser en temps fini la “plupart” des systemesavec derive, commandables en temps petit (Coron, 1995).

3 Nos travaux sur le sujet

Notre travail dans ce domaine, qui debute au milieu des annees 90 dans le cadre d’une these,s’inscrit dans la continuite des travaux consacres a la synthese de retours d’etat instationnaires

1Il est seulement montre dans (Keraı, 1995) que le systeme dynamique qui regit l’evolution de l’orientation etdes vitesses angulaires d’un corps rigide n’est pas commandable en temps petit avec un seul couple de commande,mais l’argument utilise s’applique de la meme facon pour les seules equations d’Euler.

Page 19: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Introduction 5

permettant de stabiliser asymptotiquement un point d’equilibre. La synthese de retours d’etatinstationnaires reguliers, permettant de stabiliser asymptotiquement l’orientation d’un corps ri-gide sous-actionne a une valeur fixe, constitue notre premiere contribution (Morin et al., 1995).Cette synthese repose sur la theorie de la variete centre et sur un resultat de moyenne original.Notons que ce type d’approche avait deja ete utilise dans (Teel et al., 1992; Teel et al., 1995) pourla stabilisation de systemes sans derive. Pour les systemes critiques, la stabilisation asymptotiqued’un point d’equilibre par des retours d’etat reguliers ne permet pas d’obtenir une convergenceexponentielle. Combinant les proprietes des systemes homogenes evoquees precedemment avecles proprietes de moyenne a haute frequence, M’Closkey et Murray mettent en evidence dans(M’Closkey & Murray, 1993) la possibilite de stabiliser exponentiellement, avec des retours d’etatinstationnaires continus, des systemes sans derive qui ne verifient pas la condition de Brockett.Nous avons montre dans (Morin & Samson, 1997) que cette approche permettait aussi de stabiliserexponentiellement l’orientation d’un corps rigide sous-actionne, pour une configuration particu-liere des actionneurs. Independamment, pour toute configuration de ces actionneurs qui garantitla propriete de commandabilite en temps petit, la stabilisation exponentielle a ete montree dans(Coron & Kerai, 1996), en utilisant la encore les proprietes d’homogeneite. La combinaison desproprietes d’homogeneite et de moyenne a haute frequence se revele etre une methode puissantepour la synthese de retours d’etat. Ainsi, dans (Morin et al., 1999), nous proposons une methodegenerale pour la stabilisation exponentielle locale des systemes sans derive commandables, pardu retour d’etat instationnaire continu et homogene. Cette methode peut etre vue comme unefacon de transformer les commandes en boucle ouverte de (Sussmann & Liu, 1991; Liu, 1997a)en retours d’etat asymptotiquement stabilisants. Dans quelle mesure ce type d’approche peutaussi s’appliquer de facon “generale” aux systemes avec derive reste une question ouverte. Il estcependant assez evident que son champ d’application va bien au dela du seul cas du corps rigideevoque precedemment, comme nous l’avons aussi illustre dans (M’Closkey & Morin, 1998).

S’ils n’y etaient pas tous presents, on peut dire que les resultats precedents etaient contenus,explicitement ou “en germe”, dans notre memoire de these (Morin, 1996b). Depuis lors, notretravail a principalement porte sur deux aspects :

i) robustesse des retours d’etat asymptotiquement stabilisantii) stabilisation de trajectoiresL’utilisation de retours d’etat est avant tout destinee a garantir certaines proprietes de ro-

bustesse vis-a-vis d’erreurs de modele. Bien que cet aspect soit fondamental en automatique, etoccupe une place preponderante dans l’etude des systemes lineaires, il est l’objet de peu d’interetdans le cas des systemes critiques. C’est pourtant la que les problemes sont les plus sensibles, etil nous semble que les proprietes de robustesse doivent egalement etre un sujet d’etude importantdans ce domaine. L’aspect sur lequel nous avons le plus travaille est la robustesse de la propriete destabilite asymptotique vis-a-vis de dynamiques non-modelisees, i.e. le fait que cette propriete restesatisfaite en presence de petites perturbations des champs de vecteurs du systeme qui conserventl’equilibre considere. Pour un systeme de commande lineaire controle par un retour d’etat lineaireasymptotiquement stabilisant, cette propriete de robustesse est toujours verifiee. Ce n’est gene-ralement plus le cas pour des systemes critiques. Ainsi, nous avons montre dans (Lizarraga et al.,1999) que les retours d’etat instationnaires continus et homogenes mentionnes precedemment,qui permettent d’obtenir un taux de convergence exponentiel, ne permettent generalement pasd’obtenir cette propriete de robustesse. En pratique, pour un systeme mecanique, ceci se traduitpar le fait que la moindre incertitude sur les parametres physiques du systeme (geometrie, masse,

Page 20: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

6 Introduction

inertie) peut conduire a des oscillations permanentes sur un cycle limite autour de l’equilibreconsidere. Cette limitation n’est pas specifique aux retours d’etat homogenes, ni meme aux re-tours d’etat instationnaires. Bien qu’il existe, pour certains systemes critiques, des retours d’etatcontinus qui assurent cette propriete de robustesse (Maini et al., 1999), nous n’en connaissonspas qui permettent de garantir conjointement un taux de convergence rapide (i.e exponentiel).Concernant ce probleme, il a cependant ete montre dans (Bennani & Rouchon, 1995) qu’il estpossible d’obtenir, pour des systemes critiques, une certaine forme de stabilite exponentielle, ro-buste vis-a-vis de dynamiques non-modelisees. L’idee consiste a utiliser des commandes en boucleouverte iterees periodiquement. Ces commandes, du type u(x(kT ), t) (t ∈ [kT, (k + 1)T )), sontgeneralement qualifiees de retours d’etat “hybrides”, dans le sens ou elles combinent des aspectstemps continu et temps discret. Elles sont aussi a mi-chemin entre le retour d’etat et la com-mande en boucle ouverte. Le resultat donne dans (Bennani & Rouchon, 1995) etait limite a uneclasse particuliere de systemes sans derive. Nous l’avons generalise dans (Morin & Samson, 1999)a tout systeme sans derive analytique et commandable. Il s’avere malheureusement que ces loisde commande ne sont pas robustes vis-a-vis de certaines autres erreurs de modeles (en particu-lier, des retards d’application de la commande). Le bilan actuel de ces etudes est qu’il n’existeprobablement pas, pour les systemes critiques, de retours d’etat garantissant une stabilisation ex-ponentielle robuste vis-a-vis “d’erreurs de modeles” (i.e. dynamiques non-modelisees, retards decommande, etc, toutes choses pour lesquelles les retours d’etat lineaires possedent, pour les sys-temes lineaires, une marge de robustesse). Nos travaux les plus recents (Morin & Samson, 2003),que nous allons maintenant evoquer dans le cadre de la stabilisation de trajectoires, montrentqu’en abandonnant l’objectif de stabilisation asymptotique au profit d’un objectif de stabilisationpratique, on peut apporter des solutions nouvelles a ce probleme.

La difficulte du probleme de stabilisation asymptotique de points fixes, pour les systemescritiques, provient evidemment du fait que le linearise n’est pas asymptotiquement stabilisable,et donc pas commandable. Le linearise le long de trajectoires de reference peut cependant etrecommandable. Les travaux de (Sontag, 1988; Sontag, 1992) ont montre que pour tout systeme non-lineaire (S), analytique et verifiant la propriete d’accessibilite en tout point, cette propriete estverifiee generiquement, i.e. pour la plupart des trajectoires de reference. Ceci explique pourquoi,fort heureusement, de nombreux problemes de commande de vehicules peuvent etre resolus enutilisant des retours d’etat lineaires. Par exemple, pour les robots mobiles non-holonomes, lesresultats sur la stabilisation asymptotique de trajectoires (Kanayama et al., 1990; Samson & Ait-Abderrahim, 1991; Fliess et al., 1995a) etc. reviennent quasiment toutes a utiliser, localement, desretours d’etat lineaires. Ces commandes n’assurent la convergence de l’erreur de suivi vers zeroque sous des conditions de type “excitation persistante” (i.e. non-convergence de la trajectoirevers un point fixe). On peut alors se demander si l’utilisation de retours d’etat non-lineaires peutpermettre de stabiliser asymptotiquement toute trajectoire de reference. Cette question a etetranchee negativement dans (Lizarraga, 2004), pour une large classe de systemes critiques et deretours d’etat candidats. En quelque sorte, ce resultat explique l’etat de fait selon lequel, pourun meme systeme, differents retours d’etat doivent etre utilises pour stabiliser asymptotiquementdifferentes trajectoires de reference, sans meme que l’on sache affecter a toute trajectoire dereference un retour d’etat asymptotiquement stabilisant. L’approche de commande que nous avonsdeveloppee dans (Morin & Samson, 2003) permet, avec une unique loi de commande, d’obtenir unestabilisation pratique de toute trajectoire dans l’espace d’etat (i.e. trajectoire pas necessairementadmissible). La norme de l’erreur de suivi est asymptotiquement bornee par un seuil, independant

Page 21: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Introduction 7

des trajectoires de reference. Ce seuil peut etre fixe facilement, via les parametres de commande, atoute valeur non nulle. La methode s’applique a tous les systemes dont les champs de commandeverifient la condition de rang et sont invariants a gauche sur un groupe de Lie. Elle reposesur l’utilisation de “frequences variables”, idee utilisee precedemment dans (Dixon et al., 2000)par exemple. Notons egalement que l’utilisation des proprietes de symetrie de groupe pour lacommande a aussi ete proposee independamment dans (Martin & Rouchon, 1998). Cependant,cet article ne contient pas de methode de synthese de lois de commande.

La methode de commande que nous proposons dans (Morin & Samson, 2003) est a l’heureactuelle au cœur de nos travaux. Comme nous venons de le voir, elle ouvre des perspectivesnouvelles dans le domaine de la stabilisation de trajectoires de systemes non-lineaires. Nousillustrerons aussi le fait qu’elle permet d’obtenir des resultats nouveaux en terme de proprietesde robustesse. Plusieurs developpements de cette approche sont actuellement en cours, aussibien methodologiques qu’experimentaux, en particulier dans le cadre de travaux de these. Parconsequent, concernant cette approche, nous nous limiterons essentiellement dans ce memoire ala presentation du resultat methodologique (Morin & Samson, 2003).

3 Organisation du memoire

Ce memoire est divise en deux parties, correspondant a deux lectures possibles de notre travail,et deux“niveaux de technicite”. Le but de cette organisation est de permettre, par la seule lecturede la premiere partie, d’avoir un apercu assez complet de notre approche, sans avoir a rentrer dansdes details mathematiques techniques qui masquent souvent la simplicite de certaines idees. Enparticulier, les methodes de commande presentees dans la premiere partie sont toutes illustrees apartir d’un exemple “simple” : le systeme non-holonome de type voiture. Outre l’interet pratiquequ’il presente, ce systeme permet de mettre en evidence de nombreuses specificites des systemescritiques. L’esprit de la seconde partie, beaucoup plus theorique, est tres different. Il s’agit alorsde presenter quelques methodes de stabilisation assez generales que nous avons developpees, avectoute la technicite que ceci peut necessiter. Vu la difference entre ces deux parties, nous avonsconscience que cette separation introduit une certaine discontinuite dans la presentation. Nouspensons cependant que cela reste preferable a un “juste milieu”, possible, mais qui risque den’interesser personne.

La premiere partie du memoire comporte deux chapitres. Le Chapitre 1 est essentiellementconsacre a la modelisation de systemes mecaniques qui conduisent a des systemes critiques :systemes mecaniques non-holonomes, systemes mecaniques sous actionnes, etc. Ce chapitre necontient pas de resultats originaux de notre part ; il s’agit avant tout de recenser des systemesphysiques significatifs dans le cadre de notre etude, de rappeler les modeles couramment utilisespour la commande, ainsi que certaines proprietes de ces modeles. Le Chapitre 2 est une presenta-tion generale sur la stabilisation par retour d’etat continu des systemes critiques. Les principauxresultats theoriques sont rappeles (existence ou non-existence de retours d’etat permettant deresoudre certains problemes de stabilisation). Des methodes de stabilisation asymptotique depoints fixes, et plus generalement de trajectoires admissibles, sont presentees et commentees.Notre methode de stabilisation pratique de trajectoires generales y est aussi exposee.

La deuxieme partie du memoire est egalement composee de deux chapitres. Nous rappelonsdans le Chapitre 3 des proprietes algebriques structurelles des systemes critiques : developpementsdes solutions en serie de Chen-Fliess, approximation de systemes localement commandables par

Page 22: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

8 Introduction

des systemes homogenes, structure de groupe de Lie associee aux systemes nilpotents. Tous ceselements sont ensuite utilises, dans le Chapitre 4, pour presenter des methodes de synthese deretours d’etat stabilisants : stabilisation exponentielle de points d’equilibre par retour d’etathomogene (Morin et al., 1999), stabilisation exponentielle par retour d’etat hybride (Morin &Samson, 1999), stabilisation pratique de systemes sur des groupes de Lie (Morin & Samson,2003).

Page 23: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Premiere partie

Systemes, problemes, et solutions decommande

9

Page 24: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Chapitre 1

Exemples et modeles de vehicules

Ce chapitre est consacre a la modelisation des vehicules, et plus precisement a ceux d’entreeux qui sont soumis a des contraintes non-holonomes (comme les vehicules a roues), ou/et quine sont que partiellement actionnes (bateaux, satellites sous-actionnes, sous-marins, etc). Cessystemes, que l’on rencontre frequemment en pratique, ont en commun la propriete de conduirea des modeles tres non-lineaires (systemes critiques). Ce chapitre, qui ne contient pas de resul-tats originaux de notre part, a pour but de rappeler les proprietes qui nous semblent les plussignificatives pour l’etude de problemes de stabilisation de ces systemes.

L’organisation de ce chapitre est la suivante. Nous rappelons en Section 1.1 quelques definitionset proprietes classiques d’automatique puis, en Section 1.2, quelques aspects de la modelisation dessystemes mecaniques. La Section 1.3 est consacree aux proprietes de symetrie (ou d’invariance)des vehicules, qu’il est utile de prendre en compte des lors qu’on s’interesse a des problemesde stabilisation de trajectoires. Ces proprietes de symetrie sont utilisees pour la definition demodeles d’erreur par rapport a des trajectoires de reference. Les trois sections suivantes illustrentles notions introduites dans les Sections 1.1–1.3, a travers des exemples de systemes mecaniquesnon-holonomes, sous-actionnes, et non-holonomes sous-actionnes.

1.1 Quelques rappels d’automatique

Nous utilisons tout au long de ce memoire des concepts de geometrie differentielle qui fontmaintenant partie du langage courant de l’automatique non-lineaire (voir e.g. (Nijmeijer &Van der Schaft, 1991; Isidori, 1995)). Dans toute la premiere partie de ce rapport, ces conceptssont seulement utilises pour enoncer certaines proprietes caracteristiques des systemes qui nousinteressent. Une connaissance prealable de geometrie differentielle n’est donc pas vraiment neces-saire, et le lecteur ne souhaitant pas s’investir dans ce domaine pourra tout simplement faire lesidentifications suivantes :

– “variete (differentielle) de dimension n”≈ Rn,– “champ de vecteur sur une variete de dimension n” ≈ fonction de Rn dans Rn infiniment

differentiable,– “forme differentielle sur une variete de dimension n”≈ fonction de Rn dans Rn infiniment

differentiable,– “groupe de Lie de dimension n”≈ Rn+ loi de groupe sur Rn.

Page 25: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Quelques rappels d’automatique 11

Pour une introduction tres accessible, mais neanmoins assez detaillee, a toutes ces notions, nousrenvoyons a (Murray et al., 1994, Appendix A). Pour des exposes plus developpes, voir e.g.(Helgason, 1978; Warner, 1983).

Nous commencons par un rappel de quelques definitions de commandabilite. Nous nous limi-tons a des definitions classiques et pertinentes dans le cadre des problemes (avant tout locaux)qui nous interessent.

Definition 1 Soit un systeme de commande

(S) : x = X0(x) +m∑

i=1

uiXi(x)

sur une variete M de dimension n. On considere comme “commandes admissibles” l’ensemble Udes fonctions u = (u1, . . . , um)′ definies et continues par morceaux sur un intervalle [0, Tu] de R+,et telles que |u(t)| ≤ 1 ∀t ∈ [0, Tu]. On note xu(t, t0, x0) la valeur en t de la solution de (S), pourla commande u et la condition initiale x0 en t = t0. Soit x0 un point d’equilibre de (S) associe ala commande u = 0, i.e. X0(x0) = 0. On dit que

• (S) est commandable en x0, si l’ensemble

xu(t, 0, x0) : u ∈ U , t ∈ [0, Tu]

contient un voisinage de x0. Si ce voisinage est M tout entier, le systeme est dit globale-ment commandable en x0.

• (S) est commandable en temps petit en x0, si pour tout T > 0, l’ensemble

xu(t, 0, x0) : u ∈ U , t ∈ [0,min(T, Tu)]

contient un voisinage de x0.• x0 est atteignable en temps petit pour (S), si pour tout T > 0, il existe un voisinageO de x0 tel que, pour tout xi ∈ O,

x0 ∈ xu(t, 0, xi) : u ∈ U , t ∈ [0,min(T, Tu)]

Il est clair que la notion de commandabilite en temps petit est plus forte que la notion decommandabilite. Pour les systemes sans derive, ces deux notions sont en fait equivalentes, et unresultat classique (Chow, 1939) fournit un moyen de verifier ces proprietes (voir e.g. (Nijmeijer& Van der Schaft, 1991, Prop. 3.15) pour une preuve).

Theoreme 1 Soit un systeme sans derive (S0) sur une variete M de dimension n. Alors, si

dim L(X1, . . . , Xm)(x0) = n (1.1)

(S0) est commandable en x0. Si (1.1) est verifiee pour tout x0 et M est une variete connexe, alors(S0) est globalement commandable en tout x0 ∈M .

Rappelons que L(X1, . . . , Xm)(x0) est l’espace vectoriel engendre par les vecteurs

Xi(x0), [Xi, Xj ](x0), [Xi, [Xj , Xk]](x0), . . . avec i, j, k, . . . ∈ 1, . . . ,m

Page 26: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

12 Exemples et modeles de vehicules

Lorsque M et les champs Xi sont analytiques, les conditions sur L(X1, . . . , Xm)(x0) donnees dansle theoreme precedent sont aussi des conditions necessaires de commandabilite. La condition (1.1)est appelee condition de rang de l’algebre de Lie ou simplement condition de rang.

Pour les systemes avec derive, il n’y a plus equivalence entre commandabilite et commanda-bilite en temps petit. Plusieurs criteres algebriques ont ete proposes pour verifier la propriete decommandabilite en temps petit, mais aucune condition necessaire et suffisante n’est connue a cejour, meme dans le cas analytique. La condition suffisante de (Sussmann, 1987, Th. 7.2) reste l’undes criteres les plus aboutis. Nous l’enoncons ci-dessous avec les notations introduites en debutde ce memoire.

Definition 2 Etant donne un multi-index I = (i1, . . . , i|I|), on notei) BI(X) le crochet de Lie [Xi1 , [. . . , [Xi|I|−1

, Xi|I| ] . . .]],ii) BI(X) le symetrise de BI(X), i.e.

BI(X) :=∑

σ∈Pm

Bσ(I)(X)

avec Pm le groupe de permutations de 0, 1, . . . ,m qui laisse 0 invariant, et pour toutσ ∈ Pm, σ(I) := (σ(i1), . . . , σ(i|I|))

iii) ‖I‖θ := θ|I|0 +∑m

k=1 |I|k avec |I|k := |j : ij = k|.On dit que le systeme (S) satisfait la condition de Sussmann S(θ) en x0 si, pour tout I tel que|I|0 est impair et |I|k est pair pour tout k = 1, . . . ,m, on a

BI(X)(x0) ∈ spanBJ(X)(x0) : ‖J‖θ < ‖I‖θ

Le theoreme de Sussmann s’enonce alors comme suit :

Theoreme 2 (Sussmann, 1987) Soit x0 un point d’equilibre du systeme (S). On suppose quedim L(X0, . . . , Xm)(x0) = n et que la condition de Sussmann S(θ) est verifiee en x0 pour uncertain θ ∈ [0, 1]. Alors

i (S) est commandable en temps petit en x0.

ii) x0 est atteignable en temps petit pour (S).

Notons que la propriete ii) d’atteignabilite enoncee dans le resultat precedent ne fait paspartie du resultat original de Sussmann mais qu’elle en decoule tres facilement. En effet, par“renversement du temps” (i.e. changement de variable temporelle t 7−→ −t), on montre qu’unsysteme (S) est commandable en temps petit en x0 si et seulement si x0 est atteignable en tempspetit pour le systeme (S)− obtenu a partir de (S) en remplacant le champ de derive X0 par −X0.Il suffit alors de remarquer que si la condition de Sussmann est verifiee pour le systeme (S), ellel’est aussi pour (S)−.

Nous terminons ces rappels de commandabilite par une derniere definition (Coron, 1992b).

Definition 3 Un equilibre x0 du systeme (S) est dit continuement atteignable en temps pe-tit, si pour tout T > 0, il existe un voisinage O de x0 et une commande u ∈ C0(O;L1((0, T ); Rm))telle que :

1. supp.p.|u(xi)(t)| : t ∈ [0, T ] −→ 0 quand xi −→ 0,

Page 27: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Rappel sur la modelisation des systemes mecaniques 13

2. pour tout xi ∈ O, x0 = xu(T, 0, xi) avec u(t) := u(xi)(t)

Autrement dit, cette definition revient essentiellement a la definition de point atteignable entemps petit, avec en plus la continuite par rapport a la condition initiale de la commande quipermet de transferer cette condition initiale au point x0 considere. Comme nous le preciseronsdans le chapitre suivant, l’interet de cette nouvelle definition d’atteignabilite est qu’elle permet degarantir l’existence de retours d’etats asymptotiquement stabilisants. En outre, on a le resultatsuivant.

Proposition 1 (Coron, 1992b) Sous les hypotheses du Theoreme 2, x0 est continuement attei-gnable en temps petit pour (S).

Terminons cette section de rappels par quelques definitions classiques de stabilite (uniforme)(voir e.g. (Hahn, 1967; Rouche et al., 1977) pour plus de details).

Definition 4 Soit une equation differentielle x = X(x, t) sur une variete M , avec X continuede M × R dans TM . On note, de facon generique,1 x(t, t0, x0) la valeur en t d’une solution decette equation differentielle pour la condition initiale x0 en t = t0. Un point d’equilibre x0 de cetteequation differentielle est dit :

• stable, si pour tout voisinage Of de x0, il existe un voisinage Oi de x0 tel que

∀t0,∀x0 ∈ Oi,∀x(., t0, x0),∀t ≥ t0, x(t, t0, x0) ∈ Of (1.2)

• attractif, s’il existe un voisinage Oi de x0 tel que, pour tout voisinage Of de x0,

∃τ > 0 : ∀t0, ∀x0 ∈ Oi, ∀x(., t0, x0),∀t ≥ t0 + τ, x(t, t0, x0) ∈ Of (1.3)

Lorsque la propriete d’attractivite est satisfaite pour tout voisinage Oi de x0 compact, lesysteme est dit globalement attractif.

• asymptotiquement stable, s’il est stable et attractif,• globalement asymptotiquement stable, s’il est stable et globalement attractif.

1.2 Rappel sur la modelisation des systemes mecaniques

On s’interesse dans ce memoire a des systemes mecaniques soumis a des contraintes sur lesvitesses (contraintes non-holonomes) et/ou sous-actionnes au sens ou le nombre d’actionneursindependants est inferieur a la dimension de l’espace des vitesses accessibles2. La modelisation deces systemes, que nous rappelons ici dans un langage de geometrie differentielle, est tres classique(voir e.g. (Campion et al., 1991; Murray et al., 1994; Lewis, 2000) pour plus de details, ainsi quepour des resultats complementaires).

On considere un systeme mecanique defini par les donnees suivantes :

1. un espace de configuration Q, assimile a une variete differentielle de dimension nc,

1Puisque X est seulement continue, l’unicite des solutions n’est pas garantie.2Cette dimension est souvent appelee le nombre de degres de liberte.

Page 28: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

14 Exemples et modeles de vehicules

2. un ensemble de contraintes cinematiques,

〈ai(q), q〉 = 0, (i = 1, . . . , nc − nv ≥ 0) (1.4)

ou chaque ai est une forme differentielle reguliere sur Q, i.e. ai(q) ∈ T ∗q Q (≈ Rnc).

3. un Lagrangien L : TQ −→ R egal a la difference entre l’energie cinetique et l’energiepotentielle du systeme. En identifiant q ∈ Q avec le vecteur de coordonnees associe (pourun systeme de coordonnees relatif), on a

L(q, q) =12q′M(q)q − V (q) (1.5)

avec M(q) la matrice d’inertie, symetrique definie positive, et V (q) l’energie potentielle.

4. un ensemble de forces exterieures agissant sur le systeme f0, u1f1, . . . , unaf

na. Du pointde vue de la geometrie differentielle, chaque fk peut etre definie comme une fonction deTQ×R dans T ∗Q, i.e. fk : (q, q, t) 7−→ f(q, q, t). Les termes u1f

1, . . . , unafna correspondent

aux forces delivrees par les actionneurs, avec u1, . . . , una ∈ R les entrees de commande. Leterme f0 correspond aux autres forces exterieures (forces dissipatives, perturbations, etc).

Afin de ne pas compliquer l’expose, nous allons faire deux hypotheses relatives aux contraintescinematiques ai, dans le but de pouvoir definir un modele cinematique approprie aux problemesde commande. Il est generalement possible de se placer dans le cadre de ces hypotheses, apresune eventuelle restriction de l’espace de configuration Q initialement choisi. Les deux hypothesesqui suivent signifient essentiellement que cette etape de restriction a deja ete effectuee.

Hypothese 1 (definition de l’espace des vitesses) Les contraintes cinematiques (1.4) sont inde-pendantes au sens ou, ∀q ∈ Q, les ai(q) ∈ T ∗q Q sont lineairement independants. De plus il existedes champs de vecteurs reguliers b1, . . . , bnv sur Q, lineairement independants en tout point deQ, et orthogonaux aux contraintes a1, . . . , anc−nv , i.e.

∀(i, j),∀q, 〈ai(q), bj(q)〉 = 0 (1.6)

Discutons brievement la possibilite de satisfaire cette hypothese, localement au voisinage d’uneconfiguration q0 ∈ Q. Deux cas de figure se presentent :

1. Dans un voisinage de q0, l’espace vectoriel engendre par les ai(q) est de dimension constanter. Dans ce cas, on peut toujours supposer que les ai(q) sont lineairement independantes surce voisinage, en ne conservant que r contraintes (les autres etant redondantes). L’indepen-dance de ces r contraintes implique alors, dans un voisinage de q0, l’existence de champsde vecteurs b1, . . . , bnc−r lineairement independants en tout point, et satisfaisant (1.6) (voire.g. (Murray, 1994, Prop. 7.3)).

2. Il n’existe pas de voisinage de q0 dans lequel l’espace vectoriel engendre par les ai(q) est dedimension constante. Dans ce cas, l’hypothese 1 ne peut pas etre satisfaite au voisinage deq0. Cette situation, particulierement singuliere, correspond au cas ou, dans tout voisinage deq0, il existe des configurations pour lesquelles l’espace des vitesses possibles est strictementinferieur a l’espace des vitesses possibles en q0 (voir Section 1.6 pour un exemple).

Hypothese 2 (commandabilite du modele cinematique) La condition de rang (1.1), avec x0 = qet X1, . . . , Xm = b1, . . . , bnv, est verifiee en tout q ∈ Q.

Page 29: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Rappel sur la modelisation des systemes mecaniques 15

Comme pour l’hypothese precedente, discutons la possibilite de satisfaire l’Hypothese 2 en dis-tinguant les deux cas suivants.

1. Dans un voisinage de q0, dim L(b1, . . . , bnv)(q) est constante, egale a n′c. Si nc = n′c, l’hy-pothese est satisfaite. Sinon, les contraintes cinematiques contiennent des contraintes in-tegrables, i.e. contraintes du type h(q) = c0, avec c0 une constante. Plus precisement,par application du theoreme de Frobenius (voir e.g. (Nijmeijer & Van der Schaft, 1991)),toutes les trajectoires q(t) du systeme avec conditions initiales dans un voisinage de q0, sontcontenues dans une sous-variete de Q de dimension n′c. Ceci signifie qu’il est possible, sansperte d’information sur le systeme, d’eliminer nc − n′c variables de configuration pour seramener, autour de la configuration q0, a un espace de configuration de dimension n′c surlequel l’Hypothese 2 devient satisfaite.

2. Il n’existe pas de voisinage de q0 dans lequel dim L(b1, . . . , bnv)(q) est constante. Dans cecas, il est plus difficile de dire en general si, en restreignant l’espace de configuration Q,l’Hypothese 2 peut etre satisfaite. Notons que si les champs bi sont analytiques, le systemene peut alors pas etre commandable en q0.

Lorsque les Hypotheses 1 et 2 sont satisfaites, on dit que les contraintes cinematiques (1.4) sont(totalement) non-holonomes. Dans ce cas, le modele cinematique du systeme est directementdonne par

q =nv∑i=1

vibi(q) (1.7)

Les variables vi correspondent aux composantes du vecteur vitesse q dans la base b1, . . . , bnv.L’Hypothese 2 implique la commandabilite locale de ce systeme en tout point, et la commanda-bilite globale si Q est connexe.

Les equations de Lagrange sont donnees, dans le systeme de coordonnees q = (q1, . . . , qnc)′,par

d

dt

∂L

∂q− ∂L

∂q= A(q)λ+ F (q, q, t) (1.8)

aveci) A(q) ∈ Rnc×(nc−nv) la matrice dont le j-eme vecteur colonne correspond aux composantes

de aj(q) dans la base dq1, . . . , dqnc,

ii) λ ∈ Rnc−nv le vecteur des parametres de Lagrange,iii) F le vecteur des forces generalisees associees aux forces exterieures :

F = F 0 +na∑

k=1

ukFk (1.9)

avec la i-eme composante de F k (k = 0, . . . , na) donnee par

F ki (q, v, t) = 〈fk(q, q, t),

∂qi〉 (1.10)

L’application de (1.8) avec le Lagrangien (1.5) conduit aux equations classiques

M(q)q +N(q, q)q +G(q) = A(q)λ+ F (q, q, t) (1.11)

Page 30: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

16 Exemples et modeles de vehicules

avec

Nij(q, q) =12

nc∑k=1

(∂Mij

∂qk+∂Mik

∂qj−∂Mkj

∂qi

)qk, G(q) =

∂V

∂q(q)

Par definition des champs bj (voir Hypothese 1), la matrice B(q) ∈ Rnc×nv , dont le j-eme vecteurcolonne correspond aux composantes de bj dans le systeme de coordonnees relatif a q, est de rangplein et verifie, d’apres (1.6), l’egalite

B′(q)A(q) = 0

On peut alors eliminer le vecteur des parametres de Lagrange en multipliant chaque membre del’egalite (1.11) par B′(q) :

B′(q)M(q)q +B′(q)N(q, q)q +B′(q)G(q) = B′(q)F (q, q, t) (1.12)

En derivant l’egalite (1.7) et en remplacant dans (1.12) q par la valeur ainsi obtenue, cette derniereequation devient :

B′(q)M(q)B(q)v+B′(q)M(q)B(q)v+B′(q)N(q,B(q)v)B(q)v+B′(q)G(q) = B′(q)F (q,B(q)v, t)

ou encore,M(q)v + N(q, v)v + G(q) = F (q, v, t) (1.13)

avec M(q) = B′(q)M(q)B(q)

N(q, v) = B′(q)M(q)B(q) +B′(q)N(q,B(q)v)B(q)G(q) = B′(q)G(q)

F (q, v, t) = B′(q)F (q,B(q)v, t)

(1.14)

En utilisant (1.9), on obtient a partir de (1.13),

M(q)v + N(q, v)v + G(q) = F 0(q, v, t) +na∑

k=1

ukFk(q, v, t) (1.15)

avec∀k = 0, . . . , na, F k(q, v, t) = B′(q)F k(q,B(q)v, t)

Le modele dynamique du systeme mecanique, sous forme de modele de commande, est obtenuen regroupant les equations (1.7) et (1.15), i.e.

q =nv∑i=1

vibi(q)

v = (M(q))−1

(F 0(q, v, t)− G(q)− N(q, v)v +

na∑k=1

ukFk(q, v, t)

) (1.16)

Par commodite, nous introduisons une derniere hypothese :

Hypothese 3 (independance des actionneurs) Les vecteurs F k(q, v, t) (k = 1, . . . , na) sont li-neairement independants en tout (q, v, t).

Page 31: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Proprietes de symetrie des vehicules et systemes d’erreur 17

Cette hypothese permet de faire une classification des systemes en fonction des relations entrenc : dimension de l’espace de configuration, nv : dimension de l’espace des vitesses possibles, etna : nombre d’actionneurs independants.

Definition 5 Sous les Hypotheses 1, 2, et 3, on dira que le systeme mecanique est :i) non-holonome si na = nv < nc,ii) sous-actionne si na < nv = nc,iii) non-holonome sous-actionne si na < nv < nc.

1.3 Proprietes de symetrie des vehicules et systemes d’erreur

La propriete la plus caracteristique des vehicules est celle d’invariance par rapport a desgroupes de mouvements rigides dans le plan ou dans l’espace. Intuitivement, cette propriete si-gnifie que la dynamique propre3 du systeme est independante de la situation du systeme, i.e. desa position et/ou de son orientation. Il est utile de prendre en compte ses aspects d’invariance,en particulier pour la definition de modeles d’erreurs. D’un point de vue mathematique, la no-tion de “symetrie”, que nous rappelons ci-dessous, permet de rendre compte de ces proprietes.Commencons d’abord par la definition d’un groupe de Lie.

Definition 6 Un groupe de Lie G est une variete analytique munie d’une loi de groupe (g, h) 7−→gh sur G, analytique, et telle que l’application g 7−→ g−1 est aussi analytique.

L’element neutre d’un groupe G sera note e. Nous rappelons maintenant les notions de symetrie.Dans le cadre de l’automatique, un article de reference sur le sujet est (Grizzle & Marcus, 1985).Nous nous limiterons ici au cas particulier des symetries d’etat.

Definition 7 Soit un systeme (S) defini sur une variete M de dimension n, et Φ : M −→M undiffeomorphisme, on dit Φ est une symetrie pour (S) si, pour toute solution x(t) de (S) associeea une commande u(t), Φ(x(t)) est aussi une solution de (S) associee a la meme commande u(t).

Soit Φ : G ×M −→ M , avec G un groupe de Lie. On suppose que pour tout x ∈ M et toutg, h ∈ G, Φ(e, x) = x et Φ(g, Φ(h, x)) = Φ(gh, x)). Alors, si pour tout g ∈ G, Φ(g, .) est unesymetrie pour (S), on dit que Φ est un groupe de symetries pour (S).

On suppose que (S) est defini sur M = G avec G un groupe de Lie G. On dit que (S) est unsysteme sur un groupe ou qu’il est invariant a gauche sur G, si l’operation de groupe surG, i.e. Φ : G×G −→ G definie par Φ(g, h) = gh, est un groupe de symetries pour (S).

Pour les vehicules, dont la situation est assimilable a un element d’un groupe de Lie G (ty-piquement G est l’un des groupes suivants : SE(2), SE(3), SO(3), . . .) les proprietes de symetriepeuvent etre mises a profit pour l’ecriture des equations d’erreur par rapport a un repere mobile.Plus precisement, selon la modelisation proposee dans (Bloch et al., 1996), l’espace de configura-tion Q des vehicules peut tres souvent etre decompose comme un produit Q = G × S avec G legroupe de Lie associe a la situation du systeme, et S un espace associe a des variables internes.Par exemple, pour un vehicule de type voiture, on aura typiquement G = R2 × S1 ≈ SE(2)

3Exception faite de forces exterieures qui peuvent etre fonction de la situation du systeme

Page 32: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

18 Exemples et modeles de vehicules

associe au couple position/orientation du vehicule par rapport a un repere fixe du plan, et S = S1

associe a la variable interne d’angle volant. Cette decomposition conduit a ecrire,

q =(gs

), avec g ∈ G, s ∈ S

et le modele cinematique (1.7) peut aussi etre decompose comme :g =

nv∑i=1

vibgi (g, s)

s =nv∑i=1

vibsi (s)

(1.17)

Les vehicules sont caracterises par le fait que l’application Φ : G×Q −→ Q definie par

∀h ∈ G, ∀q = (g, s) ∈ Q = G× S, Φ(h, q) = (hg, s) (1.18)

est un groupe de symetries pour le systeme (1.17). Il decoule de cette propriete que si t 7−→gr(t) ∈ G represente un “repere mobile”, le modele cinematique par rapport a ce repere est donnepar

˙g =nv∑i=1

vibgi (g, s)− drg(e)(dlgr(e))

−1gr

s =nv∑i=1

vibsi (s)

(1.19)

avec• g := g−1

r g : la situation du systeme par rapport au repere mobile,• lg : la translation a gauche sur G definie par lg(h) := gh, et rh : la translation a droite surG definie par rh(g) := gh,

• d :l’operateur de differentiation, i.e. df(x) est la differentielle en x de l’application f .Par identification de (1.7) et (1.17), le systeme (1.19) peut aussi s’ecrire

˙q =nv∑i=1

vibi(q) + P (q, t) (1.20)

avec

q =(gs

), P (q, t) =

(−drg(e)(dlgr(e))−1gr

0

)Il est clair que (1.20) est une generalisation de (1.7). Une propriete remarquable de (1.20), lieeau choix de g et a la propriete supposee de symetrie de groupe, est que les champs de commandeassocies a (1.20) sont les memes que ceux du modele (1.7).

Dans de nombreux cas, les termes de l’equation (1.15) ne dependent de q que par le biais desvariables internes s, i.e. ces termes sont independants de g. Dans ce cas, on obtient directementun modele dynamique par rapport au repere mobile, en remplacant la premiere egalite de (1.16)par (1.20), et en substituant q a q dans la seconde egalite de (1.16).

Les proprietes de symetrie de groupe sont utiles pour definir des systemes d’erreur par rapporta des trajectoires de reference. Nous evoquons brievement ci-dessous une definition possible de

Page 33: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Proprietes de symetrie des vehicules et systemes d’erreur 19

systeme d’erreur, pour les modeles cinematiques des vehicules, a partir de la decomposition (1.17)(voir (Bullo & Murray, 1999) pour des resultats complementaires). On considere une trajectoirede reference t 7−→ qr(t) = (gr(t), sr(t)) pour le systeme (1.17). En general, S est un produit dutype S1×· · ·×S1 ou R×· · ·×R. C’est donc aussi un groupe abelien, et l’on peut donner un sensa s := s− sr. Un choix possible de variable d’erreur est

q :=(gs

):=(g−1r g

s− sr

)(1.21)

Evidemment ce choix n’est pas unique et en particulier, des choix differents de s peuvent etreplus adaptes a la synthese de lois de commande. Lorsque les champs de vecteurs bi sont affinespar rapport a s, ce choix de s semble pertinent. Il decoule directement de (1.21) et (1.19) que

˙g =nv∑i=1

vibgi (g, s+ sr)− drg(e)(dlgr(e))

−1gr

˙s =nv∑i=1

vibsi (s+ sr)− sr

(1.22)

Lorsque la trajectoire de reference qr est admissible, i.e. s’il existe des fonctions du temps vri

telles que

∀t, qr(t) =nv∑i=1

vri (t)bi(qr(t))

on peut exprimer (1.22) de la facon suivante :˙g =

nv∑i=1

vibgi (g, s+ sr) +

nv∑i=1

vri (bgi (g, s+ sr)− drg(e)b

gi (e, sr))

˙s =nv∑i=1

vibsi (s+ sr) +

nv∑i=1

vri (bsi (s+ sr)− bsi (sr))

(1.23)

avec vi := vi − vri . On verifie facilement que (g = e, s = 0, v = 0) est bien un point d’equilibre

de (1.23). Etant donne un systeme de coordonnees x au voisinage de ce point d’equilibre, quiconserve la decomposition Q = G× S, i.e.

x =(xg(g)xs(s)

)la linearisation du systeme d’erreur (1.23) au point d’equilibre (g = e, s = 0, v = 0) donne :

˙x =nv∑i=1

vriAi(sr(t))x+B(sr(t))v (1.24)

avec B(sr) = (b1(0, sr) · · · bnv(0, sr)) (plus precisement il faut considerer ici l’expression deschamps bi dans les coordonnees x), et les Ai des matrices deduites de (1.23). Notons que celinearise ne depend pas de gr, ce qui est encore une consequence de la propriete de symetrie.

Nous allons maintenant illustrer les definitions et proprietes rappelees dans les sections pre-cedentes sur des exemples physiques.

Page 34: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

20 Exemples et modeles de vehicules

1.4 Les systemes non-holonomes

En utilisant l’Hypothese 3 et le fait que, par definition, na = nv, l’equation (1.15) peut etrelinearisee en v = w, avec w une nouvelle entree de commande reliee bijectivement, pour (q, v, t)fixe, a l’entree de commande u = (u1, . . . , una)′ par la relation

w = (M(q))−1

(F 0(q, v, t) +

na∑k=1

ukFk(q, v, t)− G(q)− N(q, v)v

)

Avec cette nouvelle variable de commande, le modele dynamique (1.16) devient : q =nv∑i=1

vibi(q)

v = w

(1.25)

Comme nous l’avons deja indique, l’hypothese 2 implique la commandabilite du modele cinema-tique (1.7). En ce qui concerne le modele dynamique complet, on a le resultat suivant.

Theoreme 3 (Campion et al., 1991)[Th. 2] Pour tout q0 ∈ Q, le modele dynamique (1.25) estcommandable en temps petit au point d’equilibre (q, v) = (q0, 0).

Dans la plupart des etudes de commande des systemes non-holonomes, on se limite au modelecinematique, sachant qu’une fois une commande en vitesse v∗ determinee, il n’est generalementpas difficile, a partir de (1.25), de determiner une commande en couple permettant de “realiser” lavitesse v∗. Par exemple, si v∗ est une fonction differentiable par rapport a t le long des solutions dumodele cinematique commande alors, en notant v∗ cette derivee temporelle, la loi de commande

w = v∗ − k(v − v∗)

avec k > 0 assure la stabilite exponentielle de v−v∗ a zero, ce qui est la plupart du temps suffisantpour garantir des proprietes de stabilite pour le modele dynamique commande “similaires” a cellesdu modele cinematique commande par v = v∗. Dans les exemples que nous considerons ci-dessous,nous nous limiterons donc a l’etude du modele cinematique.

1.4.1 L’unicycle : corps rigide non-holonome sur SE(2)

Les contraintes de roulement sans glissement se traduisent, pour chaque roue, par deuxcontraintes cinematiques, soit au total quatre contraintes. On montre facilement qu’il n’y a quetrois contraintes independantes que l’on peut definir comme suit :

0 = 〈a1(q), q〉 = x cos θ + y sin θ − r2(φg + φd)

0 = 〈a2(q), q〉 = −x sin θ + y cos θ0 = 〈a3(q), q〉 = θ − r

2R(φd − φg)(1.26)

avec r le rayon des roues et R la distance de P0 a chaque roue. La derniere contrainte est clairementintegrable, i.e.

θ − r

2R(φd − φg) = cste

Page 35: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Les systemes non-holonomes 21

........................

............................................

........................ ..........................................................

........................

..........................................................

tpppppppppppppppppppppppppppp

pppppppppppppppppppppppppppp..........................................................................................................................................

................................

................................

................................

................................

................................

................................

..........................................................................................................................................................................................................................................................................................................................................................................

....................

....................

....................

.

........................

........................ qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqθ

0

j

ix

yP0

φg

φd

..........

..........

..........

..........

..........

..........

..........

..........

..........

..........

..........

.......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... ..........

Figure 1.1: Unicycle

ce qui permet de supprimer une variable de configuration, par exemple φd. Il ne reste alors quedeux contraintes cinematiques, a1 et a2, totalement non-holonomes. Ainsi, pour q := (x, y, θ, φg),element de l’espace de configuration Q := R2 × S1 × S1, le modele cinematique (1.7), i.e.

q = v1b1(q) + v2b2(q) (1.27)

est defini par la donnee des deux champs de vecteurs

b1(q) =

cos θsin θ

01r

, b2(q) =

001−R

r

On peut alors verifier que ces deux champs satisfont bien les Hypotheses 1 et 2 de la Section 1.2pour les contraintes cinematiques a1 et a2. En utilisant (1.26), on peut relier v1 et v2 dans (1.27)a φg et φd qui constituent les variables physiquement commandees en bas niveau :

v1 = r2(φg + φd)

v2 = r2R(φd − φg)

(1.28)

La derniere variable de configuration φ1 est generalement omise dans l’etude du modele cinema-tique (1.27), ce qui revient a considerer le systeme

x = v1 cos θy = v1 sin θθ = v2

(1.29)

Ce systeme est defini sur Q = R2 × S1 que l’on peut identifier a SE(2) le groupe de Lie desmouvements rigides du plan. Avec les notations de la Section 1.3, on a Q = G = R2 × S1 etS = ∅. La loi de groupe sur G est definie parx1

y1

θ1

x2

y2

θ2

=

(x1

y1

)+R(θ1)

(x2

y2

)θ1 + θ2

(1.30)

Page 36: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

22 Exemples et modeles de vehicules

et on montre facilement que (1.29) est un systeme invariant a gauche sur G. Le terme P de (1.20),definissant la cinematique par rapport a un repere mobile, est donne par

P (q, t) := −

R(−θr)(−yx

)0 1

gr

avec q = g = (x, y, θ).

1.4.2 La voiture

........................

............................................

..

........................

........

...........................

..........................

tt

........................

........................

....................

....................

....................

....................

....................

....................

....................

..........

pppppppppppppppppppppppppppppppppppppppppppppppppppppppp

pppppppppppppppppppppppppppppppppppppppppppppppppppppppp..........................................................................................................................................

................................

................................

................................

................................

................................

................................

..........................................................................................................................................................................................................................................................................................................................................................................

qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

i

θ

ϕ

x0

y

j

P0

P1

.......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .....................................................................................................

...................................................

Figure 1.2: Voiture

Par rapport a l’unicycle, le modele de la voiture s’obtient en incluant les contraintes ci-nematiques associees aux roues avant directrices. Ces contraintes reviennent a considerer deuxcontraintes relatives a une seule roue directrice (virtuelle), d’orientation definie par un angle ϕ(voir Figure 1.2), i.e.

0 = 〈a4(q), q〉 = ddt(x+ ` cos θ) cos(θ + ϕ) + d

dt(y + ` sin θ) sin(θ + ϕ)− rφv

0 = 〈a5(q), q〉 = − ddt(x+ ` cos θ) sin(θ + ϕ) + d

dt(y + ` sin θ) cos(θ + ϕ)(1.31)

avec φv l’angle de rotation interne de la roue virtuelle, et ` la distance de P0 a P1. Apres quelquesmanipulations et en omettant, comme pour l’unicycle, une variable de rotation interne de rouecommandable, le modele cinematique de la voiture, du type (1.27), est donne par

x = v1 cos θy = v1 sin θθ = v1

tan ϕ`

ϕ = v2

(1.32)

Notons que ceci n’est qu’un des modeles possibles (associe a un choix des champs b1 et b2). Enparticulier, la variable v1 etant reliee aux vitesses de rotation interne des roues par les egalites

v1 =r

2(φg + φd) = rφv cosϕ

Page 37: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Les systemes non-holonomes 23

on aurait tout aussi bien pu considerer le modelex = v1 cosϕ cos θy = v1 cosϕ sin θθ = v1

sin ϕ`

ϕ = v2

(1.33)

ou v1 designerait cette fois rφv. La pertinence d’un choix par rapport a un autre, d’un point devue pratique, depend du type de motorisation du systeme, en particulier du fait que le vehiculeest actionne en “traction avant” (modele (1.33)), ou en “traction arriere” (modele (1.32)).

L’espace de configuration du systeme (1.32) est Q := R2 × S1 × (−π/2, π/2) que l’on peutidentifier a SE(2)× (−π/2, π/2). Il est facile de verifier que l’hypothese 2 de commandabilite estbien satisfaite. Un modele equivalent, et legerement plus simple, est donne par

x = u1 cos θy = u1 sin θθ = u1ζ

ζ = u2

(1.34)

Il se deduit de (1.32) en definissant

ζ :=tanϕ`

, u1 := v1, u2 :=v2

` cos2 ϕ(1.35)

Il est equivalent de travailler avec l’un ou l’autre de ces deux systemes puisque le changement devariable sous-jacent n’introduit pas de singularite.

Avec les notations de la Section 1.3, l’espace de configuration Q du modele (1.32) (resp. (1.34))admet la decomposition Q = G× S avec G = R2 × S1 et S = S1 (resp. S = R). La loi de groupesur G est la meme que celle de l’unicycle, i.e. (1.30). Contrairement a l’unicycle, le systeme (1.32)(resp. (1.34)) n’est plus un systeme invariant a gauche sur un groupe, a cause de la “variableinterne” ϕ (resp. ζ), mais il possede bien le groupe de symetries (1.18). On peut donc utiliserles systemes d’erreur etablis dans la Section 1.3. Par exemple, pour le modele (1.34), le systemed’erreur (1.23) associe a une trajectoire de reference admissible est donne par :

˙g = u1

cos θsin θζ + ζr

+ ur1

cos θ − 1 + yζrsin θ − xζr

ζ

˙ζ = u2

(1.36)

Un autre modele cinematique pour la voiture est le systeme chaıne de dimension quatre,introduit par (Murray & Sastry, 1991) :

x1 = u1

x2 = u2

x3 = u1x2

x4 = u1x3

(1.37)

Page 38: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

24 Exemples et modeles de vehicules

Ce systeme est obtenu a partir de (1.32) par le changement de variables d’etat et de commandex1 = x

x2 =tanϕ` cos3 θ

x3 = tan θx4 = y

u1 = v1 cos θ

u2 = 3v1sin θ tan2 ϕ

`2 cos4 θ+ v2

1` cos3 θ cos2 ϕ

(1.38)

qui lui, n’est defini que pour θ ∈ (−π/2, π/2). En contrepartie de cette limitation, ce modelepossede certaines proprietes interessantes. Outre sa simplicite, on a :

Proposition 2 Le systeme (1.37) est• globalement commandable sur R4,• invariant a gauche sur R4 muni de la loi de groupe

xy =

x1 + y1

x2 + y2

x3 + y3 + y1x2

x4 + y4 + 12y

21x2 + y1x3

Notons qu’un interet de la structure de groupe est de pouvoir definir des systemes d’erreur parrapport a des trajectoires de reference xr via la variable d’erreur x = x−1

r x (cf. Section 1.3).

1.4.3 Le chariot avec remorques a attaches centrees

La voiture peut etre vue comme un unicycle (assimile a la roue directrice virtuelle) avec uneremorque. La generalisation de ce systeme est le chariot a N remorques a attaches centrees.

....................

....................................

............................

........

....................

.... ....................

....................................

....

............................

........

....................

....

.................... ......................................................................

..............................................................................

ss s

ss

................................................................................................

....................................................................................................................

....................

....................

............

........

........

........

........

........

........

........

........

........

........

........

.....

................................................................................................................................

................................................................................................

.......... .......... .......... .......... ..

....................

....................

.......... .......... .......... .......... ..

....................

....................

....................

....................

qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

................................................................................................................

........

........

........

........

........

........

........

........

........

........

........

........

qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqϕ1ϕ2

ϕN

i

jP0

`1

`2

0

`0

θ0

PN

φd

φg

Figure 1.3: Le chariot avec N remorques

Comme dans le cas de la voiture, il existe plusieurs modeles possibles, associes a differentschoix des champs b1 et b2, et des variables de configuration. Sachant que le vehicule “de tete”

Page 39: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Les systemes non-holonomes 25

est celui qui est directement commande, un choix naturel consiste a choisir comme variables deconfigurations q = (xN , yN , θN , . . . , θ0)′ avec (xN , yN ) les coordonnees du point PN situe au milieude l’axe des roues du chariot de tete, et θi l’orientation de chacun des chariots (numerotes de 0a N en partant du chariot de queue), i.e.

θi = θ0 +i∑

k=1

ϕi (i = 1, . . . , N) (1.39)

Ce choix conduit au modele suivant :

xN = v1 cos θN

yN = v1 sin θN

θN = v2

θi =v1`i

(N∏

k=i+2

cos(θk − θk−1)

)sin(θi+1 − θi) (i = N − 1, . . . , 0)

(1.40)

ou v1 et v2 sont donnes par (1.28). Ce modele a l’avantage d’etre bien defini sur l’espace deconfiguration R2× (S1)N+1. Il a ete montre dans (Laumond, 1991) que la condition de rang (1.1)etait verifiee en tout point de cette espace de configuration, d’ou la commandabilite globale dece systeme.

Un autre choix possible de variables de configuration est q = (x0, y0, θ0, ϕ1, . . . , ϕN )′, ou(x0, y0) correspond cette fois au vecteur des coordonnees du point P0 associe au chariot de queue.Le modele correspondant se deduit facilement de (1.39) et (1.40). En particulier, si l’on introduitles variables v1 et v2 definies par v1 = v1

N∏k=1

cosϕk

v2 = v2 − v1`N−1

sinϕN

on obtient le modele suivant, qui generalise (1.32)

x0 = v1 cos θ0y0 = v1 sin θ0θ0 = v1

tan ϕ1

`0

ϕi = v11∏i

k=1 cosϕk

(tanϕi+1

`i− sinϕi

`i−1

)(i = 1, . . . , N − 1)

ϕN = v2

(1.41)

L’espace de configuration de ce systeme est Q = R2 × S1 × (−π/2, π/2)N . Par rapport a (1.40),on a ainsi introduit une restriction du domaine de definition. Ceci est du aux choix des variablesde commandes v1 et v2, qui revient a faire un choix different des champs de commande b1 et b2.Notons que Q admet egalement la decomposition de la Section 1.3 : Q = G×S avec G = R2×S1

et S = (−π/2, π/2)N de sorte que g = (x0, y0, θ0)′ et s = (ϕ1, . . . , ϕN )′. A partir de ce systeme, iln’est pas tres difficile de definir de nouveaux modeles qui generalisent les modeles (1.34) et (1.37)pour la voiture. Les propositions suivantes precisent cette possibilite.

Page 40: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

26 Exemples et modeles de vehicules

Proposition 3 On note ϕ := (ϕ1, . . . , ϕN )′, z := (x0, y0, θ0, ϕ1, . . . , ϕN )′, b1 le champ de vecteurdu systeme (1.41) associe a v1, i.e. b1 = (cos θ0, sin θ0, · · · )′, et idp la fonction de projectionz 7−→ zp. Alors, le changement partiel de coordonnees et de variables de commande(

ϕv

)7−→

(ζu

)donne par ζi = Li

b1(id3)(z) pour i = 1, . . . , N , etu1 = v1

u2 = u1LN+1b1

(id3)(z) +v2(∏N−1

i=0 `i

)(∏Ni=1 cosN+2−i ϕi

)avec Lk

b1(id3) la derivee de Lie d’ordre k de id3 le long du champ de vecteur b1, definit un diffeo-

morphisme global de (−π2 ,

π2 )N × R2 dans RN × R2 et transforme le systeme (1.41) en :

x0 = u1 cos θ0y0 = u1 sin θ0θ0 = u1ζ1ζi = u1ζi+1 (i = 1, . . . , N − 1)ζN = u2

Proposition 4 (Sørdalen, 1993) On note n := N + 3 et, avec les notations de la Proposition 3,Z(z) := 1

cos θ0b1(z). Alors, le changement de coordonnees et de variables de commande(

zv

)7−→

(xu

)donne par

x1 = x0

xn = y0

xi = Ln−iZ (id2)(z) (i = n− 1, . . . , 2)

et u1 = v1 cos θ0u2 = u1L

n−1Z (id2)(z) +

v2

cosn−1 θ0

(∏n−4i=0 `i

)(∏n−3i=1 cosn−1−i ϕi

)avec Lk

Z(id2) la derivee de Lie d’ordre k de id2 le long du champ de vecteur Z, definit un diffeo-morphisme global de R2 × (−π

2 ,π2 )N+1 ×R2 dans Rn ×R2 et transforme le systeme (1.41) en un

systeme chaıne de dimension n :

(Sc)

x1 = u1

x2 = u2

x3 = u1x2...

xn = u1xn−1

Page 41: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Les systemes sous-actionnes 27

La proposition suivante, qui precise certaines proprietes de (Sc), generalise la Proposition 2.

Proposition 5 Le systeme chaıne (Sc) est• globalement commandable sur Rn,• invariant a gauche sur Rn muni de la loi de groupe

xy =

x1 + y1

x2 + y2

x3 + y3 + y1x2...

xn + yn +n−1∑k=2

yn−k1 xk

(n− k)!

La propriete de commandabilite est facilement obtenue en verifiant que la condition de rang (1.1)est satisfaite (a partir des champs b1, b2, [b1, b2], [b1, [b1, b2]], . . .). La deuxieme propriete se verifieaussi facilement par le calcul (voir e.g. (Struemper & Krishnaprasad, 1997) pour une preuve).

1.5 Les systemes sous-actionnes

Ce qui distingue les systemes sous-actionnes des systemes non-holonomes precedents est l’im-possibilite de “decoupler” la partie cinematique de la partie dynamique. Cela tient au fait que lesprincipales non-linearites des systemes sous-actionnes se situent au niveau de leur dynamique.Les modeles de commande associes sont alors necessairement des systemes avec derive, ce quien rend l’etude plus difficile. Nous donnons ci-dessous quelques exemples classiques de systemesmecaniques sous-actionnes. Ces exemples etant des corps rigides (dans le plan ou l’espace), leurespace de configuration est un groupe de Lie et le modele cinematique associe est invariant parrapport a l’operation de groupe associee.

1.5.1 Corps rigide sous-actionne sur SO(3) : l’exemple du satellite

On s’interesse a l’orientation d’un corps rigide dans l’espace, muni d’actionneurs delivrant descouples de commande. Cet exemple, represente sur la Figure 1.4 ci-dessous, peut etre vu commeun modele de satellite.

Il est plus simple dans ce cas d’etablir les equations par une approche de type Newton-Eulerque par l’approche lagrangienne. Les equations de mouvement sont bien connues :

R = Rω

Jω = Jω × ω +na∑

k=1

ukFk (1.42)

avec• R ∈ SO(3) : la matrice representant l’orientation du repere F1 lie au satellite (repere associe

aux axes principaux d’inertie) par rapport a un repere fixe F0,• ω : les composantes du vecteur instantane de rotation du repere F1 par rapport au repereF0, exprimees dans la base de F1,

Page 42: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

28 Exemples et modeles de vehicules

............................

..............................................................................................................................................................

.............................................................................................................................................. ............................

...............................................................................................................

..........................................

..........................................

..........................................

...............

.....................................................................................................................

......................................................................................

qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

k0

j0

i0

j1

k1

i1

0

f 1 f 2

Figure 1.4: Un modele de satellite

• ω : la matrice associee a l’application x 7−→ ω × x, i.e.

ω =

0 −ω3 ω2

ω3 0 −ω1

−ω2 ω1 0

(1.43)

• J = diagj1, j2, j3 : la matrice d’inertie,• F k : les composantes, dans le repere F1, des vecteurs de direction des couples de commande.

La partie cinematique du modele (1.42) est clairement invariante a gauche sur le groupe deLie matriciel SO(3). Le systeme est sous-actionne si na < 3. Lorsque na = 1 le systeme peuteventuellement etre commandable en ses points d’equilibre (R0, 0) ∈ SO(3)×R3 (Crouch, 1984),mais il n’est jamais commandable en temps petit (Keraı, 1995). Lorsque na = 2, on a le resultatsuivant :

Theoreme 4 (Keraı, 1995) Lorsque na = 2, le systeme (1.42) est commandable en temps petiten un point d’equilibre (R,ω) = (R0, 0) si et seulement si

spanF 1, F 2, (J−1ω)× ω : ω ∈ spanF 1, F 2 = R3 (1.44)

Dans ce cas, la condition de Sussmann S(1) est satisfaite.

Notons que la propriete de commandabilite en temps petit avait aussi ete montree dans (Crouch& Byrnes, 1986, Sec. 3) dans le cas particulier ou F1 et F2 sont des vecteurs unitaires (i.e. Fi = ejpour un certain j), satisfaisant (1.44).

Pour l’etude de certains problemes de commande, on prefere souvent utiliser une parame-trisation minimale de SO(3) pour ecrire les equations de mouvement. De nombreux choix sontpossibles (voir e.g. (Samson et al., 1991; Murray et al., 1994)). Le choix suivant est parfois appele“parametrisation de Rodrigues” :

α := tanφ

2u (∈ R3) (1.45)

Page 43: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Les systemes sous-actionnes 29

ou u correspond aux composantes, dans F1, d’un vecteur unitaire ~u de l’axe de la rotationassociee a R, et φ ∈ (−π, π) est l’angle de cette rotation relativement a ~u. Le choix (1.45) definitune parametrisation des rotations d’angle different de π. Les equations (1.42) sont alors donneespar :

α = 12 (ω + α× ω + 〈ω, α〉α)

Jω = Jω × ω +na∑

k=1

ukFk (1.46)

1.5.2 Corps rigide sous-actionne sur SE(2) : l’exemple du glisseur

On considere le mouvement, en position et orientation, d’un corps rigide dans le plan. Cetexemple, represente sur la Figure 1.5 ci-dessous, correspond par exemple a un glisseur equipe dedeux propulseurs qui delivrent des forces f1 et f2.

uuu

............................

............................

..........

..........

..........

..........

..........

..........

..........

..........

..........

..........

..........

.......

.......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... ..........

..........................................................................................

..........................................................................................

....................

....................

....................

....

..................................................

qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq..................................................... ............................

qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

0i0

θG

j0

y

x

f 1

f 2

Figure 1.5: Un modele de glisseur

L’utilisation des equations de Lagrange conduit directement, avec les notations de la figure,aux equations

mx = (u1 + u2) cos θmy = (u1 + u2) sin θJθ = u2 − u1

avec m la masse du corps et J son inertie. Ces equations peuvent se mettre sous la forme demodele d’etat suivante :

x = v1 cos θ − v2 sin θy = v1 sin θ + v2 cos θθ = ω

mv1 = mωv2 + (u1 + u2)mv2 = −mωv1Jω = u2 − u1

(1.47)

La partie cinematique est invariante a gauche sur R2 × S1 ≈ SE(2) muni du produit de groupe(1.30). Autour de tout point d’equilibre (x, y, θ, v, ω) = (x0, y0, θ0, 0, 0) le modele (1.47) est enfait localement “equivalent” (au sens d’une approximation homogene, voir deuxieme partie de ce

Page 44: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

30 Exemples et modeles de vehicules

memoire) au modele (1.46) du satellite avec na = 2, pour un choix particulier de F 1 et F 2 et dela matrice d’inertie pour lequel le satellite est commandable en temps petit. Le resultat suivanten decoule, mais il peut aussi etre montre directement par le calcul.

Proposition 6 Le systeme (1.47) est commandable en temps petit autour de ses points d’equilibre(x, y, θ, v, ω) = (x0, y0, θ0, 0, 0). En particulier, il verifie la condition de Sussmann S(1).

1.5.3 Corps rigide sous-actionne sur SE(3)

Ce dernier exemple, represente sur la Figure 1.6 ci-dessous, est en quelque sorte une genera-lisation des deux systemes precedents. Il correspond schematiquement au cas d’un vehicule dansl’espace, en situation d’apesanteur.

k0

i0

G i1f 1

f 2

j1

j0

k1

f 3

0

Fig. 1.6 – Corps rigide sous-actionne sur SE(3)

Les equations de mouvement, obtenues typiquement via le formalisme de Newton-Euler, sontles suivantes :

p = Rv

R = Rω

mv = mv × ω +na∑

k=1

ukFkv

Jω = Jω × ω +na∑

k=1

ukFkω

(1.48)

avec :• p = (x, y, z) ∈ R3 : les coordonnees du centre de masse G par rapport au repere fixe F0,• R ∈ SO(3) : la matrice representant l’orientation du repere F1 lie au vehicule (repere associe

aux axes principaux d’inertie) par rapport au repere fixe F0,• v : les composantes du vecteur vitesse de G par rapport au repere F0, exprimees dans la

base de F1,• ω : les composantes du vecteur instantane de rotation du repere F1 par rapport au repereF0, exprimees dans la base de F1, et ω la matrice (1.43),

• m : la masse du corps, et J = diag(j1, j2, j3) la matrice d’inertie.

Page 45: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Les systemes non-holonomes sous-actionnes 31

• F kv , F

kω : les composantes, dans le repere F1, des vecteurs de direction des forces et couples

de commande.

La loi de groupe sur R3 × SO(3) ≈ SE(3), par rapport a laquelle la partie cinematique de (1.48)est invariante a gauche, est donnee par(

p1

R1

)(p2

R2

)=(p1 +R1p2

R1R2

)Le systeme est sous-actionne des lors que na < 6. En terme de commandabilite de ce systeme, iln’est pas tres difficile de montrer le resultat suivant.

Proposition 7 Lorsque na = 3, j1 6= j2, et

F 1 = (1, 0, 0, 0, 0, 0)′, F 2 = (0, 0, 0, 1, 0, 0)′, F 3 = (0, 0, 0, 0, 1, 0)′

le systeme (1.49) est commandable en temps petit en tous ses points d’equilibre. Il verifie lacondition de Sussmann S(1).

Le choix de F 1, F 2, et F 3 donne dans cette proposition correspond a une force et deux couplesde commandes, comme illustre sur la Figure 1.6. Il n’est evidemment donne qu’a titre d’exemple.

Comme pour le satellite, on est souvent amene a utiliser une parametrisation minimale deSO(3). Avec le choix (1.45), le systeme (1.49) devient alors (voir e.g. (Fossen, 1994, Eq. 2.25,2.26)) :

p = R(θ)vθ = 1

2(ω + θ × ω + 〈ω, θ〉θ)

mv = mv × ω +na∑

k=1

ukFkv

Jω = Jω × ω +na∑

k=1

ukFkω

(1.49)

avec

R(θ) :=

(1 +

3∑i=1

θ2i

)−11 + θ2

1 − θ22 − θ2

3 2(θ1θ2 − θ3) 2(θ1θ3 + θ2)2(θ1θ2 + θ3) 1 + θ2

2 − θ21 − θ2

3 2(θ2θ3 − θ1)2(θ1θ3 − θ2) 2(θ2θ3 + θ1) 1 + θ2

3 − θ21 − θ2

2

1.6 Les systemes non-holonomes sous-actionnes

Ces systemes sont une synthese des systemes non-holonomes et des systemes sous-actionnes :les non-linearites de leur modeles se situent a la fois au niveau cinematique, et au niveau dy-namique. Plusieurs systemes de ce type ont fait l’objet d’etudes dans le milieu des annees 90,principalement aux Etats-Unis. Les deux exemples les plus etudies sont le “snakeboard” (Lewiset al., 1994; Ostrowski & Burdick, 1995) et le “roller-racer” (Krishnaprasad & Tsakiris, 1995). Parailleurs, une theorie assez generale a ete developpee pour la modelisation (Bloch et al., 1996) etl’analyse (Lewis & Murray, 1997; Lewis, 2000) des systemes mecaniques soumis a des contraintesnon-holonomes. Cette theorie repose sur la geometrie riemannienne, et a donne lieu a des criteresalgebriques pour la verification de differentes proprietes de commandabilite.

Page 46: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

32 Exemples et modeles de vehicules

Nous allons nous limiter dans cette section a l’etude du snakeboard represente sur la Figure1.6 ci-dessous. Ce systeme est constitue de deux unicycles, en opposition de phase, supportantune planche sur laquelle est monte un rotor autour du centre de masse G. On note ` la distancede G au centre de l’axe des roues de chaque unicycle.

G

ψ

θ

i

j

0

y

x

−ϕ

ϕ

f 2

f 1

Fig. 1.7 – Le snakeboard

Si l’on omet, comme dans le cas de l’unicycle, les variables de rotation interne des roues desunicycles, l’espace de configuration est Q = R2 × (S1)3 avec comme vecteur de configurationq = (x, y, θ, ϕ, ψ). Les contraintes non-holonomes, traduisant le fait que la vitesse laterale dechaque unicycle est nulle, sont donnees par

0 = 〈a1(q), q〉 = −x sin(θ + ϕ) + y cos(θ + ϕ) + `θ cosϕ0 = 〈a2(q), q〉 = −x sin(θ − ϕ) + y cos(θ − ϕ)− `θ cosϕ

Comme nous en avions indique la possibilite en Section 1.2, il y a une singularite pour ϕ = π/2mod π au sens ou les deux contraintes ci-dessus ne sont pas independantes pour ces valeursde ϕ alors qu’elles le sont pour toute autre valeur. Cela nous conduit a restreindre l’espace deconfiguration a Q = R2 × S1 × (−π/2, π/2) × S1. Sur cet espace, la dimension de l’espace desvitesses est bien definie, egale a nv = 3, et le modele cinematique est donne par

q = v1b1(q) + v2b2(q) + v3b3(q) (1.50)

avec, par exemple,

b1(q) =

cos θsin θtan ϕ

`00

, b2(q) =

00010

b3(q) =

00001

(1.51)

Page 47: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Les systemes non-holonomes sous-actionnes 33

On verifie facilement que les bi satisfont l’hypothese 2 de commandabilite. Avec les notationsde la Section 1.3, on peut egalement decomposer l’espace de configuration Q = G × S avecG = R2×S1 ≈ SE(2) et S = (−π/2, π/2)×S1, et le modele cinematique (1.50) possede le groupede symetries (1.18). Le Lagrangien du systeme est

L(q) =m

2(x2 + y2) +

Jc

2θ2 +

Jr

2(θ + ψ)2 +

Ju

2(ϕ2 + θ2)

avec m la masse du systeme, Jc l’inertie du corps principal, Jr l’inertie du rotor, Ju/2 l’inertie dechaque unicycle. L’obtention du modele cinematique peut se faire en suivant la demarche rappeleeen Section 1.2 (voir aussi (Bloch et al., 1996) pour une autre facon de deriver ces equations). Apartir du Lagrangien ci-dessus, et en notant

J = Jc + Jr + Ju

on obtient directement, avec les notations de (1.11),

M(q) =

m 0 0 0 00 m 0 0 00 0 J 0 Jr

0 0 0 Ju 00 0 Jr 0 Jr

, N(q, q) = G(q) = 0 (1.52)

Les forces generalisees F 1 et F 2 associees aux couples de commande sont donnees par

F 1 = (0, 0, 0, 1, 0)′ F 2 = (0, 0, 0, 0, 1)′

A partir de (1.52) et de l’expression (1.51) des champs bi, on obtient apres quelques calculsl’expression des matrices et vecteurs definis par (1.13)–(1.14) :

M(q) =

m+ J tan2 ϕ`2

0 Jrtan ϕ

`0 Ju 0

Jrtan ϕ

` 0 Jr

, N(q, v) =v2

` cos2 ϕ

J tan ϕ` 0 0

0 0 0Jr 0 0

, G(q) = 0

etF 1 = (0, 1, 0)′ , F 2(q) = (0, 0, 1)′

d’ou l’on deduit que

M−1(q) = ∆(ϕ)

`2 0 −` tanϕ0 (Ju∆(ϕ))−1 0

−` tanϕ 0 m`2+J tan2 ϕJr

, ∆(ϕ) =1

m`2 + (J − Jr) tan2 ϕ

L’expression de v s’obtient finalement, a partir des calculs precedents, par application de (1.16) :

v = v1v2h0(ϕ) + u1h1 + u2h2(ϕ) (1.53)

avec

h0(ϕ) = − ∆(ϕ)cos2 ϕ

(J − Jr) tanϕ0m`

, h1 =

01/Ju

0

, h2(ϕ) = ∆(ϕ)

−` tanϕ0

m`2+J tan2 ϕJr

On a alors la propriete de commandabilite suivante :

Page 48: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

34 Exemples et modeles de vehicules

Theoreme 5 (Ostrowski & Burdick, 1997) Le systeme defini par les equations (1.50) et (1.53)est commandable en temps petit en tout point d’equilibre (q, v) = (q0, 0). Il verifie la condition deSussmann S(1).

Page 49: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Chapitre 2

Stabilisation de systemes critiques :une vue d’ensemble

Ce chapitre est un expose general sur les problemes de stabilisation de trajectoires des sys-temes critiques. Rappelons que nous entendons par ce terme les systemes commandables dont lelinearise en chaque point d’equilibre n’est pas asymptotiquement stabilisable (et donc a fortioripas commandable). Tous les exemples de vehicules presentes dans le chapitre precedent sont dessystemes critiques. L’objectif de ce chapitre est d’une part d’exposer les specificites de ces sys-temes, du point de vue de la stabilisation, et d’autre part de presenter differentes solutions decommande par retour d’etat qui ont ete proposees pour la stabilisation de trajectoires, tout enessayant de cerner leurs interets et leurs limites.

Ce chapitre comporte quatre sections. Dans la premiere section, nous commencons par definirplusieurs problemes de stabilisation de trajectoires que l’on peut rencontrer en pratique. Nousrappelons ensuite des resultats qui permettent de cerner les difficultes specifiques aux systemescritiques. Les deuxieme et troisieme sections sont consacrees a la stabilisation asymptotique detrajectoires admissibles. On s’interesse tout d’abord aux trajectoires reduites a un point fixe,puis a certaines trajectoires “non-stationnaires” (typiquement des trajectoires qui ne convergentpas vers un point fixe). Cette separation tient au fait suivant : pour la stabilisation de pointsfixes, des techniques tres non-lineaires doivent etre utilisees pour la synthese de retours d’etat.Dans le cas des trajectoires non-stationnaires au contraire, les approches de stabilisation reposenten grande partie sur des proprietes de commandabilite des systemes linearises le long de cestrajectoires de reference. La derniere section porte sur la stabilisation pratique de trajectoires, etplus specifiquement sur une approche que nous avons proposee recemment pour la stabilisation detrajectoires de systemes sans derive. L’objectif de stabilisation pratique est evidemment moins fortque celui de stabilisation asymptotique, mais comme nous le verrons, il permet d’unifier l’etuded’un certain nombre de problemes de stabilisation, et correspond mieux, dans de nombreux cas,a ce qu’il est possible de realiser de facon robuste pour les systemes critiques.

Les Sections 2.2, 2.3, et 2.4, contiennent des resultats de synthese de lois de commande,illustres par des resultats de simulation. Afin de ne pas entrer dans ce chapitre dans des consi-derations trop techniques, nous avons choisi d’exposer ces resultats avec un exemple a la foisrelativement simple, et physiquement representatif : le systeme non-holonome de type voiture.Outre le fait que cet exemple est particulierement important d’un point de vue applicatif, il estsuffisamment riche pour cerner les potentialites des differentes classes de commandes etudiees.

Page 50: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

36 Stabilisation de systemes critiques : une vue d’ensemble

Dans quelle mesure est-il “generique”? Il faut evidemment distinguer les systemes sans derivedes systemes avec derive. Pour les systemes sans derive (comme les modeles cinematiques desvehicules non-holonomes) on peut dire que toutes les methodes presentees dans ce chapitre sontpotentiellement applicables, au moins localement, a tous ces systemes. La deuxieme partie de cememoire fournit les elements necessaires a cette generalisation. Evidemment, pour des systemesde grande dimension, le calcul de lois de commande peut parfois s’averer tres/trop complexe,mais il est theoriquement possible. La classe des systemes avec derive est beaucoup trop richepour pretendre a une quelconque “genericite” dans ce cadre. Certaines des approches presenteesdans ce chapitre sont applicables, et ont ete appliquees, a des systemes avec derive comme lesexemples de systemes mecaniques sous-actionnes presentes dans le Chapitre 1. Pour d’autres ap-proches, l’application est moins directe ou reste a developper. Encore une fois, nous renvoyons ala deuxieme partie de ce memoire pour plus de details sur ce point.

2.1 Remarques generales sur la stabilisation de trajectoires

Commencons par rappeler une definition.

Definition 8 On appelle trajectoire admissible du systeme (S) sur la variete M toute fonctionxr : [0,+∞) −→M pour laquelle il existe une commande ur definie et continue par morceaux sur[0,+∞) telle que :

∀t ≥ 0, xr(t) = X0(xr(t)) +m∑

i=1

uri (t)Xi(xr(t))

La stabilisation de trajectoires requiert en premier lieu de definir un systeme d’erreur par rapporta la trajectoire de reference xr. Lorsque M = Rn, un choix simple consiste a definir ce systemea partir de la variable d’erreur xe := x− xr. Toutefois, pour les systemes non-lineaires, ce choixn’est pas toujours le mieux adapte. En particulier, comme nous l’avons rappele en Section 1.3, ilpeut etre judicieux d’utiliser certaines proprietes de symetrie afin de definir les variables d’erreur.Pour l’instant, nous supposerons qu’un systeme d’erreur

xe = Xe(xe, u, xr, ur) (2.1)

a ete defini, avec xe la variable d’erreur qu’il s’agit de reguler a zero etXe une application regulieretelles que

xe = 0 ⇐⇒ x = xr

Xe(0, ur, xr, ur) = 0 ∀(xr, u

r)

Il existe plusieurs facon de poser le probleme de stabilisation de trajectoires. Nous definissonsci-dessous trois versions differentes, correspondant a des cas que l’on rencontre typiquement enpratique. Commencons par la version la plus faible.

Probleme 1 : Etant donne une trajectoire admissible xr, determiner une commande par retourd’etat u(xe, t) telle que l’origine xe = 0 du systeme d’erreur (2.1) soit asymptotiquement stable.

Ce probleme correspond essentiellement au cas ou une trajectoire de reference xr a ete definie apriori, par exemple via une etape de planification. On cherche alors a stabiliser le systeme le longde cette trajectoire de reference.

Page 51: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Remarques generales sur la stabilisation de trajectoires 37

Remarque 1 Pour la stabilisation de trajectoires, le systeme d’erreur est un systeme instation-naire, et une premiere question se pose quand a la definition de la propriete de stabilite asympto-tique. En regle generale, pour les systemes qui nous interessent ici, il n’est pas possible d’obtenir,sans hypotheses complementaires sur la trajectoire de reference, une stabilite asymptotique uni-forme par rapport au temps. Plus precisement, en ce qui concerne la relation d’attractivite (1.3),le parametre τ peut dependre du temps initial t0, i.e. ∀t0, ∃τ · · · (par contre, la stabilite serageneralement uniforme). Par consequent, dans toute la suite de ce chapitre, le terme “asympto-tiquement stable” devra etre entendu dans le sens faible (i.e. pas necessairement uniforme).

Lorsque la trajectoire de reference n’est pas connue a priori, mais seulement obtenue en ligne(e.g. via des mesures), on cherche une commande qui puisse stabiliser asymptotiquement toutetrajectoire admissible :

Probleme 2 : Determiner une commande par retour d’etat u(xe, t, xr, ur) telle que l’origine

xe = 0 du systeme d’erreur (2.1) soit asymptotiquement stable pour toute trajectoire de referenceadmissible xr.

Evidemment, toute solution a ce probleme induit une solution au Probleme 1 precedent.Le dernier probleme que nous considererons dans ce memoire est celui de la stabilisation

de trajectoires generales (i.e. trajectoires non-necessairement admissibles), ce par quoi nousentendons simplement des fonctions regulieres xr : [0,+∞) −→M . Dans ce cas, le modele d’erreur(2.1) doit etre remplace par un modele du type

xe = Xe(xe, u, xr, xr) (2.2)

et il n’y a plus necessairement d’equilibre associe a xe = 0. La stabilisation asymptotique dexe = 0 n’est donc en general pas possible et une version plus faible de stabilisation doit etreconsideree. Nous preciserons dans la Section 2.4 une definition de stabilite possible. Pour l’instant,contentons-nous d’enoncer de facon vague :

Probleme 3 : Determiner une commande par retour d’etat u(xe, t, xr, xr) telle que l’origine

xe = 0 du systeme d’erreur (2.2) soit “pratiquement stable” pour toute trajectoire generale xr.

Remarque 2 Il peut paraıtre incongru de chercher a stabiliser des trajectoires qui ne sont pasnecessairement admissibles. Cependant, ce probleme peut se poser en pratique. Un exemple typiqueest illustre par la Figure 2.1 ci-dessous. Il s’agit ici d’asservir le mouvement d’un vehicule a celuid’un autre vehicule de reference. Afin d’eviter les collisions, une approche possible consiste aconsiderer un repere deporte Rv, et a asservir un repere R1 lie au vehicule a commander aurepere Rv. Il n’est pas difficile de verifier qu’excepte pour des mouvements rectilignes du vehiculede reference, les mouvements du repere deporte Rv ne sont pas realisables par le vehicule acommander.

Dans la Section 2.4, nous presenterons une methode permettant de resoudre le Probleme 3pour une large classe de systemes. Revenons maintenant aux Problemes 1 et 2 de stabilisationasymptotique de trajectoires admissibles.

Pour plusieurs types de trajectoires de reference xr, et de systemes critiques, on connaıt dessolutions au Probleme 1. A notre connaissance, on ne sait toutefois pas si ce probleme peut etreresolu pour toute trajectoire xr, meme pour des exemples simples de systemes critiques.

Page 52: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

38 Stabilisation de systemes critiques : une vue d’ensemble

ppppppppppppppppppppppppppppqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

ppppppppppppppppppppppppppppqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqt tt...........

...............................................................................................................................................................................................................................................................................................................................................................................................................................................................................

......................

......................

......................

......................

..........

.................................................................................................................

......................

................... ........................

............................................................

............................................................

...............................................................................................................................................................................................................................................................................................................................................................

.....................................................................................................

............................................................

.....................................................

.................................................................

ppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

ppppppppppppppppppppppppppppqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

qqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq

pppppppppppppppppppppppppppppppppppppppppppppppppppppppR1

Vehicule a commander Repere cible Vehicule de reference

Rr

Pr

Pv

Rv

........................ ..........................................................................................................................................................................................................

Fig. 2.1 – Stabilisation de trajectoires generales

Le Probleme 2 appelle plus de commentaires, car d’une part il est d’un interet pratique plusetendu que le precedent, et d’autre part il signale une difference remarquable entre les systemescritiques et les systemes lineaires. Considerons en effet un systeme lineaire

x = Ax+Bu (2.3)

avec (A,B) une paire commandable, et K une matrice telle que A+BK soit Hurwitz-stable. Atoute trajectoire admissible xr, on peut associer le systeme d’erreur

xe = Ax+Bu− (Axr +Bur) = Axe +B(u− ur) (2.4)

avec xe := x − xr. Dans ce cas, le retour d’etat u(xe, ur) := ur + Kxe est une solution au

Probleme 2. En effet le systeme (2.4) controle est alors donne par xe = (A+BK)xe, dont l’origineest asymptotiquement stable par hypothese sur K. Autrement dit, pour les systemes lineairescommandables, il existe des solutions (simples) au Probleme 2. Un resultat recent indique quece n’est en general pas le cas pour les systemes critiques. Nous nous limitons ici a une versionsimplifiee de ce resultat.

Theoreme 6 (Lizarraga, 2004) On considere un systeme sans derive (S0) sur une variete Mde dimension n ≥ 3, avec deux champs de commande X1, X2, lineairement independants entout x ∈ M et tels que dim L(X1, X2)(x) = n pour tout x. Alors, il n’existe aucune solution auProbleme 2 avec u continue, et ∂u/∂t et ∂2u/(∂ur∂t) definis partout et bornes sur l’ensemble(xe, t, xr, u

r) : xe = 0, ur = 0.

Notons que ce resultat est montre dans (Lizarraga, 2004) sous une hypothese d’uniformite dela stabilite asymptotique par rapport a xr. Cette hypothese est relativement faible, et naturellevis-a-vis de ce que l’on peut attendre, d’un point de vue pratique, d’une solution au Probleme2. En particulier, un point important de ce resultat est qu’aucune hypothese d’uniformite de lastabilite asymptotique par rapport a t n’est requise. Notons enfin que le Theoreme 6 reste vrai sil’on se limite a des “entrees de reference” ur a valeurs dans un voisinage de l’origine.

Les hypotheses du Theoreme 6 sont verifiees pour tous les modeles cinematiques de systemesnon-holonomes presentes dans la Section 1.4. En particulier, ce resultat explique pourquoi les

Page 53: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation asymptotique de points fixes 39

resultats sur la stabilisation asymptotique de trajectoires admissibles, pour de tels systemes,portent toujours sur des classes de trajectoires specifiques. Deux cas ont ete plus specialementconsideres dans la litterature sur le sujet : les trajectoires reduites a un point fixe, et les trajectoiresnon-stationnaires avec des hypotheses de type“excitation persistante”. Les deux sections suivantessont consacrees a ces resultats.

2.2 Stabilisation asymptotique de points fixes

Pour les systemes critiques, la stabilisation asymptotique de points fixes pose deux difficultesprincipales, liees au fait que le linearise en ces points n’est ni commandable ni asymptotiquementstabilisable.

1. En premier lieu, la commandabilite locale autour d’un point d’equilibre x0 n’est pas suf-fisante pour garantir l’existence de retours d’etat autonomes reguliers u(x) qui stabilisentasymptotiquement un tel point. C’est ce que nous indique le (maintenant celebre) theoremede Brockett (Brockett, 1983). Par consequent, le probleme de stabilisation asymptotique nepeut etre resolu qu’avec des retours d’etat moins classiques, qui sont generalement plus dif-ficiles a synthetiser et analyser. La classe des retours d’etat continus instationnaires fournitdes solutions possibles.

2. En second lieu, au vu des resultats obtenus sur ce probleme depuis plus d’une decennie, ilsemble que le dilemme suivant soit inevitable. Ou bien l’on utilise des retours d’etat regu-liers, peu sensibles aux bruits de mesures et eventuellement robustes vis-a-vis d’erreurs demodeles, mais ces commandes fournissent une convergence asymptotique lente (pas expo-nentielle) vers le point d’equilibre. Ou alors on utilise des retours d’etat seulement continusqui peuvent, en theorie, garantir une convergence exponentielle vers l’equilibre, mais quisont tres sensibles aux bruits de mesure et aux erreurs de modele. Ce dilemme a des conse-quences importantes d’un point de vue applicatif. S’il ne signifie pas que les differentessolutions de commande existantes sont depourvues d’interet, il indique clairement leurslimites, qu’il faudra evaluer au cas par cas en pratique.

Nous rappelons ci-dessous quelques resultats generaux qui precisent ces deux aspects.

2.2.1 Quelques resultats generaux

Le resultat de Brockett enonce ci-dessous (Brockett, 1983) a ete initialement etabli en consi-derant la classe des retours d’etat reguliers (de classe C1). Dans le cas des retours d’etat seulementcontinus, une preuve a ete donnee dans (Zabczyk, 1989) sous l’hypothese d’unicite des solutions,et dans (Ryan, 1994) sans cette hypothese. C’est cette derniere version que nous rappelons ici.

Theoreme 7 Soit un systeme x = X(x, u) avec X ∈ C0(Rn×Rm; Rn) et X(0, 0) = 0. Une condi-tion necessaire pour qu’il existe un retour d’etat u(x) de classe C0 qui stabilise asymptotiquementle point d’equilibre x = 0 est que l’application (x, u) 7−→ X(x, u) soit localement surjective auvoisinage de (0, 0), i.e. pour tout voisinage U de (0, 0) dans Rn × Rm, X(U) doit contenir unvoisinage de 0 ∈ Rn.

En particulier, on deduit facilement de ce theoreme le corollaire suivant.

Page 54: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

40 Stabilisation de systemes critiques : une vue d’ensemble

Corollaire 1 Soit un systeme sans derive (S0) avec m < n et X1(x0), . . . , Xm(x0) lineairementindependants. Alors, il n’existe pas de retour d’etat continu u(x) stabilisant asymptotiquement x0.Notamment, ce resultat negatif s’applique a tous les systemes non-holonomes consideres dans leChapitre 1.

De meme, pour les exemples de systemes sous-actionnes et non-holonomes sous-actionnesconsideres dans le Chapitre 1, on montre facilement, par application du theoreme de Brockett,qu’il n’existe pas de retours d’etat autonomes continus u(x) qui stabilisent asymptotiquement unpoint d’equilibre donne.

Afin de contourner l’obstruction signalee par Brockett, une premiere approche consiste autiliser des retours d’etat autonomes discontinus u(x) (i.e. discontinus au point que l’on cherchea stabiliser). Ceci n’est pas sans poser quelques difficultes. La premiere est qu’il est necessaire depreciser le sens donne aux solutions du systeme controle, et le sens donne a la propriete de stabiliteasymptotique. Une possibilite consiste a definir les solutions au sens de (Filippov, 1964). Dansce cas, sous des hypotheses tres faibles (voir Annexe A.1.1 pour plus de details), la conditionde Brockett reste une condition necessaire pour l’existence de retours d’etat u(x) discontinusstabilisant asymptotiquement un point fixe. En particulier, les syntheses de commandes optimalesen temps (voir e.g. (Soueres & Boissonnat, 1998)) ne fournissent donc pas des stabilisateursasymptotiques dans ce sens. On pourrait objecter que la definition des solutions au sens deFilippov conduit a une notion de stabilite asymptotique trop forte. Comme l’ont signale (Coron &Rosier, 1994), il nous semble au contraire que cette notion de stabilite est le moins que l’on puissedemander a des retours d’etat asymptotiquement stabilisants. Une autre difficulte reside dans lepassage d’un retour d’etat discontinu construit pour un modele cinematique (de robot mobilepar exemple), a un retour d’etat pour le modele dynamique capable d’assurer des proprietes destabilite et de convergence “equivalentes”. Ce point ne peut pas etre neglige sur le plan pratique.Enfin, les problemes de sensibilite aux bruits de mesure et aux erreurs de modele, que l’onrencontre deja pour les retours d’etat continus non differentiables (cf. ci-dessus et la sectionsuivante), sont amplifies avec des retours d’etat discontinus.

Une autre approche, initiee dans (Samson, 1990), consiste a utiliser des retours d’etat insta-tionnaires continus u(x, t) (generalement periodiques par rapport a t). La plupart des systemesnon-lineaires commandables peuvent etre stabilises avec ce type de retour d’etat.

Theoreme 8 (Coron, 1992a) Soit (S0) un systeme sans derive sur Rn avec L(X1, . . . , Xm)(0) =Rn. Alors, pour tout T > 0, il existe un voisinage U de 0 et un retour d’etat instationnaire u(x, t)avec u ∈ C∞(U × R; Rm) tels que

1. u(0, t) = 0 pour tout t ∈ R,

2. u(x, t+ T ) = u(x, t) pour tout (x, t) ∈ U × R,

3. x = 0 est asymptotiquement stable pour le systeme (S0) controle.

Si de plus L(X1, . . . , Xm)(x) = Rn pour tout x ∈ Rn, les proprietes ci-dessus sont vraies avecU = Rn, et x = 0 est globalement asymptotiquement stable.

Un corollaire immediat de ce resultat est que les points fixes des modeles cinematiques de tousles systemes non-holonomes sont asymptotiquement stabilisables par des retours d’etat instation-naires u(x, t) continus, et meme infiniment differentiables. Pour les systemes avec derive, on a leresultat suivant.

Page 55: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation asymptotique de points fixes 41

Theoreme 9 (Coron, 1995, Th. 1.4) Soit un systeme (S) sur Rn avec n ≥ 4. On suppose quex = 0 est un point d’equilibre de ce systeme, continument atteignable en temps petit, et queL(X0, . . . , Xm)(0) = Rn. Alors, x = 0 est asymptotiquement stabilisable par un retour d’etatinstationnaire periodique u(x, t), avec u ∈ C0(Rn × R; Rm) ∩ C∞((Rn \ 0)× R; Rm).

Il decoule de ce theoreme et des resultats du Chapitre 1 (voir en particulier la Proposition 1)que tous les exemples consideres dans ce chapitre sont asymptotiquement stabilisables par desretours d’etat u(x, t) continus.

Le dernier resultat de cette section precise l’impossibilite, pour les systemes critiques, d’obtenirune stabilite exponentielle d’un point d’equilibre en utilisant des retours d’etat reguliers. Cettepropriete a ete signalee dans (Gurvits & Li, 1992) (voir e.g. (M’Closkey, 1995; Morin, 1996b)pour des demonstrations).

Proposition 8 On considere un systeme critique x = X(x, u), avec X ∈ C1(Rn × Rm; Rn)et X(0, 0) = 0, et un retour d’etat u(x, t) avec u ∈ C0(Rn × R; Rm), u(0, .) = 0, et u(x, .)T -periodique. Alors, si u(., t) est k(t) Lipschitz-continu pour tout t, avec k bornee, l’origine dusysteme commande ne peut etre exponentiellement stable, i.e. il n’existe pas de constantes K, γ > 0telles que le long des trajectoires du systeme commande, |x(t)| ≤ K|x(t0)|e−γ(t−t0).

2.2.2 Introduction aux differentes classes de retours d’etat

On peut principalement distinguer quatre classes de retours d’etat utilises pour la stabilisationasymptotique de systemes critiques :

• les retours d’etat instationnaires Lipschitz-continus,• les retours d’etat instationnaires continus mais pas Lipschitz-continus,• les retours d’etat hybrides, i.e. qui combinent des aspects temps continu et temps discret

(par exemple des retours d’etat du type u(x(kT ), t) avec t ∈ [kT, (k + 1)T ), k ∈ N).En terme de comparaison des differents retours d’etat, nous nous interesserons principalement

aux aspects suivants :

1. vitesse de convergence,

2. comportement transitoire,

3. robustesse de la propriete de stabilite asymptotique vis-a-vis d’erreurs de modele, i.e. ca-pacite a garantir cette propriete en presence de petites erreurs de modele (dynamiquesnon-modelisees, echantillonnage de la commande, retards, etc...).

4. sensibilite aux erreurs de mesure.

Concernant le point 3 precedent, la definition suivante est adoptee.

Definition 9 Soit (S0) un systeme sans derive controle sur Rn, possedant une propriete P. Ondit que cette propriete est robuste vis-a-vis de dynamiques non modelisees, si pour toutesfonctions R1, . . . , Rm ∈ Cω(R × Rn; Rn) telles que Ri(0, .) = 0 ∀i, il existe δ0 > 0 tel que, pourtout δ ∈ (−δ0, δ0), P est aussi verifiee pour le systeme perturbe

x =m∑

i=1

ui (Xi(x) +Ri(δ, x)) (2.5)

Page 56: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

42 Stabilisation de systemes critiques : une vue d’ensemble

Les champs Ri de (2.5) permettent de modeliser, entre autre, des incertitudes parametriquesde modeles, relatives par exemple a la geometrie des vehicules non-holonomes. La definitionprecedente sera principalement utilise pour des proprietes de stabilite asymptotique d’un pointd’equilibre. Ainsi, pour de telles proprietes, la non-robustesse vis-a-vis de dynamiques non mo-delisees signifie en particulier que la moindre incertitude sur le modele peut detruire la stabiliteasymptotique du point considere.

Comme nous l’avons indique en introduction, nous illustrerons les differentes approches decommande sur le cas d’un vehicule de type voiture. Les trois modeles cinematiques suivants serontutilises (voir Section 1.4 pour plus de details). Le premier peut etre considere comme le modeleprincipal (les resultats de simulation donnes dans cette section ont ete obtenus a partir de cemodele, avec la valeur ` = 1.2m) :

x = v1 cos θy = v1 sin θθ = v1

` tanϕϕ = v2

(2.6)

Les deux autres modeles ne sont utilises que de facon intermediaire, pour la synthese de com-mandes. Le premier est defini par

x = u1 cos θy = u1 sin θθ = u1ζ

ζ = u2

(2.7)

Le dernier n’est autre que le systeme chaıne (Sc) de dimension quatre :x1 = u1

x2 = u2

x3 = u1x2

x4 = u1x3

(2.8)

Rappelons que ce n’est qu’un modele local, equivalent a (2.6) seulement pour θ ∈ (−π/2, π/2).Afin d’evaluer les differentes classes de commandes etudiees, nous avons egalement utilise

deux versions “perturbees” de (2.6).

1. Dynamique non-modelisee : Cette dynamique non-modelisee peut etre vue comme undefaut de direction ou comme un biais de mesure sur l’angle volant :

x = v1 cos θy = v1 sin θθ = v1

` tan(ϕ+ δ)ϕ = v2

(2.9)

La valeur de δ utilisee dans les simulations est δ = 0.1 rad.

2. Bruit de mesure : On considere un bruit blanc sur la mesure de l’etat, d’ecart typeσ = 10−3.

Page 57: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation asymptotique de points fixes 43

Les retours d’etat instationnaires Lipschitz-continus

Il s’agit de commandes par retour d’etat de type u(x, t), ou u ∈ C0(Rn ×R; Rm) est supposeeLipschitz-continue par rapport a x. Dans le cadre des systemes critiques, ce type de retour d’etat aete utilise initialement dans (Samson, 1990) pour stabiliser asymptotiquement a une configurationfixe un systeme non-holonome de type unicycle. Dans le cas des systemes sans derive, de nombreuxresultats de synthese existent, en particulier pour les systemes chaınes : (Pomet, 1992; Coron& d’Andrea Novel, 1992; Teel et al., 1995; Samson, 1995) etc. Pour les systemes avec derive,les resultats de synthese restent plus limites (Sepulchre et al., 1992; Morin et al., 1995). Lestechniques utilisees pour la synthese sont les techniques classiques d’automatique non-lineaire :approches de type Lyapunov/LaSalle/Jurjevic-Quinn (Pomet, 1992; Coron & d’Andrea Novel,1992; Samson, 1995), et approches de type variete centre (Sepulchre et al., 1992; Teel et al., 1995;Morin et al., 1995). Pour le systeme chaıne de dimension quatre, on a par exemple la famillesuivante de retours d’etat asymptotiquement stabilisants.

Proposition 9 (Samson, 1995) Soient k1, k2, k3, k4 > 0 des scalaires tels que le polynome p(s) =s3 + k2s

2 + k3s + k4 est Hurwitz. Soit g ∈ C0(R3; R) une fonction Lipschitz-continue, nulle al’origine et strictement positive ailleurs. Alors, le retour d’etat Lipschitz-continu

u1(x, t) = −k1x1 + g(x2, x3, x4) sin tu2(x, t) = −|u1|k2x2 − u1k3x3 − |u1|k4x4

(2.10)

rend l’origine du systeme chaıne de dimension quatre globalement asymptotiquement stable.

En utilisant le changement de variables d’etat et de commande (1.38), qui permet de passer descoordonnees du systeme chaıne (2.8) aux coordonnees du systeme (2.6), on obtient directementdes retours d’etat (semi-globalement) asymptotiquement stabilisants pour (2.6). Les resultats desimulation ci-dessous ont ete obtenus avec le choix de parametres suivants :

(k1, k2, k3, k4) = (1.2, 10, 18, 17); g(y) = 3‖y‖

Le cas ideal, ou le modele represente parfaitement le systeme et l’etat est mesure exactement,correspond a la Figure 2.2. La trajectoire du vehicule est donnee en haut a gauche, avec laconfiguration initiale du vehicule en traits pleins, et la configuration desiree en pointilles. Lesvariables d’etat x, y, et θ sont donnees en haut a droite. On observe immediatement la principalelimite de ces retours d’etat Lipschitz-continus : la convergence asymptotique est tres lente. Lescommandes v1 et v2 appliquees au vehicule sont donnees en bas de la figure.

Les retours d’etat Lipschitz-continus ne permettent pas necessairement d’obtenir la robustessevis-a-vis de dynamiques non-modelisees, pour la propriete de stabilite asymptotique. Des resultatsde simulation du systeme (2.9) avec la commande correspondant a (2.10) suggerent que le systemen’est effectivement pas asymptotiquement stable (les trajectoires convergent vers un cycle limitedans le voisinage de l’origine). Toutefois, l’instabilite correspondante n’est observable que dansun tres petit voisinage de l’equilibre. Lorsque les conditions initiales du vehicule n’appartiennepas a un tel voisinage, comme c’est le cas pour la simulation de la Figure 2.2, les effets de lanon-robustesse ne sont generalement visibles qu’au bout d’un temps tres long. Autrement dit,en pratique, la vitesse de convergence semble ici un facteur beaucoup plus critique que la non-robustesse. Notons cependant que pour la voiture, il existe des retours d’etat Lipschitz-continusqui garantissent la robustesse vis-a-vis de dynamiques non-modelisees (Maini et al., 1999).

Page 58: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

44 Stabilisation de systemes critiques : une vue d’ensemble

−1 −0.5 0 0.5 1 1.5 2 2.5−1

−0.5

0

0.5

1

1.5

2

2.5

x

y

0 10 20 30 40 50 60 70 80−1

−0.5

0

0.5

1

1.5

2

t

(x,y

,θ)

x: − y: −− θ: −.

0 10 20 30 40 50 60 70 80−10

−5

0

5

t

v

v1: − v2: −−

Fig. 2.2 – Commande Lipschitz-continue (2.10), convergence lente

0 10 20 30 40 50 60 70 80−1

−0.5

0

0.5

1

1.5

2

t

(x,y

,θ)

x: − y: −− θ: −.

0 10 20 30 40 50 60 70 80−10

−5

0

5

t

v

v1: − v2: −−

Fig. 2.3 – Commande Lipschitz-continue (2.10), bruit de mesure

Page 59: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation asymptotique de points fixes 45

Enfin, comme l’illustre la Figure 2.3, l’inefficacite de la commande au voisinage de l’origineva de pair avec une faible sensibilite aux bruits de mesure.

Les retours d’etat instationnaires seulement continus

L’impossibilite d’obtenir une convergence exponentielle avec des retours d’etat Lipschitz-continus, formellement etablie selon la Proposition 8 et illustree par les resultats de simulationprecedents, a motive la recherche de retours d’etat seulement continus afin d’obtenir de meilleuresproprietes de convergence. La classe des retours d’etat homogenes s’est averee une possibilite par-ticulierement interessante. Nous reviendrons en detail sur ce type de commande dans la deuxiemepartie de ce memoire. Leur interet repose principalement sur deux points :

• Ils generalisent, pour les systemes critiques, les retours d’etat lineaires pour les systemesdont le linearise est commandable. Ainsi, de nombreuses proprietes valides pour les systemeslineaires peuvent etre etendues aux systemes critiques. En particulier, la stabilite asympto-tique d’un point d’equilibre d’un systeme controle assure automatiquement la convergenceexponentielle des solutions vers zero des lors que le systeme est homogene de degre zero(voir ci-dessous).

• La plupart des systemes non-lineaires commandables possedent une approximation homo-gene qui rend compte de leurs proprietes de commandabilite et peut etre utilisee pour lasynthese de lois de commandes stabilisantes.

L’utilisation de retours d’etat homogenes pour la stabilisation de systemes critiques a debutevers la fin des annees 80 (Kawski, 1989b; Dayawansa et al., 1990). Pour les systemes qui, de plus,ne verifient pas la condition necessaire de Brockett, la possibilite de coupler la notion de retourd’etat homogene avec celle de retour d’etat instationnaire a d’abord ete proposee dans (M’Closkey& Murray, 1993). De nombreux developpements de cette approche ont ensuite ete realises. A titred’exemple, pour tout systeme sans derive (S0) satisfaisant la condition de rang (1.1) en un pointx0, on peut trouver des retours d’etat homogenes qui stabilisent exponentiellement ce point (Morinet al., 1999). Nous renvoyons a la deuxieme partie de ce memoire pour un expose plus detaillesur les notions d’homogeneite. Nous nous contentons ici de donner le minimum de definitions etproprietes necessaires pour la comprehension de cette section.

Definition 10 On appelle vecteur de poids sur Rn, tout vecteur r = (r1, . . . , rn) ∈ Rn avecri > 0 pour tout i. Etant donne un vecteur de poids sur Rn, une fonction u ∈ C0(Rn × R; R) estdite fonction ∆r-homogene de degre d si :

∀λ > 0, ∀(x, t) ∈ Rn × R, u(∆rλx, t) = λdu(x, t)

avec ∆rλx := (λr1x1, . . . , λ

rnxn). Puisque cette propriete ne depend pas de la variable t, la defini-tion s’applique egalement au cas ou u elle-meme ne depend pas de t. Un champ de vecteur X surRn est dit champ de vecteur ∆r-homogene de degre τ si, pour tout i = 1, . . . , n, Xi est unefonction ∆r-homogene de degre τ + ri.

La proposition suivante, consequence par exemple de l’extension au cas instationnaire par (Pomet& Samson, 1994) du theoreme de (Rosier, 1992), fait le lien entre l’homogeneite de degre τ = 0et la propriete de convergence exponentielle.

Page 60: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

46 Stabilisation de systemes critiques : une vue d’ensemble

Proposition 10 Soient un systeme (S) et un vecteur de poids r tels que X0 (resp. X1, . . . , Xm)soit ∆r-homogene de degre 0 (resp. −τ1, . . . ,−τm < 0). Soit u(x, t) un retour d’etat continu perio-dique par rapport a t, avec ui ∆r-homogene de degre τi (pour tout i = 1, . . . ,m). Alors, si l’originedu systeme boucle est asymptotiquement stable, cet equilibre est globalement K-exponentiellementstable, au sens ou il existe γ > 0 et une fonction k de classe1 K tels que, pour toute solutionx(.) du systeme boucle,

|x(t)| ≤ k(|x(t0)|)e−γ(t−t0) (2.11)

L’inegalite (2.11) implique bien une convergence exponentielle de |x(t)| vers zero, mais cettepropriete de stabilite K-exponentielle n’est pas equivalente, en general, a la propriete de stabiliteexponentielle classique, i.e.

|x(t)| ≤ K|x(t0)|e−γ(t−t0)

car la fonction k dans (2.11) n’est pas necessairement Lipschitz-continue a l’origine.En ce qui concerne le modele cinematique de la voiture, on travaille typiquement avec le

systeme chaıne dont les champs de commande associes, X1 et X2, sont ∆r(q)-homogenes de degre−1 et −q respectivement par rapport au vecteur de poids r(q) = (1, q, q + 1, q + 2) avec q ∈ N∗.L’utilisation de la Proposition 10 pour ce systeme consiste a trouver q ∈ N∗, ainsi que des retoursd’etat u(x, t) periodiques par rapport a t, tels que u1 et u2 soient ∆r(q)-homogenes de degre 1et q respectivement, et tels que l’origine du systeme boucle soit asymptotiquement stable. Lapropriete de stabilite K-exponentielle est alors garantie par la proposition. De tels retours d’etatsont donnes dans le resultat suivant (que l’on peut comparer a la Proposition 9).

Proposition 11 (Morin & Samson, 2000) Soient k1, k2, k3, k4, k5 > 0 des scalaires tels que lepolynome p(s) = s3 +k2s

2 +k3s+k4 soit Hurwitz. Pour tout couple d’entiers p, q ∈ N∗, on definitune fonction ρp,q sur R3 par

∀x2 = (x2, x3, x4) ∈ R3, ρp,q(x2) =(|x2|p/r2(q) + |x3|p/r3(q) + |x4|p/r4(q)

)1/p

avec r(q) = (1, q, q + 1, q + 2). Alors, il existe q0 > 0 tel que pour tout q ≥ q0 et p > q + 2, leretour d’etat continu ∆r(q)-homogene

u1(x, t) = −(k1(x1 sin t+ |x1|) + k5ρp,q(x2)

)sin t

u2(x, t) = −|u1|k2x2

ρp,q(x2)− u1k3

x3

ρ2p,q(x2)

− |u1|k4x4

ρ3p,q(x2)

(2.12)

stabilise K-exponentiellement l’origine du systeme chaıne de dimension quatre.

Les resultats de simulation que nous presentons maintenant ont ete obtenus a partir de la com-mande (2.12), pour le choix suivant de parametres :

(k1, k2, k3, k4, k5) = (1.4, 10, 18, 17, 0.6); q = 1; p = 4

La simulation correspondant au cas ideal, Figure 2.4, montre clairement le gain obtenu, en termede vitesse de convergence, par rapport a une commande Lipschitz-continu (Figure 2.2).

1une fonction k est dite de classe K si k ∈ C0(R+; R+) est strictement croissante, et k(0) = 0.

Page 61: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation asymptotique de points fixes 47

Les retours d’etat homogenes heritent d’un certain nombre de proprietes de robustesse dessystemes lineaires. On peut ainsi montrer que la stabilite asymptotique du point d’equilibre estconservee apres echantillonnage de la commande (a une frequence suffisamment elevee bien sur).Bien que ces commandes ne soient generalement que continues, il existe egalement des methodespermettant de deduire d’une commande homogene une autre commande pour le systeme auquelon a ajoute un integrateur sur l’entree (voir la deuxieme partie de ce memoire). Par exemple, il estpossible de deduire de la commande (2.12) une commande w stabilisant le systeme chaıne auquelon a ajoute la dynamique sur les vitesses u = w. Malheureusement, les retours d’etat homogenesne garantissent pas la robustesse vis-a-vis de dynamiques non modelisees, pour la propriete destabilite asymptotique. Le resultat de simulation de la Figure 2.5, obtenu a partir du modeleperturbe (2.9), illustre ce defaut de robustesse. Par analogie avec les systemes lineaires, le termede perturbation intervient comme un biais au niveau de l’entree de commande, la principaledifference etant que dans le cas lineaire, ce biais n’empeche pas la convergence des solutionsvers une valeur constante alors que dans le cas present, les termes instationnnaires induisentune oscillation residuelle. Autrement dit, l’etat du systeme converge vers un cycle limite. Cedefaut de non-robustesse est recurrent avec ce type de commande (Lizarraga et al., 1999) (voir laseconde partie de ce memoire pour plus details). Ceci n’est guere surprenant si l’on observe queces commandes reviennent grosso-modo a utiliser des gains infinis a l’origine, comme on peut levoir en comparant les commandes u2 de (2.10) et (2.12).

−1 −0.5 0 0.5 1 1.5 2 2.5−1

−0.5

0

0.5

1

1.5

2

2.5

x

y

0 10 20 30 40 50 60 70 80−1

−0.5

0

0.5

1

1.5

2

t

(x,y

,θ)

x: − y: −− θ: −.

0 10 20 30 40 50 60 70 80−7

−6

−5

−4

−3

−2

−1

0

1

2

3

t

v

v1: − v2: −−

Fig. 2.4 – Commande homogene (2.12), convergence exponentielle

Page 62: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

48 Stabilisation de systemes critiques : une vue d’ensemble

0 10 20 30 40 50 60 70 80−1

−0.5

0

0.5

1

1.5

2

t

(x,y

,θ)

x: − y: −− θ: −.

0 10 20 30 40 50 60 70 80−6

−5

−4

−3

−2

−1

0

1

2

t

v

v1: − v2: −−

Fig. 2.5 – Commande homogene (2.12) : dynamique non-modelisee

Finalement, la simulation avec bruit de mesure, Figure 2.6, montre une tres forte sensibilitea ce niveau. Evidemment, sur un systeme reel, la dynamique des actionneurs aurait un fort effetde filtrage sur les vitesses. Neanmoins, les consequences de cette sensibilite sur l’erreur residuellede positionnement sont bien illustrees par cette simulation.

0 10 20 30 40 50 60 70 80−1

−0.5

0

0.5

1

1.5

2

t

(x,y

,θ)

x: − y: −− θ: −.

0 10 20 30 40 50 60 70 80−8

−6

−4

−2

0

2

4

t

v

v1: − v2: −−

Fig. 2.6 – Commande homogene (2.12) : bruit de mesure

Que ce soit pour les dynamiques non-modelisees ou pour les bruits de mesure, il est possiblede donner un ordre de grandeur de la taille du cycle limite residuel, en fonction de l’erreur demodelisation ou de l’amplitude du bruit de mesure. En utilisant les coordonnees “naturelles”x, y, θ, ϕ de la voiture, on a (dans le pire cas) :

Page 63: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation asymptotique de points fixes 49

cl(x) ≈ δ1/(q+1)

cl(y) ≈ δ(q+2)/(q+1)

cl(θ) ≈ δ

cl(ϕ) ≈ δq/(q+1)

et

cl(x) ≈ σ1/(q+2)

cl(y) ≈ σ

cl(θ) ≈ σ(q+1)/(q+2)

cl(ϕ) ≈ σq/(q+2)

(2.13)

ou δ est une mesure de la norme de l’erreur de modele (cf. Definition 9), σ designe l’ecart typedu bruit de mesure, q est le parametre de la Proposition 11, et cl(z) designe la taille du cyclelimite dans la direction z. Ces relations indiquent que les erreurs de modele et de mesure affectenttres differemment les diverses composantes de l’etat, et sont particulierement amplifiees pour lesvariables dont le “poids”, au sens de la Definition 10, est le plus faible. Pour les lois de commandeutilisees ci-dessus pour la voiture, on retrouve bien ces ordres de grandeur dans le cas des bruitsde mesure. Pour la dynamique non-modelisee, la situation est differente car la perturbation quel’on a considere dans (2.9) ne correspond pas au pire cas. Pour cette perturbation particuliere, ilfaudrait remplacer dans (2.13) δ par δ1+1/q pour avoir l’estimation de l’erreur residuelle.

Les retours d’etat hybrides

L’expression retour d’etat hybride recouvre plusieurs types de commandes, qui ont cependantpour caracteristique commune de combiner des approches temps continu et temps discret. Tressouvent, elles se situent a mi-chemin entre la boucle ouverte et le retour d’etat, dans le sens oul’etat (ou une partie de l’etat) n’est pas remis a jour en continu mais seulement periodiquement,a une frequence beaucoup plus faible que la frequence d’echantillonnage de la commande. Dans(Sørdalen & Egeland, 1995), des retours d’etat continus hybrides sont proposes pour stabiliserK-exponentiellement l’origine des systemes chaınes. Un autre resultat interessant est donne dans(Bennani & Rouchon, 1995) : il y est montre que l’on peut obtenir a la fois une convergenceexponentielle, et la robustesse vis-a-vis de dynamiques non-modelisees pour la propriete de sta-bilite asymptotique, en utilisant des retours d’etat hybrides. Les commandes proposees dans cetarticle sont du type u(x(kT ), t) avec k ∈ N et t, T ∈ R. Plus precisement, elles consistent a iterer,toutes les T secondes, une commande en boucle ouverte de type “dead-beat control”. Notonsqu’un resultat similaire a aussi ete propose dans (Lucibello & Oriolo, 1996) pour la classe dessystemes chaınes. Toutefois, dans ce dernier article, la robustesse vis-a-vis de dynamiques non-modelisees est montree sous une condition particuliere, et contrairement a (Bennani & Rouchon,1995), il ne semble pas evident que cette condition puisse etre satisfaite pour des dynamiquesnon-modelisees arbitraires (et de petite amplitude evidemment). Dans (Morin & Samson, 1999),nous avons generalise le resultat de (Bennani & Rouchon, 1995) a tous les systemes analytiquessans derive, verifiant la condition de rang. Pour preciser la propriete de stabilite donnee par cetype de commande, introduisons la definition suivante.

Definition 11 On dit qu’un retour d’etat hybride u(x(kT ), t) (k ∈ N, t, T ∈ R) est un stabili-sateur K(T )-exponentiel pour le systeme sans derive (S0), s’il existe des constantes γ < 1 etK, η telles que, pour tout x0, la solution x(., 0, x0) du systeme defini par

∀k ∈ N,∀t ∈ [kT, (k + 1)T ), x(t) =m∑

i=1

ui(x(kT ), t)Xi(x(t))

Page 64: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

50 Stabilisation de systemes critiques : une vue d’ensemble

avec x(0) = x0 satisfait, pour tout k ∈ N et s ∈ [0, T ),

|x((k + 1)T, 0, x0)| ≤ γ|x(kT, 0, x0)| et |x(kT + s, 0, x0)| ≤ K|x(kT, 0, x0)|η (2.14)

La relation (2.14) implique une convergence exponentielle des solutions vers zero. Par contre onne peut pas en deduire la stabilite de ce point. En particulier, par comparaison avec la definitionde stabilite K-exponentielle, l’inegalite (2.11) n’est pas necessairement satisfaite pour tout t0,bien qu’elle le soit pour tout t0 = kT (k ∈ N). La propriete de stabilite n’est donc pas satisfaiteau sens strict du terme.

Pour la voiture, les commandes suivantes, exprimees dans les coordonnees du systeme chaıne,sont des stabilisateurs K(T )-exponentiels robustes vis-a-vis de dynamiques non-modelisees.

Proposition 12 (Morin & Samson, 1999) Soit T ∈ R+, et k1, . . . , k4 des scalaires tels que|ki| < 1 pour tout i. Alors, le retour d’etat hybride u(x(kT ), t) (k ∈ N, t, T ∈ R) defini dans lescoordonnees du systeme chaıne de dimension quatre par

u1(x, t) =1T

((k1 − 1)x1 + 2πρ(x) sin(2πt/T ))

u1(x, t) =1T

((k2 − 1)x2 + 2(k3 − 1)

x3

ρ(x)cos(2πt/T ) + 8(k4 − 1)

x4

ρ2(x)cos(4πt/T )

) (2.15)

avec ρ(x) = a3|x3|13 + a4|x4|

14 et a3, a4 > 0,

i) est un stabilisateur K(T )-exponentiel pour la voiture,ii) garantit la robustesse vis-a-vis de dynamiques non-modelisees pour la propriete de stabiliteK(T )-exponentielle.

Les resultats de simulation ci-dessous ont ete effectues a partir de la commande (2.15), avec lesvaleurs suivantes de parametres : T = 3; k1 = k2 = k3 = k4 = 0.25; a3 = a4 = 0.95.

La simulation dans le cas ideal, Figure 2.7, illustre bien la propriete de convergence exponen-tielle. On verifie egalement, Figure 2.8, la convergence en presence de dynamiques non-modelisees.L’introduction de bruits de mesure, Figure 2.9, montre une sensibilite importante, analogue a celleobservee avec les retours d’etat homogenes continus (Figure 2.6).

Malheureusement, la robustesse vis-a-vis de dynamiques non-modelisees n’est qu’un aspect deschoses, et elle ne garantit pas la robustesse vis-a-vis d’autres types d’erreurs. De fait, la robustesseobtenue par les lois de commande de la Proposition 12 (mais aussi celles de (Bennani & Rouchon,1995)), repose sur le fait que certaines integrales s’annulent exactement sur chaque intervalle detemps [kT, (k+1)T ]. C’est en particulier le cas pour les integrales des fonctions trigonometriquesutilisees dans (2.15). Toutefois, en pratique, la commande (2.15) va aussi etre echantillonnee parrapport a t, et elle risque aussi de subir des retards au niveau de son application. De ce fait, il sepeut que les integrales en question ne soient plus nulles sur chaque intervalle [kT, (k+1)T ]. Ainsi,le moindre retard sur l’application de la commande peut suffire a perdre la robustesse vis-a-visde dynamiques non-modelisees pour la propriete de convergence asymptotique. Ce phenomeneest illustre par la simulation de la Figure 2.10, pour laquelle un retard de 0.1s sur l’applicationde la commande a ete introduit. Alors qu’on observe toujours la convergence asymptotique versl’origine lorsque la commande est applique sur le modele ideal (haut de la figure), ce n’est plusle cas lorsque le modele perturbe (2.9) est utilise (bas de la figure).

Page 65: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation asymptotique de points fixes 51

−1 −0.5 0 0.5 1 1.5 2 2.5−1

−0.5

0

0.5

1

1.5

2

2.5

x

y

0 10 20 30 40 50 60 70 80−4

−3

−2

−1

0

1

2

3

4

t

v

v1: −

v2: −−

0 10 20 30 40 50 60 70 80−1

−0.5

0

0.5

1

1.5

2

t

(x,y

,θ)

x: − y: −− θ: −.

Fig. 2.7 – Commande hybride (2.15), convergence exponentielle

0 10 20 30 40 50 60 70 80−0.5

0

0.5

1

1.5

2

2.5

t

(x,y

,θ)

x: − y: −− θ: −.

0 10 20 30 40 50 60 70 80−4

−3

−2

−1

0

1

2

3

4

t

v

v1: −

v2: −−

Fig. 2.8 – Commande hybride (2.15), dynamique non-modelisee

Page 66: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

52 Stabilisation de systemes critiques : une vue d’ensemble

0 10 20 30 40 50 60 70 80−0.5

0

0.5

1

1.5

2

2.5

t

(x,y

,θ)

x: − y: −− θ: −.

0 10 20 30 40 50 60 70 80−3

−2

−1

0

1

2

3

t

v

v1: −

v2: −−

Fig. 2.9 – Commande hybride (2.15), bruit de mesure

0 10 20 30 40 50 60 70 80−1

−0.5

0

0.5

1

1.5

2

t

(x,y

,θ)

x: − y: −− θ: −.

0 10 20 30 40 50 60 70 80−4

−3

−2

−1

0

1

2

3

4

t

v

v1: − v2: −−

0 10 20 30 40 50 60 70 80−1

−0.5

0

0.5

1

1.5

2

t

(x,y

,θ)

x: − y: −− θ: −.

0 10 20 30 40 50 60 70 80−4

−3

−2

−1

0

1

2

3

4

t

v

v1: − v2: −−

Fig. 2.10 – Commande hybride (2.15), retard sur la commande (haut : modele ideal ; bas :dynamique non-modelisee)

Page 67: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation asymptotique de trajectoires admissibles non-stationnaires 53

En resume de cette section consacree aux retours d’etat pour la stabilisation asymptotique depoints fixes, on peut dire que malgre tous les efforts consacres a la synthese de ces commandes,aucune solution existante ne permet d’assurer a la fois de bonnes performances en terme de vitessede convergence, et de bonnes proprietes de robustesse vis-a-vis d’erreurs de modele. Il est tresprobable que cette difficulte soit intrinseque a tous les systemes critiques. En pratique, la miseen œuvre de ces commandes necessitera donc d’etre tres attentif aux points suivants :

• identification du modele,

• filtrage des mesures,

• echantillonnage de la commande.

Ces aspects sont bien sur importants pour tout systeme commande, mais ils le sont encore pluspour les systemes critiques.

2.3 Stabilisation asymptotique de trajectoires admissibles non-stationnaires

Les difficultes que l’on rencontre pour stabiliser asymptotiquement des points fixes viennentdu fait que le linearise en ces points n’est pas commandable. Pour des trajectoires de referencenon-stationnaires, le linearise peut cependant posseder de bonnes proprietes de commandabilite.Dans un certain sens mathematique, c’est effectivement le cas pour“la plupart”de ces trajectoires,qui peuvent eventuellement etre stabilisees asymptotiquement en utilisant des techniques de typelineaire. Les matrices d’etat et de commande associees aux systemes linearises etant fonction dutemps, les analyses de stabilite peuvent cependant etre difficiles, et ne sont generalement possiblesque sous certaines hypotheses sur les trajectoires de reference. L’utilisation de techniques non-lineaires (mais qui reposent neanmoins sur les proprietes des linearises) peut permettre de relacherles hypotheses en question et/ou garantir un plus grand domaine de stabilite.

Dans cette section, nous commencons par rappeler des proprietes de commandabilite dessystemes linearises le long de trajectoires. Nous presentons ensuite des resultats de synthese pourla stabilisation asymptotique de certaines trajectoires admissibles non-stationnaires.

2.3.1 Proprietes de commandabilite des systemes linearises

Rappelons tout d’abord quelques definitions et proprietes de commandabilite des systemeslineaires instationnaires (voir (Chen, 1984, Sec. 5.3) pour plus de details).

Definition 12 Un systemex = A(t)x+B(t)u (2.16)

avec x ∈ Rn est dit• commandable sur [t0, tf ] si, pour tout couple x0, xf ∈ Rn, il existe une commande u(t)

definie et continue par morceaux sur [t0, tf ], pour laquelle la solution de (2.16) avec x(t0) =x0 verifie x(tf ) = xf .

• differentiellement commandable au temps t0 si, pour tout couple x0, xf ∈ Rn, et pourtout ε > 0 il existe une commande u definie sur [t0, t0+ε] pour laquelle la solution de (2.16)avec x(t0) = x0 verifie x(t0 + ε) = xf .

Page 68: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

54 Stabilisation de systemes critiques : une vue d’ensemble

Les proprietes suivantes sont aussi montrees dans (Chen, 1984, Sec. 5.3).

Proposition 13 On suppose que les matrices A(t) et B(t) dans (2.16) sont de classe Cn−1 en lavariable t. Soit M0(t), . . . ,Mn−1(t0) les matrices definies par

M0(t) := B(t)Mk+1(t) := Mk(t)−A(t)Mk(t) (k = 0, . . . , n− 2)

Alors, siRang (M0(tf ) · · ·Mn−1(tf )) = n

le systeme (2.16) est commandable sur tout intervalle [t0, tf ] avec t0 < tf . Si de plus les matricesA(t) et B(t) sont analytiques, (2.16) est differentiellement commandable en tout temps.

Considerons maintenant un systeme de commande (S).

Definition 13 Etant donne un systeme (S) sur Rn, on dit que u : [0, T ] −→ Rm est une com-mande non-singuliere en x0, s’il existe T0 ≤ T tel que le linearise de (S) le long de la solutionxu(t, 0, x0) associee a u est commandable sur [0, T0]. Si u est non-singuliere en tout x0 ∈ Rn, ondit que u est une commande non-singuliere universelle

Les commandes non-singulieres ont ete particulierement etudiees par Sontag dans une serie d’ar-ticles : (Sontag, 1987; Sontag, 1988; Sontag, 1992; Sontag, 1995). Le resultat suivant montre lagenericite de ces commandes (voir egalement (Coron, 1994) pour des resultats complementaires).

Theoreme 10 (Sontag, 1992) Soit (S) un systeme analytique sur Rn, tel que pour tout x ∈ Rn,

dim L(adkX0(Xi) : i = 1, . . . ,m, k ∈ N)(x) = n (2.17)

avec ad0X0(Xi) := Xi et adkX0(Xi) := [X0, adk−1X0(Xi)] (k > 0). Alors, il existe des com-mandes non-singulieres universelles pour ce systeme. De plus, l’ensemble des commandes non-singulieres universelles de classe C∞ est generique2 dans C∞([0, T ]; Rm) pour tout T > 0.

Notons que la condition (2.17), qui correspond a la propriete “d’accessibilite forte” est une condi-tion necessaire pour la commandabilite en temps petit. Ainsi, tous les exemples du Chapitre 1,apres expression de leur modele dans un systeme de coordonnees analytique, verifient les hypo-theses de ce theoreme. Leur linearise le long de trajectoires de reference est donc commandablepour“presque toutes” les entrees de reference. Nous illustrons cette propriete sur l’exemple du mo-dele cinematique de la voiture. Rappelons le systeme d’erreur (1.36) par rapport a une trajectoirede reference (obtenu a partir du modele cinematique (1.34)) :

˙g = u1

cos θsin θζ + ζr

+ ur1

cos θ − 1 + yζrsin θ − xζr

ζ

˙ζ = u2

(2.18)

2Il contient une intersection denombrable d’ouverts denses pour la topologie C∞.

Page 69: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation asymptotique de trajectoires admissibles non-stationnaires 55

On note ξ := (g, ζ) = (x, y, θ, ζ). En assimilant θ a une variable reelle, et donc ξ a un element deR4, le linearise de ce systeme en ξ = 0, u = 0, est donne par

ξ = ur1(t)A1(ζr(t))ξ +B(ζr(t))u (2.19)

avec

A1(ζr) :=

0 ζr 0 0−ζr 0 1 00 0 0 10 0 0 0

, B(ζr) :=

1 00 0ζr 00 1

Un application directe de la Proposition 13 implique que pour des entrees de reference ur declasse C3, le systeme lineaire (2.19) est commandable sur [t0, tf ] si ur

1 n’est pas identiquementnulle sur cet intervalle. Ainsi, pour tout T > 0, l’ensemble ur ∈ C∞([0, T ]; R2) : ur

1 6= 0 est unensemble de commandes non-singulieres universelles, qui est bien dense dans C∞([0, T ]; R2).

Les methodes de stabilisation asymptotique de trajectoires admissibles non-stationnaires re-posent sur ces proprietes de commandabilite des systemes d’erreur linearises. Notons que, impli-citement ou explicitement (Coron, 1992a), ces proprietes jouent aussi un role important pour lastabilisation asymptotique de points fixes. Afin de synthetiser des commandes asymptotiquementstabilisantes, une premiere approche consiste a chercher des retours d’etat lineaires qui stabilisentle systeme d’erreur linearise, en esperant que ces commandes stabiliseront egalement, au moinslocalement, le systeme d’erreur de depart. Pour que cette derniere propriete soit satisfaite, il estgeneralement necessaire d’imposer des conditions supplementaires sur les trajectoires de reference,qui garantissent une forme d’uniformite de la commandabilite par rapport au temps. Une autreapproche consiste a travailler directement sur le systeme d’erreur initial, i.e. non-lineaire. En ge-neral, les retours d’etat ainsi synthetises sont egalement non-lineaires. Nous illustrons ci-dessousces deux types d’approches sur l’exemple de la voiture.

2.3.2 Stabilisation asymptotique par retour d’etat lineaire

La proposition suivante montre le type de resultat que l’on peut obtenir en utilisant desretours d’etat lineaires.

Proposition 14 On considere le systeme d’erreur (2.18) par rapport a une trajectoire de refe-rence (gr, ζr), et son linearise (2.19). On suppose que le le long de la trajectoire de reference, ζrest bornee. Soit K(t) la matrice

K(t) =(−k1|ur

1(t)| 0 − k12k2ζr(t)|ur

1(t)| 02k2u

r1(t)ζr(t) −2k2k4|ur

1(t)| −ur1(t)(2k2 + k3

2 ) −k4|ur1(t)|

)(2.20)

avec k1, . . . , k4 > 0. Alors,i) si ur et ur (supposee bien definie) sont bornees, le retour d’etat lineaire u = K(t)ξ rend

l’origine du systeme lineaire (2.19) stable, et globalement asymptotiquement stable si ur1(t)

ne tend pas vers zero quand t tend vers l’infini.ii) Si ur

1(t) est de signe constant et∫ t0 |u

r1|(s) ds −→ +∞ lorsque t −→ +∞, u = K(t)ξ rend

l’origine du systeme non-lineaire (2.18) localement asymptotiquement stable.

Page 70: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

56 Stabilisation de systemes critiques : une vue d’ensemble

La preuve de ce resultat est donnee en Annexe A.1.2.

Le resultat precedent a pour interet de fournir une solution de commande tres simple, avecdes gains ki qui permettent de regler le transitoire. Une facon de choisir ces gains consiste aconsiderer des trajectoires de reference correspondant a des mouvements rectilignes du vehicule.Par exemple, si l’on pose ur

1 = 1 et ur2 = ζr = 0, le systeme d’erreur linearise boucle est donne

par

ξ =

−k1 0 0 00 0 1 00 0 0 10 −2k2k4 −(4k2 + k3)/2 −k4

ξ

Le choix des ki peut alors etre fait a partir de ce systeme, sachant que la commande (2.22) estfaite pour assurer les memes trajectoires dans l’espace d’etat quelque soit ur

1 (non nul).

Les resultats de simulation de la Figure 2.11 illustrent la Proposition 14. Le retour d’etatlineaire defini par la matrice d’etat K(t) est utilise avec (k1, . . . , k4) = (1, 0.2, 8, 3). Les conditionsinitiales pour le vehicule commande sont donnees par (x, y, θ, ζ)(0) = (0, 3, 0, 0), et celles duvehicule de reference par (xr, yr, θr, ζr)(0) = (3.5, 0, 0, 0). Les vitesses du vehicule de referencesont donnees, dans les coordonnees du modele initial (2.6), par

t ∈ [0, 20)s vr1 = 0 m/s; vr

2 = 0 rad/st ∈ [20, 30)s vr

1 = 1 m/s; vr2 = 0 rad/s

t ∈ [30, 40)s vr1 = −1 m/s; vr

2 = 0 rad/st ∈ [40, 40.4)s vr

1 = 1 m/s; vr2 = 1 rad/s

t ∈ [40.4, 80]s vr1 = 1 m/s; vr

2 = 0 rad/s

(2.21)

Ces vitesses correspondent a une configuration fixe pour t ∈ [0, 20), un mouvement rectiligne enmarche avant pour t ∈ [20, 30), un mouvement rectiligne en marche arriere pourt ∈ [30, 40), etdes mouvements non-rectilignes pour t ∈ [40, 40.4) et t ∈ [40.4, 80].

Les trajectoires dans le plan cartesien, pour le vehicule commande ainsi que pour le vehiculede reference, sont donnes en haut de la figure. Les trois premieres composantes de l’erreur desuivi ξ sont donnees en bas a gauche. Les entrees de commande, dans les coordonnees du modele(2.6), sont donnees en bas a droite. En depit du fait que la vitesse lineaire vr

1(= ur1) n’est pas

de signe constant, la convergence asymptotique de l’erreur de suivi vers zero semble bien assureedans les phases ou vr

1 est non nul. Evidemment, on remarque aussi qu’il n’y a pas convergencedans la phase initiale, lorsque le vehicule de reference est immobile. Enfin, notons que l’erreurinitiale est relativement grande, ce qui semble indiquer, pour ces valeurs de gain, un large domainede stabilite. Malheureusement, il est difficile de garantir ces “bonnes proprietes”. L’utilisation deretours d’etat non-lineaires peut permettre d’aller plus loin dans l’analyse, au prix cependantd’une certaine complexification de la commande.

Page 71: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation asymptotique de trajectoires admissibles non-stationnaires 57

−2 0 2 4 6 8 10 12 14−2

−1

0

1

2

3

4

5

6

7

8

x

y

Trajectoire du véhicule commandé: − Trajectoire du véhicule de référence : −−

0 10 20 30 40 50 60 70 80−4

−3

−2

−1

0

1

2

3

t

(ξ 1

,ξ2,ξ

3)

ξ1: − ξ2: −− ξ3: −.

0 10 20 30 40 50 60 70 80−5

−4

−3

−2

−1

0

1

2

3

4

5

t

v v1: − v2: −−

Fig. 2.11 – Stabilisation de trajectoires admissibles par retour d’etat lineaire

2.3.3 Stabilisation asymptotique par retour d’etat statique non-lineaire

Le resultat suivant peut etre vu comme une version non-lineaire de la Proposition 14. Parrapport a cette derniere, la stabilite asymptotique est montree sans hypothese de signe sur ur

1.De plus, le domaine de stabilite (maximal) est explicitement donne.

Proposition 15 On considere le systeme d’erreur (2.18) par rapport a une trajectoire de refe-rence (gr, ζr), et l’on suppose que le le long de la trajectoire de reference, ζr est bornee ainsi queur et ur (supposee bien definie). Alors, avec ξ := (g, ζ), le retour d’etat

u1 = −k1|ur1|(ξ1 cos ξ3 + ξ2 sin ξ3 + (ξ4+ζr)

k2(1 + tan2 ξ3

2 ) tan ξ32

)u2 = k2Fx cos2 ξ3

2 sin ξ3 − 2k2Fy cos4 ξ32 − k2Fθ

(ξ1(3

4 sin2 ξ3 − cos4 ξ32 )− 2ξ2 sin ξ3 cos2 ξ3

2

)− k3u

r1(1 + tan2 ξ3

2 ) tan ξ32 − k4|ur

1|z(2.22)

Page 72: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

58 Stabilisation de systemes critiques : une vue d’ensemble

avec k1, k2, k3, k4 > 0,Fx := u1 cos ξ3 + ur

1(cos ξ3 − 1 + ξ2ζr)Fy := u1 sin ξ3 + ur

1(sin ξ3 − ξ1ζr)Fθ := u1(ξ4 + ζr) + ur

1ξ4

etz := ξ4 + 2k2(−ξ1 sin

ξ32

+ ξ2 cosξ32

) cos3ξ32

(2.23)

rend l’origine du systeme (2.18) stable. Si de plus ur1 ne tend pas vers zero lorsque t tend vers

l’infini, alors l’origine est globalement asymptotiquement stable sur R2 × (−π, π)× R.

La preuve de ce resultat est donnee en Annexe A. Une autre version de la Proposition 15, avecun domaine de stabilite moins large, est aussi donnee dans (Morin & Samson, 2001b). La preuveest basee sur la synthese d’une fonction de Lyapunov “semi-stricte”, i.e. de derivee non-positivele long des trajectoires du systeme controle. Elle reprend une methode proposee anterieurementdans (Samson & Ait-Abderrahim, 1991). Notons que l’approche de type Lyapunov est classiquepour la stabilisation de trajectoires de systemes non-holonomes (voir e.g. (Kanayama et al., 1990)pour un des premiers resultats sur le sujet).

Le retour d’etat lineaire de la Proposition 14 n’est autre que la linearisation en ξ = 0 du retourd’etat non-lineaire (2.22). Ainsi, aux petites erreurs, les deux lois de commande sont quasimentequivalentes. Par consequent, si un choix des gains ki de (2.20) a ete fait afin d’optimiser certainesperformances sur le systeme lineaire commande, il paraıt naturel d’utiliser les memes valeurs degain pour la commande non-lineaire (2.22). De fait, l’utilisation de cette loi de commande avecles donnees de simulation de la section precedente, montrerait des resultats quasiment identiquesa ceux de la Figure 2.11. Pour cette raison, ces resultats ne sont pas inclus ici.

Stabilisation asymptotique par retour d’etat dynamique

La linearisation par retour d’etat dynamique, au voisinage d’un point d’equilibre, est uneapproche classique d’automatique non-lineaire. Toutefois, cette approche ne s’applique pas di-rectement aux systemes critiques, puisqu’une condition necessaire pour l’existence d’un retourd’etat dynamique linearisant est que le linearise du systeme au point considere est commandable(Charlet et al., 1991, Th. 3.1). La consequence de ceci, signalee et montree independammentdans (Luca & Benedetto, 1993), est que les algorithmes de calcul de retours d’etat dynamiqueslinearisant conduisent pour ces systemes a des singularites de la commande. Pour un vehiculede type voiture, cette singularite a lieu lorsque la vitesse d’avancement u1 passe par zero. Endehors de ces valeurs, la linearisation est cependant possible, et peut etre mise a profit pour lastabilisation asymptotique de trajectoires de reference. Cette approche a ete utilisee dans (Luca& Benedetto, 1993). Une difficulte de sa mise en œuvre reside dans le “bon conditionnement” dela commande lorsque la vitesse de reference ur

1 tend vers zero. Afin de contourner cette difficulte,un changement d’echelle de temps est utilise dans (Fliess et al., 1995a). Nous exposons ci-dessouscette approche, qui s’applique a la stabilisation de trajectoires de tous les systemes sans deriveverifiant la propriete de platitude. Rappelons que cette propriete est particulierement utile a lasynthese de commandes en boucle ouverte pour la planification de trajectoires. La methode don-nee dans (Fliess et al., 1995a) est basee sur une extension dynamique du systeme. Elle conduit ades retours d’etat non-lineaires, garantissant une stabilite asymptotique locale (mais le domainede stabilite peut etre plus facilement evalue qu’avec les retours d’etat lineaires de la Proposition

Page 73: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation asymptotique de trajectoires admissibles non-stationnaires 59

14). Elle necessite egalement que ur1 soit de signe constant. Pour la voiture, elle ne fournit donc

pas un resultat de stabilite plus fort que celui de la Proposition 15. Cependant, cette approche estpotentiellement applicable a tous les systemes plats sans derive ; elle peut donc etre interessantepour de tels systemes, lorsqu’on ne connaıt pas de retours d’etat lineaires localement asymptoti-quement stabilisants, ou lorsque l’on souhaite specifier le domaine de stabilite. Nous en rappelonsbrievement le principe.

Rappelons tout d’abord qu’un systeme sans derive (S0) est dit plat (Fliess et al., 1995b) s’ilexiste m sorties plates y1, . . . , ym, telles que

i) les yi sont differentiellement independantes, i.e. elles ne sont pas liees entre elles par desequations differentielles autonomes,

ii) les yi peuvent s’exprimer en fonction des variables d’etat x1, . . . , xn, des variables decommande u1, . . . , um et de leurs derivees,

iii) les yi “parametrisent” le systeme, i.e. les variables d’etat xi et les commandes ui peuventelles-memes s’exprimer en fonction des yi et de leur derivees.

Les modeles cinematiques de la voiture sont plats avec comme sorties plates (y1, y2) = (x, y)les coordonnees du point situe au milieu de l’axe des roues arrieres. La propriete de platitudeimplique la possibilite de lineariser le systeme par une extension dynamique et un changementde variables d’etat et de commande. Malheureusement le changement de variable en questionpeut posseder des singularites. Pour le modele (2.7) de la voiture, c’est le cas lorsque u1 = 0.Les commandes ne sont alors pas definies. L’approche utilisee dans (Fliess et al., 1995b) pour“enlever” cette singularite consiste a effectuer un changement d’echelle de temps. L’utilisation dece type de changement de variable est classique dans l’etude des systemes sans derive, et elle estaussi implicite dans les lois de commande des Propositions 14 et 15. Le changement d’echelle detemps utilise dans (Fliess et al., 1995b) est t 7−→ σ(t) defini par

σ = |ur1|(t) , σ(0) = 0

Autrement dit, σ correspond simplement a la longueur d’arc de la courbe t 7−→ (xr(t), yr(t)) (t ≥0) associee a la trajectoire de reference (gr, ζr) = (xr, yr, θr, ζr), sous l’hypothese que ur

1 est designe constant. En posant ui = σvi, on a alors

dxdσ = v1 cos θdydσ = v1 sin θ

et dxrdσ = sign(ur

1) cos θr

dyr

dσ = sign(ur1) sin θr

De la sorte, dans cette nouvelle echelle de temps, la vitesse de reference est constante, non nulle,egale a ±1 selon le signe de ur

1(t). La linearisation du systeme par rapport a cette trajectoiredevient alors possible localement, en definissant l’extension dynamique

dv1dσ = z

dzdσ = w1

qui permet d’obtenir (d3xdσ3

d3ydσ3

)= α(x, y, θ, v1, z) + β(x, y, θ, v1, z)

(w1

u2

)

Page 74: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

60 Stabilisation de systemes critiques : une vue d’ensemble

avec β(x, y, θ, v1, z) une matrice localement inversible au voisinage de la trajectoire de reference.Il n’est alors pas difficile de stabiliser asymptotiquement, dans l’echelle de temps σ, x, y et leursderivees jusqu’a l’ordre deux a xr, yr et leurs derivees jusqu’a l’ordre deux. La stabilisation asymp-totique dans l’echelle de temps t en decoule sous des conditions sur ur

1 similaires a celles de laProposition 14. Notons que la matrice β(x, y, θ, v1, z) n’est pas inversible pour v1 = 0. Cettesingularite ne pose pas de probleme si ur

1(t) est de signe constant puisque dans ce cas la valeurde reference pour v1 est elle-meme constante et non nulle (egale a ±1). Dans le cas contraire, cepoint doit etre pris en compte.

2.4 Stabilisation pratique de trajectoires generales

Cette section est consacree a une methode de stabilisation que nous avons developpee cesdernieres annees pour la stabilisation pratique de systemes non-lineaires, et en particulier desystemes sans derive soumis a des perturbations additives independantes des commandes, maisarbitraires par ailleurs. Ce travail est motive par plusieurs difficultes que nous avons mentionneesdans les sections precedentes, et plus specifiquement par les trois suivantes.

• Nous avons rappele en Section 2.1 le resultat de (Lizarraga, 2004) selon lequel il n’est genera-lement pas possible de trouver une loi de commande qui stabilise asymptotiquement toutesles trajectoires admissibles d’un systeme sans derive. Lorsque la trajectoire de reference, oudu moins certaines de ses proprietes, sont connues a l’avance, le probleme de stabilisationasymptotique peut eventuellement etre resolu en utilisant les techniques de commande pre-sentees dans les sections precedentes. Lorsque la trajectoire de reference n’est pas connuea l’avance, le probleme semble theoriquement insoluble.

• Lorsque la trajectoire de reference est un point fixe, nous avons vu en Section 2.2 que malgrel’existence de nombreuses solutions de commande, il ne parait pas possible de concilierl’exigence de convergence exponentielle avec celle de robustesse de la propriete de stabilitevis-a-vis d’erreurs de modele.

• Enfin, dans certaines applications, on peut etre amene a considerer le “suivi” de trajectoiresnon-admissibles. Dans ce cas, la stabilisation asymptotique est evidemment impossible.

Ces arguments mettent en evidence l’interet, a la fois conceptuel et d’ordre pratique, de relacherl’objectif de stabilisation asymptotique, soit parce qu’il n’est pas atteignable, soit encore parcequ’il ne l’est pas de facon efficace et robuste. Le but de cette section est de montrer qu’ensubstituant a l’objectif de stabilisation asymptotique un objectif de stabilisation pratique, les troisproblemes evoques ci-dessus peuvent etre contournes. De meme que dans les sections precedentes,l’expose est principalement base sur l’exemple de la voiture, mais les resultats que nous donneronss’etendent a tous les exemples de systemes non-holonomes du Chapitre 1, ainsi qu’a d’autresclasses de systemes (voir deuxieme partie de ce memoire). Commencons par quelques definitionset resultats generaux.

2.4.1 Stabilisation pratique et fonctions transverses

Il n’existe pas a notre connaissance de definition bien etablie pour la notion de stabilisationpratique. Nous utiliserons la definition suivante, dont l’interet du point de vue applicatif est assez

Page 75: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation pratique de trajectoires generales 61

clair. Introduisons tout d’abord le systeme suivant qui generalise le systeme (S) :

(St) : x =m∑

i=1

uiXi(x) +X0(x, t) (2.24)

Definition 14 Etant donne un systeme (St) sur une variete M , on dira qu’une famille (uε)ε>0

de lois de commande est un stabilisateur pratique de x0 pour le systeme (St) si :

1. Pour tout ε > 0, il existe un ensemble compact Aε ⊂ M asymptotiquement stable pour lesysteme (St) controle par uε,

2. Pour une distance d definie localement autour de x0,

D(x0,Aε) := maxd(x0, x) : x ∈ Aε −→ 0 quand ε −→ 0

Lorsque x0 est un point d’equilibre de (St), tout retour d’etat qui stabilise asymptotiquementx0 definit un stabilisateur pratique avec Aε := x0 pour tout ε > 0. Le resultat suivant, quicorrespond a une extension du theoreme de Brockett, montre que pour de nombreux systemescritiques la synthese de stabilisateurs pratiques n’est pas necessairement plus simple que celle destabilisateurs asymptotiques.

Theoreme 11 (Byrnes, 2000) Soit un systeme x = X(x, u) avec X ∈ C1(Rn × Rm; Rn). Unecondition necessaire pour qu’il existe un retour d’etat u(x) de classe C1 qui stabilise asymptoti-quement un ensemble compact A ⊂ Rn est que l’application (x, u) 7−→ X(x, u) soit localementsurjective pour x dans un voisinage de A, i.e. pour tout voisinage U de A, X(U × Rm) doitcontenir un voisinage de 0 ∈ Rn.

On deduit facilement de ce resultat que pour tous les modeles cinematiques de vehicules non-holonomes, il n’existe pas de stabilisateur pratique autonomes (uε(x))ε>0 en un point d’equilibrex0. Autrement dit, la synthese de stabilisateurs pratiques, comme celle de stabilisateurs asymp-totiques, necessite d’utiliser d’autres types de commandes, comme par exemple des retours d’etatinstationnaires.

L’approche que nous avons developpee dans (Morin & Samson, 2001a; Morin & Samson, 2003)pour la synthese de stabilisateurs pratiques repose sur la notion de fonction transverse.

Definition 15 Soient un systeme (St) sur une variete M de dimension n, ainsi que p ∈ N etf ∈ C∞(Tp;M) avec T := R/2πZ ' S1. On dit que f est une fonction transverse pour (St) si :

∀α ∈ Tp , spanX1(f(α)), . . . , Xm(f(α))+ df(α)(TαTp) = Tf(α)M (2.25)

La definition d’une fonction transverse est independante du champ de derive X0. On peut aussi ladefinir simplement a partir d’une famille de champs de vecteurs X1, . . . , Xm, au lieu du systeme(St). Dans un systeme de coordonnees, la propriete (2.25) signifie que

∀α ∈ Tp , RangH(α) = n (2.26)

avec H(α) la matrice donnee par

H(α) :=(X1(f(α)) · · · Xm(f(α))

∂f

∂α1(α) · · · ∂f

∂αp(α))

(2.27)

Page 76: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

62 Stabilisation de systemes critiques : une vue d’ensemble

La propriete importante qu’exprime (2.26) est que les champs de commande evalues en f(α) et lesderivees partielles de f en α engendrent toutes les directions de l’espace d’etat. Notons que pourque cette propriete soit verifiee, il est necessaire que p ≥ n−m. Dans (Morin & Samson, 2001a),nous avons montre l’equivalence entre la condition de rang en x0 pour une famille de champsX1, . . . , Xm, et l’existence de fonctions transverses a valeurs dans un voisinage arbitrairementpetit de x0.

Indiquons brievement le principe d’utilisation des fonctions transverses pour la stabilisationpratique. Supposons donnee une famille de fonctions transverses (fε)ε>0 telle queD(x0, f

ε(Tp)) −→0 lorsque ε −→ 0. Avec les notations de la Definition 14, la synthese de stabilisateurs pratiquesde x0 est menee en posant Aε := fε(Tp). La propriete de transversalite permet de calculer descommandes uε(x, α, t) qui stabilisent asymptotiquement (et exponentiellement) ces ensembles.Pour ce faire, on utilise implicitement une extension dynamique du systeme (St) definie par

α = uα

ou α correspond a l’argument des fonctions transverses, et uσ peut etre vu comme un vecteurde commandes supplementaires. Ainsi les αi sont autant de “nouvelles variables de commande”associees aux directions de l’espace d’etat non-directement commandees. Puisque chaque αi estun element de S1, la commande uε(x, α, t) peut-etre assimilee a une commande a “frequencesvariables”. Notons que ce principe de frequences variables a ete utilise precedemment dans (Dixonet al., 2000) pour la commande d’un robot de type unicycle. Notre methode utilise fortementdes proprietes de symetrie des systemes de commande. Bien que developpee independamment,elle peut etre vue comme une mise en application d’une methodologie suggeree dans (Martin& Rouchon, 1998). Remarquons toutefois qu’aucune methode pour la synthese de stabilisateurspratiques n’est proposee dans (Martin & Rouchon, 1998). Les fonctions transverses apportentune solution a ce probleme.

2.4.2 Application a la stabilisation pratique de trajectoires generales

Dans cette section, nous illustrons l’approche par fonctions transverses sur le probleme destabilisation pratique de trajectoires generales (i.e. non necessairement admissibles), pour la voi-ture. Rappelons qu’une application possible du probleme de stabilisation pratique de trajectoiresgenerales est celle du suivi d’un autre vehicule, comme evoque en Section 2.1 (cf. Figure 2.1).Des resultats experimentaux bases sur cette approche, avec un vehicule de type unicycle, sontpresentes dans (Artus et al., 2003; Artus et al., 2004).

Un resultat de stabilisation

Pour la voiture, l’interet de la notion de fonction transverse repose en partie sur le lemmetechnique suivant.

Lemme 1 Soit un systeme

ξ = u1X1(ξ) + u2X2(ξ) + P (ξ, t) (2.28)

avec X1 et X2 les champs de commande associes au modele cinematique (2.7) de la voiture, et Pune fonction continue. Soit f une fonction a valeur dans R2 × S1 × R, differentiable par rapport

Page 77: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation pratique de trajectoires generales 63

a t, et

z :=

(ξ1ξ2

)−R(ξ3 − f3)

(f1

f2

)ξ3 − f3

ξ4 − f4

(2.29)

avec R(α) ∈ R2×2 la matrice de rotation d’angle α. Alors,

z = A(z, f)(u1X1(f) + u2X2(f)− f +B(z)P (ξ, t) + u1C(z)

)(2.30)

avec

A(z, f) =

(R(z3)

(R(z3)

(f2

−f1

)0)

0 I2

), B(z) =

(R(−z3) 0

0 I2

), C(z) =

00z40

(2.31)

La preuve de ce lemme consiste simplement a effectuer le calcul de z a partir de (2.29).La variable z definie par (2.29) peut aussi s’ecrire

z =(gf−1

g

ξ4 − f4

)avec g = (ξ1, ξ2, ξ3), fg = (f1, f2, f3), et le produit de g avec f−1

g (l’inverse de fg) etant pris ausens du produit de groupe dans SE(2). Ce choix de z, en relation avec la symetrie du modelecinematique de la voiture, n’est evidemment pas le fruit du hasard (voir la deuxieme partie de cememoire).

Supposons maintenant que la fonction f dans (2.29) est une fonction transverse definie surTp, i.e. f ' f(α) avec α = (α1, . . . , αp). Alors, la relation (2.30) peut aussi s’ecrire

z = A(z, f(α)) (H(α)u+B(z)P (ξ, t) + u1C(z))

avec H(α) la matrice definie par (2.27), et u := (u1, u2,−α1, . . . ,−αp)′. En assimilant α1, . . . , αp

a des variables de commande, la relation precedente fait intervenir p nouvelles commandes. Pardefinition d’une fonction transverse, la matrice H(α) est de rang plein pour tout α. Commed’autre part la matrice A(z, f(α)) est toujours inversible, il n’est alors pas difficile de synthetiserdes commandes qui stabilisent asymptotiquement l’origine z = 0 du systeme (2.30).

Proposition 16 Soit f ∈ C∞(Tp; R2×(−π/2, π/2)×R) une fonction transverse, et u = (u1, u2,−α1, . . . ,−αp)′

la commande dynamique definie par

u := H†(α)(−B(z)P (ξ, t) + (A(z, f(α)))−1Z(z)

)(2.32)

avec H(α) la matrice definie par (2.27), H†(α) une inverse a droite de H(α), et Z(z) :=(−k1z1,−k2z2,−2k3 tan(z3/2),−k4z4)′ (k1, k2, k3, k4 > 0). Alors, pour tout P tel que |P (ξ, t)| ≤αP |(ξ1, ξ2)|+ βP ∀(ξ, t),

1. z = 0 est un point d’equilibre exponentiellement stable pour le systeme (2.30) controle. Lebassin d’attraction de ce point d’equilibre contient R2 × (−π, π) × (−δ, δ) avec δ > 0. Sip = 2, alors δ −→ +∞ lorsque k4 −→ +∞,

Page 78: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

64 Stabilisation de systemes critiques : une vue d’ensemble

2. le long de toute trajectoire du systeme (2.28) controle, ξ(t) converge vers l’ensemble f(Tp),3. f(Tp) est asymptotiquement stable pour le systeme (2.28) controle si α(0) = α∗(ξ(0)) avec

α∗ une application telle que

d(ξ0, f(Tp)) −→ 0 =⇒ d(ξ0, f(α∗(ξ0))) −→ 0 (2.33)

et d une distance sur R2 × S1 × R.

La preuve de ce resultat est donnee en Annexe A.1.5.Cette proposition indique comment stabiliser asymptotiquement l’ensemble f(Tp) associe a

une fonction transverse f . Pour obtenir un stabilisateur pratique de ξ0, au sens de la Definition14, il reste donc a determiner une famille de fonctions transverses fε, avec la propriete queD(ξ0, f ε(Tp)) −→ 0 lorsque ε −→ 0. Ceci est l’objet des resultats suivants. Notons auparavantque si l’on veut obtenir la stabilite asymptotique de l’ensemble f(Tp) (i.e. et pas seulement laconvergence des solutions vers cet ensemble), il est necessaire de determiner une application α∗

verifiant (2.33). L’application α∗ definie (de facon non unique a priori) par

α∗(ξ) ∈ arg minαd(ξ, f(α)) (2.34)

satisfait toujours cette condition. Malheureusement, en regle generale, cette application peutetre difficile a exprimer analytiquement. Nous verrons toutefois que pour certaines familles defonctions transverses, il est possible de determiner explicitement une application α∗ qui, a defautde verifier (2.34), satisfait la condition (2.33).

Une famille de fonctions transverses

Dans le cas de la voiture, le resultat suivant fournit une famille de fonctions transverses,“centrees” au point ξ0 = 0, i.e. telles que D(0, f ε(Tp)) −→ 0 lorsque ε −→ 0, obtenues parl’intermediaire du systeme chaıne de dimension quatre. On peut en deduire d’autres famillescentrees en un point ξ0 arbitraire.

Lemme 2 Etant donnee une fonction transverse f ∈ C∞(Tp; R4) pour le systeme chaıne dedimension quatre, la fonction f ∈ C∞(Tp; R2 × (−π/2, π/2)× R) definie par

f(α) =

f1(α)f4(α)

arctan(f3(α))f2(α) cos3 f3(α)

(2.35)

est une fonction transverse pour le modele cinematique (2.7) de la voiture.Pour tout ε > 0, et tout triplet (η1, η2, η3) tel que

η1, η2, η3 > 0 , et 6η2η3 > 8η3 + η1η2 (2.36)

la fonction fε ∈ C∞(T2; R4) definie par

fε(α) =

ε(sinα1 + η2 sinα2)

εη1 cosα1

ε2(η1 sin 2α1

4 − η3 cosα2)

ε3(η1

sin2 α1 cosα1

6− η2η3 sin 2α2

4− η3 sinα1 cosα2

) (2.37)

Page 79: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation pratique de trajectoires generales 65

est une fonction transverse pour le systeme chaıne de dimension quatre.

La preuve de ce lemme est donnee en Annexe A.1.4.Les fonctions donnees par (2.35)–(2.37) dependent de deux variables (elles sont definies sur

T2). Il est evident que ce nombre est minimal afin de satisfaire la condition de transversalite. Ilpeut cependant etre utile d’utiliser des fonctions dependant de plus de variables. Pour plus deprecisions sur ce point, nous renvoyons le lecteur a (Morin & Samson, 2004; Artus et al., 2004).

Dans le cas particulier des fonctions donnees par le Lemme 2, une application α∗ satisfaisantla condition (2.33) de la Proposition 16 est specifiee dans le resultat suivant.

Lemme 3 Lorsque f est definie par (2.35)–(2.37), une application α∗ satisfaisant (2.33) estdonnee par α∗(ξ) := α∗(ξ) avec

α∗(ξ) :=

(0, arctan2(ξ1/η2,−ξ3/εη3) si ξ2 ≥ εη1

(π, arctan2(ξ1/η2,−ξ3/εη3) si ξ2 ≤ −εη1

arg minα+,α−

‖ξ − f(α+(ξ))‖, ‖ξ − f(α−(ξ))‖ sinon(2.38)

ξ := (ξ1, ξ4/(cos3 ξ3), tan ξ3, ξ2)′ (2.39)

etα+(ξ) := (arccos ξ2

εη1, h(ξ, α+

1 (ξ))) α−(ξ) := (− arccos ξ2εη1, h(ξ, α−1 (ξ)))

h(ξ, α1) := arctan2(

ξ1−ε sin α1

η2,− ξ3− ε2

4η1 sin 2α1

εη3

) (2.40)

La preuve de ce resultat est donnee en Annexe A.1.6.

Remarque 3 L’application α∗ n’est pas definie de maniere unique pour tout ξ. Par exemple,lorsque ξ1 = ξ3 = 0 et |ξ4/ cos3 ξ3| ≥ εη1, toute valeur de α∗2 est un choix possible. Cependant,ces choix ne sont certainement pas equivalents vis-a-vis du comportement transitoire du systeme.Dans l’attente d’une etude complementaire, nous laissons ici ce point en suspend.

La fonction α∗ sert uniquement a determiner la valeur initiale de la variable exogene α, afin degarantir la stabilite de l’ensemble f(Tp). Sur le long terme, ce choix a peu d’incidence puisque laconvergence vers cet ensemble est assuree independamment de la valeur initiale de α.

Application au probleme de suivi d’un vehicule

Pour cette application, partons du modele cinematique (2.7). Comme illustre par la Figure2.1, nous considerons un repere virtuel lie rigidement au vehicule cible. L’objectif est de stabiliser(pratiquement) la configuration g = (x, y, θ) du vehicule a commander a la configuration gv =(xv, yv, θv) associee au repere virtuel. Cette derniere est donnee parxv

yv

θv

=

xr − d cos θr

yr − d sin θr

θr

Page 80: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

66 Stabilisation de systemes critiques : une vue d’ensemble

ou gr = (xr, yr, θr) designe la configuration du vehicule a suivre et d est la distance desiree desuivi, i.e. distance du point Pv au point Pr sur la Figure 2.1. On definit l’erreur de suivi par (cf.Section 1.3)

ξ :=(g−1v gζ

)

de sorte que

ξ = u1

cos ξ3sin ξ3ζ0

+ u2

0001

− ur1

1000

− θr

−ξ2ξ1 − d

10

(2.41)

Cette equation est de la forme (2.28) avec

P (ξ, t) = (−ur1 + θrξ2, θr(d− ξ1),−θr, 0)′ (2.42)

La Proposition 16 et le Lemme 1 permettent alors de calculer des lois de commande qui stabilisentasymptotiquement l’ensemble f(T2) ou f designe n’importe laquelle des fonctions transversesdonnees par (2.35). Notons que l’hypothese faite sur P dans la Proposition 16 est verifiee des lorsque la vitesse gr du vehicule de reference est bornee. Remarquons egalement que nous n’avonspas specifie θr dans (2.41). Le vehicule de reference peut aussi bien etre un vehicule de typeunicycle que de type voiture. L’approche s’applique egalement avec un vehicule de referenceomnidirectionnel, non-contraint par des liaisons non-holonomes. Il suffit simplement de modifierla fonction P en consequence.

Les resultats de simulation de la Figure 2.12 illustrent cette approche. Pour cette simulation,la valeur du deport est d = 3.5m. Le vehicule de reference choisi est aussi un vehicule de typevoiture, de meme geometrie que le vehicule controle (i.e. ` = 1.2m). Les vitesses pour ce vehiculede reference, dans les coordonnees du modele initial (2.6), sont les memes que celles utilisees pourla simulation de la Section 2.3.2 consacree a la stabilisation de trajectoires admissibles, i.e. ellessont donnees par (2.21). Alors que dans la Section 2.3.2 la trajectoire qu’il s’agissait de stabiliseretait toujours admissible, ce n’est plus le cas ici puisque d est non nul. Pour le repere virtuelque l’on cherche a stabiliser pratiquement, ces vitesses correspondent a une configuration fixelorsque t ∈ [0, 20), a un mouvement admissible rectiligne en marche avant lorsque t ∈ [20, 30), aun mouvement admissible rectiligne en marche arriere lorsque t ∈ [30, 40), et a des deplacementsnon-admissibles lorsque t ∈ [40, 40.4) et t ∈ [40.4, 80].

La loi de commande donnee dans la Proposition 16 est appliquee avec k1 = k2 = k3 = k4 = 0.3.La fonction transverse f du Lemme 1 est utilisee avec ε = 0.6 et (η1, η2, η3) = (3, 1.7, 4) commeparametres de f dans (2.37). Les conditions initiales sont les suivantes. La configuration de lavoiture a t = 0 est (x, y, θ, ζ)(0) = (0, 3, 0, 0). La configuration du vehicule de reference a t = 0est (xr, yr, θr, ζr)(0) = (3.5, 0, 0, 0). Ceci correspond a une posture initiale pour le repere virtueldonnee par (xv, yv, θv)(0) = (0, 0, 0). La valeur initiale de α est α(0) = (0, 0).

Page 81: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation pratique de trajectoires generales 67

−2 0 2 4 6 8 10 12 14−2

−1

0

1

2

3

4

5

6

7

8

x

y

Trajectoire de la voiture: − Trajectoire du repère virtuel : −−

0 10 20 30 40 50 60 70 80−2

−1

0

1

2

3

4

t

(ξ 1

,ξ2,ξ

3)

ξ1: − ξ2: −− ξ3: −.

0 10 20 30 40 50 60 70 80−8

−6

−4

−2

0

2

4

6

8

t

v v1: − v2: −−

Fig. 2.12 – Stabilisation de trajectoires generales : approche par fonctions transverses

Les trajectoires dans le plan cartesien du vehicule commande, et du repere virtuel devant etrestabilise, sont representees sur la figure du haut. L’evolution des trois premieres composantes duvecteur d’erreur ξ (erreurs en position et orientation) en fonction du temps est montree en bas agauche. Puisque la fonction transverse consideree ne s’annule jamais, ces composantes ne tendentevidemment pas vers zero. Cependant, apres une phase initiale correspondant a la convergencede la variable z vers zero, chacune d’entre elle est bornee par une valeur independante de latrajectoire de reference. Cette valeur depend par contre des parametres de la fonction transverseutilisee, et il est de ce fait possible de l’ajuster en modifiant le parametre ε. Enfin, l’evolution desentrees de commande en fonction du temps est representee en bas a droite.

2.4.3 Elements de comparaison avec les approches classiques

Quels sont les traits les plus caracteristiques de l’approche de commande par fonctions trans-verses ? Quels en sont les avantages et inconvenients ?

• L’aspect le plus caracteristique est de pouvoir garantir la stabilisation pratique de toute

Page 82: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

68 Stabilisation de systemes critiques : une vue d’ensemble

trajectoire dans l’espace d’etat, admissible ou non. D’un point de vue pratique, ceci presenteun interet evident lorsque la trajectoire a stabiliser n’est pas connue a l’avance.

• Une propriete complementaire importante est que la norme de l’erreur de suivi est bornee(apres une phase transitoire) par une valeur independante des trajectoires de reference. Enoutre, cette valeur peut etre reduite simplement, a partir des parametres de commande. Plusprecisement, puisque le champ Z(z) dans (2.32) est choisi asymptotiquement stable, apresun transitoire correspondant a la convergence de z(t) vers zero, l’etat ξ est arbitrairementproche de l’ensemble image f(Tp), dont on peut determiner des bornes. Par exemple, pourles fonctions transverses du Lemme 2, il est facile de determiner les valeurs maximales def dans les quatre directions de l’espace d’etat. De plus, le parametre ε indique directementdans quelle proportions ces erreurs maximales vont decroıtre vers zero lorsque ε lui-memetend vers zero.

• Cette approche permet aussi d’obtenir une stabilisation exponentielle des ensembles f(Tp),avec des retours d’etat reguliers. En particulier, pour la stabilisation de points fixes, ceci per-met d’eviter le dilemme convergence exponentielle/robustesse que nous avons evoque dansla Section 2.2, puisque l’on assure une convergence exponentielle des trajectoires vers l’en-semble f(Tp) egalement en presence de dynamiques non-modelisees (petite evidemment).Bien sur, plus la “taille” de la fonction transverse sera petite (i.e., le parametre ε), moins lamarge de robustesse sera importante. Malgre cela, contrairement au cas des retours d’etatdestines a stabiliser asymptotiquement un point fixe, de petites erreurs de modele n’in-duisent pas d’oscillations entretenues sur un cycle limite : l’etat converge vers un point (apriori arbitraire) de l’ensemble f(Tp).

• Les proprietes precedentes ont cependant un cout. Le premier reside dans une certainecomplexite de la commande. En effet, l’approche est basee sur une extension dynamiquedu systeme de depart ; la dimension de cette extension dynamique etant au moins egale an−m. D’une part, cette extension necessite des calculs au moment de l’implementation dela loi commande. D’autre part, le calcul des fonctions transverses lui-meme peut devenirassez complexe lorsque n − m est grand. En particulier, verifier qu’une fonction est bientransverse peut etre difficile dans ce cas.

• Enfin, une derniere difficulte porte sur le choix des parametres de commande et le reglage ducomportement sur la zero dynamique. En effet, “apres” la convergence a zero de la variablez, la dynamique de ξ va entierement dependre de celle des variables α. En particulier, desvariations periodiques rapides de ces variables se traduisent par des comportements oscilla-toires de l’etat du systeme avec la meme frequence. En pratique, de telles oscillations avecune frequence elevee sont rarement souhaitables. Notons que dans certains cas, ces oscilla-tions sont inevitables (par exemple, pour un vehicule de type voiture, lorsque l’on souhaitese deplacer dans la direction de l’essieu des roues arrieres). Dans d’autres situations, detelles oscillations ne sont toutefois pas mecaniquement necessaires. Pour certaines trajec-toires de reference, on peut montrer que les variables α tendent vers des valeurs constantes(c’est par exemple le cas lorsque la trajectoire est reduite a un point fixe). Dans ce cas, le re-gime permanent n’est pas oscillant. Pour des trajectoires non-stationnaires, cette proprieten’est plus necessairement verifiee. Le choix des parametres de commande est determinantvis-a-vis de cet aspect. Les fonctions transverses du Lemme 1 permettent, par le choix desparametres η1, η2, et η3, une assez grande souplesse dans le reglage de ce regime permanent.Les valeurs utilisees pour les simulations permettent de limiter les oscillations non-desirees,

Page 83: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation pratique de trajectoires generales 69

mais ne permettent pas de les empecher totalement (comme on peut le voir sur les pas-sages marche-avant/marche-arriere de la Figure 2.12). Cet aspect, tres lie a l’impossibilitede stabiliser asymptotiquement toutes les trajectoires d’un systeme, fait que pour certainestrajectoires admissibles, le comportement du systeme est certainement moins satisfaisantque celui obtenu avec d’autres lois de commande qui ne stabilisent asymptotiquement quecertaines trajectoires (voir Figure 2.13 ci-dessous). On se trouve ici face a un compromis quisemble inevitable. Neanmoins, il reste de nombreuses possibilites pour ameliorer le reglagede ce regime permanent avec l’approche par fonctions transverses. L’une d’elle consiste parexemple a faire dependre ces fonctions de variables supplementaires, afin de disposer ainside parametres supplementaires de reglage. Nous avons deja obtenu certains resultats dansce sens (voir (Morin & Samson, 2004; Artus et al., 2004) pour plus de details), mais il resteencore beaucoup a faire sur ce point afin d’obtenir les meilleures caracteristiques possiblesen terme de regime permanent.

Nous terminons cette section par des resultats de simulation qui illustrent certains des pointsevoques ci-dessus. Les resultats de la Figure 2.13 ont ete obtenus avec le retour d’etat non-lineaire(2.22) destine a stabiliser asymptotiquement des trajectoires de reference admissibles. La trajec-toire a stabiliser est la meme que celle consideree pour l’approche par fonctions transverses, Figure2.12. Les gains de commande utilises pour cette simulation sont (k1, k2, k3, k4) = (1, 0.2, 8, 3).

−2 0 2 4 6 8 10 12 14−2

−1

0

1

2

3

4

5

6

7

8

x

y

Trajectoire de la voiture: − Trajectoire du repère virtuel : −.

0 10 20 30 40 50 60 70 80−1

−0.5

0

0.5

1

1.5

2

2.5

3

3.5

t

(ξ 1

,ξ2,ξ

3)

ξ1: − ξ2: −− ξ3: −.

0 10 20 30 40 50 60 70 80−5

−4

−3

−2

−1

0

1

2

3

t

v

v1: − v2: −−

Fig. 2.13 – Stabilisation de trajectoires generales : commande “classique” (2.22)

Page 84: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

70 Stabilisation de systemes critiques : une vue d’ensemble

La simulation confirme ce qu’on peut attendre de ce type de commande : immobilite duvehicule commande lorsque la reference est elle-meme immobile (t ∈ [0, 20)s), convergence del’erreur de suivi vers zero lorsque la trajectoire a stabiliser est admissible et non-stationnaire(t ∈ [20, 40)s), erreur de suivi qui peut devenir importante lorsque la trajectoire a stabiliser n’estplus admissible (t ∈ [40, 80)s).

Les resultats de la Figure 2.14 illustrent certaines proprietes de robustesse obtenues avecl’approche par fonctions transverses. La trajectoire de reference est ici reduite a un point fixe. Lacommande de la Proposition 16 est appliquee avec k1 = k2 = k3 = k4 = 0.1. La fonction transversef du Lemme 1 est utilisee avec comme parametres de f dans (2.37) ε = 0.2 et (η1, η2, η3) =(3, 1.7, 4) (par rapport a la simulation de la Figure 2.12, nous avons seulement reduit la valeur deε pour obtenir un meilleur positionnement asymptotique). La configuration initiale de la voiture at = 0 est (x, y, θ, ζ)(0) = (0, 1, 0, 0). La valeur initiale de α est α(0) = (0, 0). Pour cette simulationle modele “perturbe” (2.9) a ete utilise et un bruit de mesure a aussi ete introduit (voir Section2.2.2 pour un rappel des valeurs utilisees). Enfin, la commande est echantillonnee a T = 40ms,avec un retard sur la commande d’une periode d’echantillonnage.

−1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1−0.5

0

0.5

1

1.5

x

y

0 10 20 30 40 50 60 70 80−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

1.2

t

(ξ 1

,ξ2,ξ

3)

ξ1: − ξ2: −− ξ3: −.

0 10 20 30 40 50 60 70 80−4

−3

−2

−1

0

1

2

3

4

t

u

u1: − u2: −−

Fig. 2.14 – Stabilisation pratique de point fixe par fonction transverse ; erreur de modele + bruitde mesure + echantillonnage de la commande + retard de commande

Page 85: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation pratique de trajectoires generales 71

Malgre ces erreurs de modele, la stabilisation asymptotique vers l’ensemble f(T2) est assuree(aux bruits de mesure pres), avec une configuration asymptotique sans oscillations residuelles.Les manœuvres initiales sont dues au fait que le systeme est tres contraint dans ses mouvements(la marge de manœuvre en x est de l’ordre de ±0.5m). L’utilisation de fonctions transversesdependant de plus de variables, ainsi que le choix des gains de commande, permettent de limiterle nombre de ces manœuvres tout en assurant une precision asymptotique equivalente (voir (Artuset al., 2004) pour plus de details).

Page 86: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis
Page 87: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Deuxieme partie

Structures et application a lasynthese de commandes

73

Page 88: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Chapitre 3

Structures et proprietes locales dessystemes de commande

Soit un systeme de commande “generique”

(S) : x = X0(x) +m∑

i=1

uiXi(x)

avec x ∈M , ou M est une variete C∞ de dimension n, et u := (u1, . . . , um) ∈ Rm. Sauf mentioncontraire, on supposera que les champs de vecteurs Xi sont C∞. L’objet de ce chapitre est de rap-peler quelques proprietes generales des systemes de commande du type (S). La premiere sectionporte sur les developpements en serie de leurs solutions. La deuxieme section porte sur les proprie-tes d’approximation homogene de ces systemes, en relation avec les proprietes de commandabilite,et sur la structure de groupe sous-jacente aux approximations nilpotentes.

Il existe plusieurs articles de synthese qui traitent en detail des proprietes que nous allonsrappeler, et contiennent de nombreux resultats complementaires. En particulier, notre presenta-tion est en grande partie basee sur (Sussmann, 1983), (Hermes, 1991), et (Kawski, 1998). Notreobjectif ici est plus modeste. Il s’agit avant tout de rappeler certaines proprietes des systemes decommande non-lineaires qui nous semblent les plus importantes afin de pouvoir aborder, dansun cadre relativement general, les problematiques et methodes de synthese de retours d’etatstabilisants.

Pour terminer cette introduction, notons que dans un certain nombre de cas, nous avonssacrifie la generalite des resultats presentes a la simplicite de l’expose. Ce parti pris est aussidestine a rendre cet expose le plus accessible possible, sachant que les resultats les plus generauxfont parfois appel a un formalisme mathematique complexe.

3.1 Series de Chen-Fliess et exponentielles de series de Lie

En posant u0 := 1, le systeme (S) peut s’ecrire

(S) : x =m∑

i=0

uiXi (3.1)

Page 89: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Series de Chen-Fliess et exponentielles de series de Lie 75

Etant donnee une entree de commande u, la serie de Chen-Fliess (Chen, 1957; Fliess, 1981)associee au systeme (S) fournit un developpement en serie des solutions de ce systeme differentiel.

Definition 16 Soit t ≥ 0 et u ∈ C0m([0, t]; Rm). On appelle serie de Chen-Fliess du systeme

(S) en (t, u) la serie formelle :

CF (t, u) =∑

I

(∫ t

0uI dτI

)XI (3.2)

avec I parcourant l’ensemble des multi-index (i1, . . . , is) : s ∈ N; i1, . . . is ∈ 0, . . . ,m. Lesintegrales ci-dessus sont definies par ∫ t

0u∅ dτ∅ = 1

et, pour tout I = (i1, . . . , is) avec s ∈ N∗,∫ t

0uI dτI =

∫ t

0

∫ τs

0

∫ τs−1

0

∫ τ2

0uis(τs)uis−1(τs−1) · · ·ui2(τ2)ui1(τ1)dτ1 dτ2 · · · dτs

Les XI sont les operateurs differentiels sur C∞(M) definis recursivement sur la longueur de Ipar

X∅(ϕ) = ϕ, X(i1,...,is)(ϕ) = Xi1(X(i2,...,is)(ϕ))

On definit a partir de (3.2) la serie tronquee a l’ordre N qui, contrairement a (3.2), est toujoursbien definie comme operateur differentiel sur C∞(M) :

CFN (t, u) =∑|I|≤N

(∫ t

0uI dτI

)XI (3.3)

Etant donne une entree de commande, la serie de Chen-Fliess permet d’obtenir une approxima-tion des solutions du systeme (S) associe. Plus precisement, on a le resultat suivant (voir e.g.(Sussmann, 1983, Sec. 4) pour une preuve).

Theoreme 12 Soit K un compact de M et A > 0. On note ABm := x ∈ Rm : ‖x‖ ≤ A. Alors,il existe τ(K,A) > 0 tel que

1. ∀x0 ∈ K, ∀u ∈ C0m([0, τ(K,A)];ABm), la solution x(t, x0, u) de (S) est definie sur [0, τ(K,A)].

2. ∀ϕ ∈ C∞(M), ∀N ∈ N, il existe une constante D qui depend de ϕ,A,K,N mais pas de utelle que : ∀x0 ∈ K, ∀u ∈ C0

m([0, τ(K,A)];ABm), ∀t ∈ [0, τ(K,A)],

|ϕ(x(t, x0, u))− CFN (t, u)(ϕ)(x0)| ≤ DtN+1

Dans le cadre analytique, la serie de Chen-Fliess est convergente (voir egalement e.g. (Sussmann,1983, Sec. 4) pour une preuve).

Theoreme 13 On suppose que M et les champs de vecteurs X0, . . . , Xm sont Cω. Soit K uncompact de M et A > 0. Soit ϕ ∈ Cω(M). Alors, il existe τ(ϕ,K,A) > 0 tel que : ∀x0 ∈ K,∀u ∈ C0

m([0, τ(K,A)];ABm),

Page 90: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

76 Structures et proprietes locales des systemes de commande

1. la solution x(t, x0, u) de (S) est definie sur [0, τ(K,A)].

2. la serie CF (t, u)(ϕ)(x0) converge vers ϕ(x(t, x0, u)), uniformement pour t ≤ τ(ϕ,K,A),x0 ∈ K, et u ∈ C0

m([0, τ(K,A)];ABm).

Remarque 4 Dans le cas particulier d’une equation differentielle autonome x = X(x) sur unevariete M , avec X et M de classe Cω, on retrouve la propriete bien connue (voir e.g. (Helgason,1978, Pg. 37)) que pour pour toute fonction ϕ ∈ Cω(M) et pour t suffisamment petit,

ϕ(exp(tX)(x0)) = etX(ϕ)(x0) (3.4)

avec exp(tX)(x0) la valeur en t de la solution x(.) de l’equation differentielle avec x(0) = x0, et

eA :=∞∑

k=0

Ak

k!

Une propriete essentielle des series de Chen-Fliess est liee a la notion de serie de Lie (Chen, 1957).

Definition 17 Une serieS =

∑|I|>0

aIXI

est une serie de Lie si pour tout k ∈ N∗,∑0<|I|≤k

aIXI ∈ Lk(X0, . . . , Xm)

La relation d’appartenance precedente doit etre comprise en assimilant les XI et les elements deLk(X0, . . . , Xm) a des operateurs differentiels sur C∞(M).

A partir de cette definition, on a le resultat suivant (voir encore (Sussmann, 1983, Sec. 3)pour une preuve).

Theoreme 14 (Chen, 1957) La serie de Chen-Fliess (3.2) est l’exponentielle d’une serie de Lie,i.e. pour tout (t, u) il existe une serie de Lie S(t, u) telle que

CF (t, u) = eS(t,u) =∞∑

k=0

1k!

(S(t, u))k (3.5)

Lorsque u est une fonction constante, le champ de vecteur associe au systeme (S) est autonome.Dans ce cas, (3.5) est verifiee avec

S := t

m∑i=0

uiXi

et l’on retrouve bien la relation (3.4). Lorsque u n’est pas constante, la demonstration repose prin-cipalement sur la formule de Campbell-Hausdorff (ou de Baker-Campbell-Hausdorff-Dynkin)dont nous rappelons ici un enonce (voir e.g. (Varadarajan, 1983, Ch.2) ou (Jacobson, 1962, Ch.5)pour un expose plus detaille).

Page 91: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Series de Chen-Fliess et exponentielles de series de Lie 77

Theoreme 15 Soient X et Y deux series de Lie. Alors, il existe une serie de Lie C(X,Y ) telleque

eXeY = eC(X,Y )

De plus, C(X,Y ) =∑

k≥1Ck(X,Y ) avec Ck(X,Y ) ∈ Lk(X,Y ) donne par

Ck(X,Y ) =1k

∑0<m≤n

(−1)m−1

m

∑p1 + q1 + . . .+ pm + qm = kpi + qi > 0 (i = 1, . . . ,m)

ψ(Xp1Y q1 · · ·XpmY qm)p1!q1! · · · pm!qm!

avec ψ definie recursivement, pour tout Z1, . . . , Zq ∈ X,Y , par ψ(Z1) = Z1 et

ψ(Z1 · · ·Zq) = [Z1, [Z2, · · · , [Zq−1, Zq] · · · ]]

Bien qu’elle soit completement explicite, l’expression precedente de chacun des termes Ck(X,Y )devient vite lourde a calculer lorsque k devient grand. A toute fin utile, nous donnons ci-dessousles expressions des premiers termes.

C1(X,Y ) = X + Y C2(X,Y ) = 12 [X,Y ]

C3(X,Y ) = 112

([X, [X,Y ]] + [Y, [Y,X]]

)C4(X,Y ) = − 1

48 ([Y, [X, [X,Y ]]] + [X, [Y, [X,Y ]]])

Comme cela est explique dans (Sussmann, 1986), il n’est pas difficile d’obtenir une expressionpour S(t, u) definie par (3.5). Par contre on ne connaıt pas a l’heure actuelle de formule algebriquedonnant la decomposition de S(t, u) dans une base de L(X0, . . . , Xm) (Kawski, 2003). En contre-partie, il existe une formule elegante exprimant CF (t, u) comme un produit d’exponentielles surune base de L(X0, . . . , Xm) (Sussmann, 1986). Avant de donner cette formule, rappelons unedefinitions (voir (Sussmann, 1986) pour plus de details).

Definition 18 Etant donne des “indeterminees” Z0, . . . , Zm, une base de Hall B de l’algebrede Lie libre L(Z0, . . . , Zm) est un ensemble totalement ordonne de crochets formels en Z0, . . . , Zm

tel que

1. Zi ∈ B pour tout i = 0, . . . ,m,

2. si B1, B2 ∈ B et B1 ≤ B2, alors `(B1) ≤ `(B2), avec `(B) la longueur du crochet B,

3. si B ∈ B et `(B) ≥ 2 de sorte que B = [B1, B2]. Alors, B ∈ B si et seulement si :i) B1, B2 ∈ B,ii) B1 < B2,iii) `(B2) = 1 ou bien B2 = [B2,1, B2,2] avec B2,1 ≤ B1.

A partir de cette definition, on peut enoncer le resultat suivant.

Theoreme 16 (Sussmann, 1986) Soient Z0, . . . , Zm des indeterminees et B = B1, . . . , Bp, . . .une base de Hall de L(Z0, . . . , Zm). On note, pour tout B ∈ B, B(X) l’evaluation de l’elementB ∈ B en X0, . . . , Xm (obtenue en substituant dans le crochet formel chaque Xi a Zi). Alors,

CF (t, u) =←∏

B∈BeCB(u)(t) B(X)

Page 92: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

78 Structures et proprietes locales des systemes de commande

avec

CB(u)(t) =∫ t

0cB(u)(s) ds

et

cB(u) =ui si B = Zi1p!(CB1(u))

pcB2(u) si B = adpB1(B2)

avec p le plus grand entier pour lequel la decomposition B = adpB1(B2) est possible.

La notation←∏

signifie que le produit est pris de la droite vers la gauche, i.e.

←∏B∈B1,...,Bp,...

α(B) = · · ·α(Bp) · · ·α(B1)

Notons que les CB verifient les relationsCB = ui si B ∈ Z0, . . . , ZmCB = 1

p!(CB1)pCB2 si B = adpB1(B2) (p > 0 maximal)

(3.6)

Le systeme (3.6) est appele systeme libre (Kawski, 1992). On verifie facilement que ce systemepeut s’ecrire

C =m∑

i=0

uiYi(C) (3.7)

avec C := (CB1 , . . . , CBp , . . .). Le vecteur C est de “dimension” infinie. Soit k un entier positif.En notant Bk := B1, . . . , Bn(k) le sous ensemble de B correspondant aux crochets de longueurau plus k, et Ck := (Ck

1 , . . . , Ckn(k)) := (CB1 , . . . , CBn(k)

), on deduit de (3.7) le systeme suivant

sur Rn(k) :

Ck =m∑

i=0

uiYki (Ck) (3.8)

Le systeme (3.8) est le systeme libre de rang k et n(k) = dim Lk(Z0, . . . , Zm). Lk(Z0, . . . , Zm)est aussi appelee algebre de Lie libre de rang k associee a Z0, . . . , Zm.

Theoreme 17 (Kawski, 1992) Pour tout k ∈ N∗, les champs de vecteurs Y k0 , . . . , Y

km sur Rn(k)

verifient les proprietes suivantes :i) Chaque champ Y k

i est polynomial dans le systeme de coordonnees Ck.ii) Pour tout B ∈ Bk, l’evaluation B(Y k) du crochet formel B en Y k

0 , . . . , Ykm verifie l’egalite

B(Y k)(0) =∂

∂CB

de sorte que L(Y k0 , . . . , Y

km)(0) = Rn(k).

iii) Chaque Y ki est ∆r-homogene de degre −1 avec r definie par ri := `(Bi) ∀i = 1, . . . , n(k).

Par consequent L(Y k0 , . . . , Y

km) est nilpotente avec (Lk+1 \ Lk)(Y k

0 , . . . , Ykm) = ∅

Page 93: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Approximations homogenes et structure de groupe 79

La notion d’homogeneite evoquee ci-dessus va etre definie dans la section suivante.Notons que malgre la propriete ii), le systeme (3.8) n’est jamais commandable sur Rn(k)

puisqu’il contient, entre autre, l’equation CZ0 = u0 = 1. Si u0 n’est pas contrainte par l’egaliteu0 = 1, ce qui revient a assimiler le systeme (3.8) a un systeme sans derive, alors ce systeme estglobalement commandable sur Rn(k).

3.2 Approximations homogenes et structure de groupe

Nous rappelons dans cette section les proprietes d’approximation de systemes non-lineaires pardes systemes dont les champs de vecteurs sont homogenes par rapport a une dilatation, ainsi que lastructure de groupe sous-jacente aux approximations homogenes nilpotentes. Les approximationshomogenes jouent un role essentiel dans les etudes de commandabilite des systemes non-lineaires(Stefani, 1985; Sussmann, 1987; Kawski, 1990; Hermes, 1991). Pour les systemes critiques, ellesjouent un role analogue a celui des approximations lineaires pour des systemes dont le lineariseest commandable. De ce fait, comme nous le verrons plus en detail dans le prochain chapitre, iln’est pas etonnant qu’elles soient aussi le support de methodes de synthese de retours d’etat. Lastructure de groupe sous-jacente aux approximations nilpotentes joue aussi un role important dansles etudes de commandabilite, en particulier en ce qui concerne l’approche basee sur le formalismealgebrique (Sussmann, 1983; Sussmann, 1987). La aussi, nous verrons dans le prochain chapitreque cette structure peut etre mise a profit pour des problemes de stabilisation. Independammentdes etudes de commandabilite, l’importance de la structure de groupe avait ete mise en avantdans l’etude de problemes lies aux E.D.P. (Rothschild & Stein, 1976; Folland, 1977).

Les definitions d’homogeneite que nous rappelons ci-dessous presupposent un systeme decoordonnees sur Rn . Il est possible de donner des definitions intrinseques (Kawski, 1995) maisce niveau de generalite ne sera pas utilise dans ce memoire.

Definition 19 On appelle vecteur de poids sur Rn, tout vecteur r = (r1, . . . , rn) ∈ Rn avecri > 0 pour tout i. Etant donne un vecteur de poids r et un scalaire λ ∈ R+, on appelle dilatationl’application lineaire ∆r

λ sur Rn definie par

∀x ∈ Rn, ∆rλx = (λr1x1, . . . , λ

rnxn)

Par abus de langage, on appelle egalement dilatation la famille (∆rλ)λ>0. Etant donne un vecteur

de poids sur Rn, f ∈ C0(Rn) est dite fonction homogene de degre d par rapport a la dilatation(∆r

λ)λ>0, ou plus simplement “fonction ∆r-homogene de degre d” si,

∀λ > 0, ∀x ∈ Rn, f(∆rλx) = λdf(x) (3.9)

On appelle norme ∆r-homogene toute fonction ρ, ∆r-homogene de degre 1, positive, et telleque ρ(x) = 0 si et seulement si x = 0. Enfin, Y =

∑i Yi∂/∂xi ∈ X (Rn) est dit champ de

vecteurs homogene de degre τ par rapport a la dilatation (∆rλ)λ>0, ou plus simplement “champ

∆r-homogene de degre τ” si, pour tout i = 1, . . . , n, la fonction Yi est homogene de degre τ + ri.

Les notions de fonction homogene et de champ de vecteurs homogene sont aussi utiliseeslorsque ces objets dependent en plus de la variable temporelle. Dans ce cas, il suffit de remplacerl’egalite f(∆r

λx) = λdf(x) dans (3.9) par f(∆rλx, t) = λdf(x, t), ce qui revient a associer un poids

rn+1 = 0 a la variable t. Il est egalement utile de garder en memoire les proprietes suivantes,facilement verifiables.

Page 94: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

80 Structures et proprietes locales des systemes de commande

Proposition 17 Soient f1, f2 ∈ C∞(Rn) des fonctions ∆r-homogenes de degre d1, d2 respective-ment, et X1, X2 ∈ C∞(Rn; Rn) des champs ∆r-homogenes de degre τ1, τ2 respectivement. Alors,

1. les fonctions fi et les champs Xi sont polynomiaux,

2. f1f2 est ∆r-homogene de degre d1 + d2,

3. [X1, X2] est ∆r-homogene de degre τ1 + τ2,

4. X1(f1) est ∆r-homogene de degre d1 + τ1.

La notion suivante joue un role crucial dans l’etude des proprietes de commandabilite des systemesnon-lineaires.

Definition 20 Un systeme de commande C∞ sur Rn

(Sh) : y = Y0(y) +m∑

i=1

uiYi(x) (3.10)

est une approximation homogene en x0 du systeme (S) s’il existei) un vecteur de poids r,ii) des scalaires `0, . . . , `m ≥ 0,iii) un diffeomorphisme local ψ ∈ C∞(U ⊂ M ; Rn) defini sur un ouvert U 3 x0 et tel queψ(x0) = 0,

iv) des champs de vecteurs R1, . . . , Rm ∈ X (ψ(U))tels que, pour tout i = 0, . . . ,m,

1. Yi est ∆r-homogene de degre −`i,2. ψ∗Xi = Yi +Ri avec (ψ∗Xi)(ψ(x)) := dψ(x)Xi(x)

3. ∀y ∈ ψ(U), ‖λ`i∆r1/λRi(∆r

λy)‖ −→ 0 lorsque 0 6= λ −→ 0.

Remarque 5 Notons que d’apres la Proposition 17, les champs de vecteurs Y0, . . . , Ym d’uneapproximation homogene (Sh) sont necessairement polynomiaux. De plus, si `i > 0 pour touti = 0, . . . ,m, l’algebre de Lie L(Y0, . . . , Ym) est nilpotente. Par ailleurs, on utilisera parfois ladefinition precedente pour parler d’approximation homogene d’une famille de champs de vecteursX0, . . . , Xm, sachant que la definition precedente ne depend pas d’un systeme de commande.

En terme de commandabilite, il est possible de deduire de certaines proprietes d’une approxi-mation homogene (Sh), des proprietes analogues pour le systeme de depart (S). C’est l’objet duresultat suivant dont une preuve est donnee dans (Stefani, 1985), et aussi contenue implicitementdans (Sussmann, 1987).

Theoreme 18 Soit x0 un point d’equilibre du systeme (S). On suppose que L(X0, . . . , Xm)(x0) =Mx0 et que (S) possede en x0 une approximation homogene (Sh) commandable en temps petit eny = 0, et telle que `0 ∈ [0, 1] et `i ≥ `0 pour tout i = 1, . . . ,m. Alors, (S) est commandable entemps petit en x = x0.

On pourrait esperer que la reciproque de ce resultat soit vraie. Ce n’est malheureusement pasle cas : un systeme sur R4, polynomial et commandable en temps petit a l’origine, est donnedans (Kawski, 1988), pour lequel on montre facilement qu’aucune approximation homogene n’est

Page 95: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Approximations homogenes et structure de groupe 81

commandable. Cependant, cette reciproque est vraie pour de nombreux systemes. Afin de preciserce point, rappelons la condition suffisante de commandabilite en temps petit de (Sussmann, 1987,Th. 7.3) (voir Section 1.1 de la premiere partie de ce memoire pour la notation S(θ)).

Theoreme 19 Soit x0 un point d’equilibre du systeme (S). On suppose que L(X0, . . . , Xm)(x0) =Mx0 et que la condition S(θ) est aussi verifiee en ce point pour un certain θ ∈ [0, 1]. Alors (S)est commandable en temps petit en x0.

En terme de reciproque partielle du Theoreme 18, on a alors le resultat suivant (Bianchini &Stefani, 1986; Sussmann, 1987).

Theoreme 20 On suppose que les hypotheses du Theoreme 19 ci-dessus sont satisfaites. Alors,il existe une approximation homogene (Sh) de (S), commandable en temps petit en y = 0, et telleque `0 = θ et `i = 1 pour tout i = 1, . . . ,m.

Remarque 6 Il est montre dans (Sussmann, 1987) que si un systeme satisfait S(0) alors, ilsatisfait egalement S(θ) pour un certain θ > 0. Cela implique (voir Remarque 5 ci-dessus) quesi les hypotheses du Theoreme 19 sont satisfaites, il existe une approximation homogene (Sh) de(S), commandable en temps petit et nilpotente. Par ailleurs, pour les systemes sans derive telsque L(X1, . . . , Xm)(x0) = Mx0, la reciproque du Theoreme 18 est vraie avec `i = 1 pour touti = 1, . . . ,m.

La preuve du Theoreme 20 donnee dans (Bianchini & Stefani, 1986) (voir egalement (Hermes,1991)) est constructive. Elle s’appuie sur la selection d’une famille X1, . . . , Xn d’elements deL(X0, . . . , Xm) tels que spanX1(x0), . . . , Xn(x0) = Mx0 . L’algorithme permettant d’obtenirune telle approximation est rappele en Annexe A.2.1.

Exemple : Par application des resultats precedents, tous les exemples de systemes mecaniquessous-actionnes et non-holonomes sous-actionnes du Chapitre 1 (1ere partie) doivent posseder uneapproximation homogene commandable en temps petit avec `0 = θ = 1 et `i = 1 (i > 0).Considerons l’exemple du satellite sous-actionne, Eq. (1.46), avec na = 2, F 1 = (1, 0, 0)′, etF 2 = (0, 1, 0)′ (ce choix garantit bien la commandabilite en temps petit). On peut en effet verifierque dans les coordonnees y = ψ(α, ω) := (α, ω), les champs Y0, Y1, Y2 definis par

Y0(y) =12(y4, y5, y6 + y1y5 − y2y4, 0, 0, cy4y5)′ , Y1(y) = e4, Y2(y) = e5

avec c une constante non nulle et ei le i-eme vecteur unitaire de R6, fournissent bien une telleapproximation homogene avec comme vecteur de poids r = (2, 2, 4, 1, 1, 3). En fait ces champsdefinissent une approximation homogene commandable pour tout `0 = θ ∈ [0, 1], avec commevecteur de poids associe rθ = (1 + θ, 1 + θ, 2(1 + θ), 1, 1, 2 + θ).

Les resultats precedents montrent que de nombreux systemes non-lineaires commandables entemps petit possedent une approximation homogene nilpotente qui est egalement commandableen temps petit. La nilpotence de l’algebre de Lie associee a cette approximation implique quecette algebre de Lie est de dimension finie sur R et donc qu’il existe un groupe de Lie associea cette algebre de Lie. Il en decoule la possibilite de construire une extension dynamique del’approximation homogene nilpotente, dont les champs de vecteurs sont invariants a gauche par

Page 96: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

82 Structures et proprietes locales des systemes de commande

rapport a une operation de groupe. Ce resultat a ete montre par (Folland, 1977) dans le cadre deproblemes lies aux E.D.P. Un resultat analogue est montre dans (Rothschild & Stein, 1976) avecune demarche differente : une extension de champs de vecteurs (non necessairement homogenes)est d’abord realisee, et il est ensuite montre que ces champs peuvent etre approximes par deschamps homogenes et invariants par rapport a une operation de groupe. Nous rappelons ci-dessous ces resultats qualifies, dans la litterature anglo-saxonne, de “Lifting Theorems”.

Theoreme 21 (Rothschild & Stein, 1976, Th. 4 et 5) Soient X1, . . . , Xm des champs de vecteursC∞ sur une variete M de dimension n. On suppose que Lk(X1, . . . , Xm)(x0) = Mx0, et l’onnote n(k) la dimension de l’algebre de Lie libre de rang k engendree par m indeterminees (voirsection precedente). Alors, il existe un voisinage U de (x0, 0) ∈ M × Rn(k)−n et des fonctionsηi,j ∈ C∞(U ; R) tels que l’extension X1, . . . , Xm des champs X1, . . . , Xm, definie par

∀i = 1, . . . ,m, ∀(x, z) ∈ U , Xi = Xi +n(k)∑

j=n+1

ηi,j(x, z)∂/∂zj

verifie les proprietes suivantes :i) dim Lk(X1, . . . , Xm)((x0, 0)) = n(k).ii) la famille X1, . . . , Xm possede une approximation homogene Y1, . . . , Ym avec tous les

champs Yi homogene de degre −1 par rapport a une meme dilatation ; de plus les Yi sontinvariants a gauche par rapport a une meme operation de groupe sur Rn(k).

Remarquons que les champs Y1, . . . , Ym correspondent, a un changement de coordonnees pres,aux champs du systeme libre de rang k (3.8) associe a m indeterminees Z1, . . . , Zm.

D’un point de vue pratique, un inconvenient du resultat precedent est qu’il considere la plusgrande extension dynamique possible qui puisse satisfaire la condition de rang du point i). Leresultat de (Folland, 1977) que nous enoncons ci-dessous montre essentiellement qu’il est possibled’obtenir les memes proprietes que precedemment en travaillant avec l’algebre de Lie des champsde vecteurs et non pas l’algebre de Lie libre.

Theoreme 22 (Folland, 1977) Soient Y1, . . . , Ym des champs de vecteurs C∞ sur Rn, indepen-dants sur R, ∆r-homogenes de degre −`1, . . . ,−`m < 0 respectivement pour un vecteur de poidsr, et tels que L(Y1, . . . , Ym)(0) = Rn. Soit n la dimension sur R de L(Y1, . . . , Ym). Alors, il existe

i) pour tout i = 1, . . . ,m, une extension Yi de Yi sur Rn, avec Yi de classe C∞ et de la forme

∀y = (y, z) ∈ Rn × Rn−n, Yi(y) =(Yi(y)Zi(y, z)

)ii) une application ϕ ∈ C∞(Rn × Rn; Rn),iii) un vecteur de poids r = (r, r′) ∈ Rn,

tels que

1. L(Y1, . . . , Ym)(0) = Rn.

2. Y1, . . . , Ym sont ∆r-homogenes de degre −`1, . . . ,−`m respectivement.

3. Rn muni de la loi de composition xy := ϕ(x, y) est un groupe de Lie et les Yi sont invariantsa gauche par rapport a cette operation de groupe.

Page 97: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Approximations homogenes et structure de groupe 83

La preuve de ce resultat repose principalement sur la formule de Campbell-Hausdorff. Nous endonnons une version en Annexe A.2.2, sous la forme d’un “algorithme”.

Le Theoreme 22 est interessant pour l’etude des systemes sans derive satisfaisant la conditionde rang. En effet, puisque de tels systemes admettent toujours une approximation homogenecommandable (cf. Remarque 6), il garantit que modulo une eventuelle extension dynamique, cetteapproximation homogene peut aussi etre dotee en plus d’une propriete d’invariance par rapport aune loi de groupe. Comme nous le verrons dans le prochain chapitre, ces proprietes structurellestres fortes (homogeneite, nilpotence de l’algebre de Lie, structure de groupe) peuvent etre utilespour la synthese de lois de commande. Pour les systemes avec derive la structure de groupe estabsente (le Theoreme 22 peut bien sur s’appliquer aux champs Y0, . . . , Ym d’une approximationhomogene commandable d’un systeme avec derive, mais l’extension dynamique associee ne seraplus commandable). Par contre, il peut cependant se faire que l’algebre de Lie associee aux champsde commande soit de dimension finie, voir nilpotente. Ces proprietes peuvent aussi etre exploiteespour la stabilisation de ces systemes

Page 98: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis
Page 99: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Chapitre 4

Quelques methodes de synthese deretours d’etat pour la stabilisation

Ce chapitre est consacre a la synthese de retours d’etat pour la stabilisation de systemescritiques. Il contient, sous une forme synthetique, une part importante de notre travail sur lesujet. Contrairement au Chapitre 2 de la 1ere partie de ce memoire, ou il s’agissait de donner unevue d’ensemble des problemes et methodes de stabilisation par le biais d’exemples, l’esprit dupresent chapitre est tres different. Le but est de presenter des methodes de synthese de retoursd’etat “generales”. Le prix a payer pour cette generalite est d’une part une certaine complexite, etd’autre part le fait que les commandes synthetisees via ces methodes ne sont pas necessairementles plus efficaces pour un systeme donne, puisqu’elles ne tirent pas forcement profit “au mieux”de la structure d’un tel systeme. Ainsi, pour des vehicules non-holonomes “simples” comme lavoiture, il est souvent possible de synthetiser des lois de commandes ad hoc (comme celles donneesdans la premiere partie du memoire). Cependant, d’un point de vue plus theorique (et eventuel-lement pratique), il est aussi interessant de savoir comme on peut aller au dela de ces systemesparticuliers. C’est principalement l’objet de ce chapitre.

Dans la Section 4.1, nous commencons par rappeler les resultats de Sussmann et Liu (Suss-mann & Liu, 1991; Liu, 1997a; Liu, 1997b) sur la moyennisation et l’approximation de trajectoiresvia des commandes oscillantes. La Section 4.2 est consacree a la synthese de retours d’etat insta-tionnaires continus et homogenes, permettant de stabiliser exponentiellement un point d’equilibre.Elle contient notre extension de l’algorithme de Liu (Liu, 1997b) pour la stabilisation asympto-tique de systemes sans derive commandables (Morin et al., 1999), ainsi qu’un certain nombred’autres outils et resultats pour la stabilisation de systemes avec ou sans derive. La Section 4.3est consacree a la synthese de retours d’etat hybrides, et plus specialement a notre travail (Morin &Samson, 1999) dont le but etait d’apporter une solution au probleme de non-robustesse des com-mandes homogenes ρ-exponentiellement stabilisantes, vis-a-vis de dynamiques non-modelisees.Enfin la Section 4.4 est consacree a nos travaux les plus recents sur l’approche dite par “fonctionstransverses” (Morin & Samson, 2001a; Morin & Samson, 2003), qui fournit notamment des loisde commande pour la stabilisation pratique de points d’equilibre ou de trajectoires de systemessans derive.

Bien que les resultats presentes dans ce chapitre aient tous fait l’objet de publications, lapresentation et les preuves que nous en donnons different parfois sensiblement des originales.Nous avons en effet cherche ici a produire un expose synthetique, plutot qu’une simple collection

Page 100: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

86 Synthese de retour d’etat

de resultats independants.

4.1 Les resultats de Sussmann et Liu sur l’approximation de tra-jectoires

Les approches que nous allons presenter dans les trois prochaines sections ont en communde chercher a generer un mouvement dans les directions associees a certains crochets de Lie deschamps de vecteurs. Le principe de ce processus de generation est tres simple et bien connu : ilrepose sur la propriete elementaire suivante que l’on peut trouver dans la plupart des ouvragesde geometrie differentielle ou d’automatique non-lineaire (voir e.g. (Nijmeijer & Van der Schaft,1991, Pg. 53)).

Proposition 18 Soit X1 et X2 des champs de vecteurs reguliers sur Rn, et uε = (uε1, u

ε2) les

commandes definies sur [0, 4ε] par

uε(t) =

(1, 0) si t ∈ [0, ε)(0, 1) si t ∈ [ε, 2ε)(−1, 0) si t ∈ [2ε, 3ε)(0,−1) si t ∈ [3ε, 4ε)

Alors, la solution xε(t) de x(t) = uε1(t)X1(x) + uε

2(t)X2 avec la condition initiale xε(0) = 0satisfait xε(4ε) = ε2[X1, X2](x(0)) + o(ε2).

Cette propriete montre la possibilite de generer un mouvement dans la direction du crochet[X1, X2] en utilisant des commandes uε

1, uε2 “dephasees”. L’approximation de la direction [X1, X2]

est d’autant meilleure que la “frequence” 1/ε est elevee. La systematisation de ce principe, enutilisant des commandes de types sinusoıdales, a ete etudiee dans (Sussmann & Liu, 1991) et (Liu,1997a; Liu, 1997b), a partir de resultats anterieurs de (Kurzweil & Jarnik, 1988). Etant donneque nous avons largement utilise ces travaux, nous commencons par en rappeler les principauxresultats. Dans un soucis de “lisibilite”, les enonces donnes ici ne sont pas toujours les plusgeneraux, et la presentation qui en est faite differe parfois de l’originale.

4.1.1 Moyenne sur un intervalle de temps fini

Dans toute la suite de ce chapitre, les multi-index associes au systeme (S) seront a valeurdans l’ensemble 1, . . . ,m, i.e. I = (i1, . . . , is) avec s ∈ N et i1, . . . , is ∈ 1, . . . ,m.

La clef de voute des resultats que nous allons rappeler ici est la propriete suivante (Liu, 1997b,Eq. (36)).

Proposition 19 On suppose que les champs Xi de (S) sont de classe C0. Soit L ∈ N∗, T > 0, etuε

i ∈ L1([0, T ]) pour tout i = 1, . . . ,m . Alors, si ϕ ∈ C∞(M) est telle que XI(ϕ) ∈ C0(M) pourtout multi-index I tel que 0 < |I| ≤ L, on a le long des solutions definies sur [0, t] (t ≤ T ) de (S)

Page 101: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Les resultats de Sussmann et Liu sur l’approximation de trajectoires 87

controle par uε,

ϕ(x(t)) = ϕ(x(0)) +∫ t

0X0(ϕ)(x(s)) ds+

∑0<|I|≤L

∫ t

0vεI(s)XI(ϕ)(x(s)) ds

+∑

0<|I|<L

∫ t

0W ε

I (s)X0XI(ϕ)(x(s)) ds−∑|I|=L

∫ t

0W ε

I (s)XI(ϕ)(x(s)) ds

−∑

0<|I|<L

[W εI (t)XI(ϕ)(x(s))]t0

(4.1)

ou les fonctions vεI ,W

εI ∈ L1([0, T ]) verifient les relationsW ε

i (t) = W εi (0) +

∫ t0 (vε

i − uεi )(s) ds

W εi1,...,ik

(t) = W εi1,...,ik

(0) +∫ t0 (vε

i1,...,ik− uε

i1W ε

i2,...,ik)(s) ds

(4.2)

et les W εI (0) sont des constantes arbitraires.

La preuve de ce resultat ne presente pas de difficulte : on procede par recurrence sur L, a partirde L = 1, en effectuant a chaque etape une integration par partie de chaque terme∫ t

0W ε

I (s)XI(ϕ)(x(s)) ds

de (4.1).Le resultat precedent est avant tout un resultat de comparaison de solutions d’equations

differentielles puisqu’il permet, pour toute fonction ϕ, de comparer ϕ(x(t)) ou x(t) est la valeuren t de la solution de (S), a

ϕ(x(0)) +∫ t

0X0(ϕ)(x(s)) ds+

∑0<|I|≤L

∫ t

0vεI(s)XI(ϕ)(x(s)) ds

qui n’est autre que ϕ(x(t)) ou x(t) est cette fois la valeur en t de la solution du systeme1

x = X0(x) +∑

0<|I|≤L

vεI(t)XI(x)

avec x(0) = x(0). Sous certaines hypotheses de convergence (lorsque ε −→ 0) d’une famillede fonctions vε

I ,WεI associee a une famille de commandes uε , on peut obtenir une notion de

convergence des solutions de (S) vers celle d’un systeme etendu.

Theoreme 23 (Liu, 1997a; Liu, 1997b) Soit L ∈ N∗. On suppose que X0 est de classe C0 etX1, . . . , Xm sont de classe CL−1. Soit uε

i , vI ∈ L1([0, T ]) pour tout i = 1, . . . ,m, tout multi-index0 < |I| ≤ L et tout ε > 0. On suppose qu’il existe des fonctions vε

I ,WεI satisfaisant (4.2) telles

que :1Cette appellation de systeme est ici un abus de notation puisque les XI ne sont pas, a priori, des champs de

vecteurs. Nous verrons ci-dessous que ce point est ici un faux probleme.

Page 102: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

88 Synthese de retour d’etat

i) pour tout 0 < |I| ≤ L,∫ t0 v

εI(s) ds converge vers

∫ t0 vI(s) ds uniformement sur [0, T ], lorsque

ε −→ 0,ii) pour tout 0 < |I| ≤ L, W ε

I converge vers zero uniformement sur [0, T ], lorsque ε −→ 0,iii) les normes L1([0, T ]) de W ε

I pour |I| = L, et de vεI pour 0 < |I| ≤ L, sont uniformement

bornees.Alors,

1. Les solutions xε de (S) controle par uε convergent, lorsque ε −→ 0, vers les solutions x0 dusysteme etendu

x = X0(x) +∑

0<|I|≤L

vI(t)XI(x) (4.3)

En particulier, pour tout x0 ∈ M , si (4.3) a une solution unique x0(t, 0, x0) sur [0, T ]alors, pour ε > 0 suffisamment petit, les solutions xε(t, 0, x0) de (S) existent et convergentuniformement sur [0, T ] vers x0 lorsque ε −→ 0.

2. Le systeme (4.3) n’est autre que

x = X0(x) +∑

0<|I|≤L

vI(t)|I|

[XI ](x) avec [XI ] := [Xi1 , [. . . , [Xi|I|−1, Xi|I| ] . . .]] (4.4)

Une caracteristique importante de ce resultat est que les hypotheses de convergence sontindependantes des champs : elles ne font intervenir que la famille de commande uε. La seulehypothese sur les champs est une hypothese de regularite, qui permet de donner un sens au“systeme limite” (4.4).

4.1.2 L’algorithme d’approximation de trajectoires

Puisque l’ensemble [XI ] : 0 < |I| ≤ L forme une famille generatrice de LL(X1, . . . , Xm), s’ilest possible, pour toute famille de fonctions vI (0 < |I| ≤ L), de trouver une famille de fonctionsuε telle que les hypotheses du theoreme soient satisfaites (pour une certaine famille vε

I), alors ilest possible d’approcher les trajectoires de n’importe quel systeme du type

x = X0(x) +∑

`(B)≤L

αB(t)B(X1, . . . , Xm)(x)

ou B(X1, . . . , Xm) designe un crochet de Lie des champs X1, . . . , Xm et `(B) sa longueur. Ceprobleme de synthese de “commandes approximantes”uε est resolu dans (Liu, 1997a), sous formed’un algorithme que nous allons rappeler a partir des deux definitions suivantes.

Definition 21 Un sous-ensemble fini Ω de R est MC (pour “minimally cancelling”) si :∑ω∈Ω

w = 0 (4.5)

et ∑ω∈Ω

w = 0

(λω)ω∈Ω ∈ Z|Ω|∑ω∈Ω

|λω| ≤ |Ω|

=⇒

(λω)ω∈Ω = (0, . . . , 0)

ou (1, . . . , 1)

ou (−1, . . . ,−1)

(4.6)

Page 103: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Les resultats de Sussmann et Liu sur l’approximation de trajectoires 89

Definition 22 Une famille finie (Ωk)k=1,...,K de sous-ensembles finis Ωk de R est IR(L) (“inde-pendent with respect to L”) si :

K∑k=1

∑ω∈Ωk

λωω = 0

(λω)ω∈Ωk,k=1,...,K ∈ Z∑

k |Ωk|

K∑k=1

∑ω∈Ωk

|λω| ≤ L

=⇒

∑ω∈Ωk

λωω = 0, ∀k = 1, . . . ,K (4.7)

Remarque 7 Les definitions precedentes correspondent a des proprietes de non-resonance, commeon peut en trouver dans la theorie des formes normales (cf. e.g. (Arnold, 1980, Ch. 5))

Theoreme 24 (Liu, 1997a) Soient 0 < T ∈ R, K ∈ N∗, et pour tout k = 1, . . . ,K,i) un entier `(k) ∈ N∗,ii) un multi-index τk = (τ1

k , . . . , τ`(k)k ) ∈ 1, . . . ,m`(k),

iii) une fonction ηk = (η1k, . . . , η

`(k)k ) ∈ C1([0, T ]; C`(k)),

iv) un ensemble Ωk = ω1k, . . . , ω

`(k)k ∈ R`(k) tel que ω1

k = 0 si `(k) = 1, Ωk est MC si`(k) ≥ 2, et la famille Ωk : `(k) ≥ 2 est IR(L), avec L := maxk `(k).

Alors, les conditions i,ii,iii) du Theoreme 23 sont satisfaites, pour certaines fonctions vεI et W ε

I ,avec

uεi (t) := 2

∑(k,s):τs

k=i

ε− `(k)−1

`(k) Re(ηs

k(t)ejωs

kt/ε)

i = 1, . . . ,m

vI(t) := 2∑

k:τk=I

g(I,Ωk)ηk(t) 0 < |I| ≤ L(4.8)

ou j :=√−1,

ηk(t) := Re

(η1

k · · · η`(k)k (t)

j`(k)−1

)(4.9)

etg(I,Ωk) :=

∑S(`(k))3σ:τσ

k =I

1

ωσ(1)k (ωσ(1)

k + ωσ(2)k ) · · · (ωσ(1)

k + · · ·+ ωσ(`(k)−1)k )

avec S(`(k)) le groupe des permutations de 1, . . . , `(k), et τσk := (τσ(1)

k , . . . , τσ(k)k ).

Bien qu’il ne soit pas enonce comme tel, ce resultat est contenu dans (Liu, 1997a, Eq. (32)). Laformulation de ce resultat que nous donnons ici est basee sur (Morin et al., 1999, Th. 6.5).

L’algorithme de (Liu, 1997a) est base sur les proprietes enoncees dans le theoreme precedent.Cet algorithme est donne dans l’algebre de Lie libre, i.e. il ne presuppose pas de relations entreles crochets autres que celles decoulant de l’antisymetrie et de la relation de Jacobi. Bien quepresente quelque peu differemment dans (Liu, 1997a), on peut le resumer ainsi.

Etape 1 : Regrouper les multi-indices I (0 < |I| ≤ L) en classes d’equivalence Cp = Ip1 , . . . , I

p|Cp|

avec (p = 1, . . . , P ), ou la relation d’equivalence est donnee par I ∼ I ′ ⇐⇒ I = I ′. On note

Page 104: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

90 Synthese de retour d’etat

K :=∑

p dp, avec dp la dimension (dans l’algebre de Lie libre) de l’espace vectoriel engendre parles [XI ] : I ∈ Cp, et Jp l’ensemble d’indices Jp = d0 + . . . + dp−1 + 1, . . . , d0 + . . . + dp avecd0 = 0, de sorte que J1 ∪ J2 · · · ∪ JP = 1, . . . ,K.

Etape 2 : Pour tout p = 1, . . . , P , soit Xp1 , . . . , X

pdp

une base (dans l’algebre de Lie libre), de[XI ] : I ∈ Cp, determiner la matrice Γp telle que(

[XIp1] · · · [XIp

|Cp|])

=(Xp

1 · · ·Xpd(p)

)Γp

Etape 3 : Pour tout p = 1, . . . , P , et tout k ∈ Jp, poser :

`(k) = |I| , τk = I avec I ∈ Cp (I quelconque par ailleurs)

Etape 4 : Determiner K ensembles Ωk (k = 1, . . . ,K) verifiant l’hypothese iv) du Theoreme 24,et les conditions suivantes

∀p = 1, . . . , P , DetΓpGp 6= 0 avec Gp := (g(I,Ωk))I∈Cp,k∈Jp(4.10)

Etape 5 : Pour tout p = 1, . . . , P , choisir des fonctions ηk (k ∈ Jp) telles que

(ηk)k∈Jp=

12(ΓpGp)−1Γp (vI)I∈Cp

(4.11)

Les commandes uεi approximantes sont alors definies par (4.8), avec ηk n’importe quelle fonction

telle que (4.9) soit verifiee (par exemple, ηk(t) = (ηk(t), j, . . . , j)).

Theoreme 25 (Liu, 1997b) L’algorithme precedent est realisable et fournit une solution au pro-bleme d’approximation des trajectoires du systeme (4.4).

A l’exception de l’etape 4, il est simple de verifier que toutes les etapes peuvent etre realisees, etil n’est pas difficile de deduire, a partir du Theoreme 24, que les commandes uε ainsi calculeesfournissent bien une solution au probleme d’approximation des trajectoires du systeme (4.4). Laprincipale difficulte porte sur la realisation de l’etape 4. S’il n’est pas difficile de trouver desensembles Ωk verifiant l’hypothese iv) du Theoreme 24, montrer que l’on peut aussi les choisirde sorte que (4.10) soit verifiee est beaucoup moins simple. La preuve de cette propriete donneedans (Liu, 1997b, Sec. 7) est complexe.

S’il presente l’interet d’etre completement general, l’algorithme precedent n’est pas sans poserquelques difficultes d’application. La premiere est probablement la complexite combinatoire descalculs. Pour de petites dimensions (i.e. pour des valeurs de L petites), les calculs restent “accessi-bles”, mais ils deviennent tres vite complexes lorsque L grandit, en particulier des qu’il existe p telque dp > 1 (pour un systeme avec 2 commandes ce cas se presente lorsque L ≥ 5). Une deuxiemedifficulte est qu’il n’est pas evident de reduire cette complexite combinatoire pour des systemesparticuliers possedant une structure simple (comme par exemple les systemes chaınes). Enfin, lesconditions de “non-resonnance” imposees aux ensembles Ωk conduisent a des commandes incluantde nombreuses frequences, ce qui se traduit typiquement par des trajectoires tres oscillantes.

Page 105: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation exponentielle par retour d’etat homogene 91

4.2 Stabilisation exponentielle par retour d’etat homogene

Les resultats precedents ne fournissent a priori que des commandes en boucle ouverte u(t).Ils ne permettent pas directement de synthetiser des retours d’etat stabilisant asymptotiquementun point d’equilibre donne x0. Le but de notre travail dans (Morin et al., 1999) etait de montrercomment on peut en deduire la construction de retours d’etat stabilisant asymptotiquement, et ρ-exponentiellement, le point d’equilibre d’un systeme sans derive localement commandable autourde x0. Le principe de l’approche consiste a combiner les proprietes d’approximation des com-mandes uε(t) de la section precedente, avec des proprietes d’homogeneite de champs de vecteur(cf. Chapitre precedent). Bien que l’on ne considerait dans (Morin et al., 1999) que des systemessans derive, l’approche s’applique aussi a de nombreux systemes avec derive, comme nous le ver-rons a travers quelques exemples. C’est donc dans ce cadre plus general que nous presenteronsces resultats ici. Auparavant, nous rappelons quelques relations entre l’homogeneite de degre zerode champs de vecteurs et la stabilite exponentielle, ainsi qu’un certain nombre d’outils pour lastabilisation asymptotique, bases sur les proprietes des systemes homogenes.

4.2.1 Homogeneite et stabilite exponentielle

L’utilisation de retours d’etat homogenes pour la stabilisation ρ-exponentielle repose sur lapropriete suivante.

Proposition 20 Soity = Y (y, t) (4.12)

avec Y ∈ C0(Rn × R; Rn), ∆r-homogene de degre 0 pour une dilatation ∆r, et Y (y, t + T ) =Y (y, t) ∀(y, t) pour un T > 0. On suppose egalement que y = 0 est un equilibre asymptotiquementstable de (4.12). Alors,

i) y = 0 est globalement ρ-exponentiellement stable, i.e. pour toute norme homogene ρ,il existe des constantes K, γ > 0 telles que, le long des solutions de (4.12),

∀t ≥ 0, ρ(y(t)) ≤ Kρ(y(0))e−γt (4.13)

ii) Si R ∈ C0(Rn × R; Rn) est telle que

∀y ∈ Rn, supt≥0

‖∆r1/λR(∆r

λy, t)‖ −→ 0 lorsque 0 6= λ −→ 0

y = 0 est localement ρ-exponentiellement stable pour le systeme y = Y (y, t) + R(y, t), i.e.la relation (4.13) est verifiee le long des solutions de ce systeme pour ‖y0‖ suffisammentpetit (eventuellement pour une autre constante γ > 0).

Ce resultat generalise simplement le fait que pour une equation differentielle reguliere periodiquey = Y (y, t), si y = 0 est asymptotiquement stable pour l’equation linearisee y = A(t)y alors y = 0est globalement exponentiellement stable pour cette equation, et localement exponentiellementstable pour l’equation non-lineaire y = Y (y, t).

La Proposition 20 se montre facilement a partir du theoreme de (Rosier, 1992), ou plusprecisement de l’extension au cas instationnaire periodique de ce resultat (Pomet & Samson,1994) :

Page 106: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

92 Synthese de retour d’etat

Theoreme 26 (Rosier, 1992; Pomet & Samson, 1994) On suppose que le systeme (4.12) satisfaitles hypotheses de la Proposition 20. Alors, pour tout p ∈ N∗, il existe une fonction V ∈ Cp(Rn×R),telle que

i) ∀t, V (0, t) = 0 et V (y, t) > 0 si y 6= 0,ii) ∀(y, t), V (y, t+ T ) = V (y, t),iii) V est ∆r-homogene de degre d > 0,iv) V est une fonction de Lyapounov pour (4.12) ; plus precisement, il existe τ > 0 tel que

∀(y, t), ∂V

∂y(y, t)Y (y, t) +

∂V

∂t(y, t) ≤ −τV (y, t)

Le resultat suivant decoule de la Proposition 20.

Proposition 21 Soit (Sh) une approximation homogene en x0 d’un systeme (S) (cf. Definition20), de sorte que chaque champ Yi de cette approximation est ∆r-homogene de degre −`i. Onsuppose que `0 = 0. Soit u(y, t) avec u ∈ C0(Rn × R; Rm) un retour d’etat tel que

i) u est T -periodique par rapport a t,ii) chaque ui est ∆r-homogene de degre `i,iii) y = 0 est un equilibre asymptotiquement stable (et donc ρ-exponentiellement stable) du

systeme (Sh) controle.Alors, u(ψ(x), t) rend le point d’equilibre x0 du systeme (S) localement K-exponentiellementstable, i.e. pour toute distance d definie localement au voisinage de x0, il existe une fonctionk de classe K et une constante γ > 0 telles que le long des solutions du systeme (S) controle, etpour d(x(0), x0) suffisamment petit,

d(x(t), x0) ≤ k(d(x(0), x0))e−γt

Un tel retour d’etat u(ψ(x), t) est appele stabilisateur homogene ρ-exponentiel.

Ce resultat est a la base des methodes de stabilisation par retour d’etat homogene puisqu’ilgarantit que de tels retours d’etats, des lors qu’ils stabilisent asymptotiquement l’origine d’uneapproximation homogene et qu’ils rendent le systeme boucle correspondant homogene de degrezero, stabilisent aussi asymptotiquement (au moins localement) le systeme de depart. De plus,la convergence des solutions vers le point d’equilibre est exponentielle. Pour tous les systemes(S) possedant une approximation homogene (Sh) commandable et telle que `0 = 0, la synthesede retours d’etat homogenes est une approche pertinente pour la stabilisation exponentielle d’unpoint d’equilibre x0. Cette classe de systemes inclut : i) tous les systemes sans derive (S0) satis-faisant la condition de rang en x0, et ii) de nombreux systemes avec derive, notamment tous lesexemples de systemes mecaniques sous-actionnes et non-holonomes sous-actionnes consideres auChapitre 1 de la Partie I.

Remarque 8 Le cas particulier `0 = 0 n’est evidemment pas le seul pour lequel les retours d’etathomogenes peuvent etre utiles a la synthese de commandes stabilisantes (voir e.g. (Morin, 1996a;Praly, 1997; Morin et al., 1998) pour des resultats exploitant d’autres degres d’homogeneite). Nousnous limitons ici a ce cas dans la mesure ou il permet d’obtenir des proprietes de convergenceexponentielle.

Page 107: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation exponentielle par retour d’etat homogene 93

4.2.2 Homogeneite et moyenne a haute frequence

La principale contribution de (Morin et al., 1999) a consiste a montrer comment l’on peututiliser les commandes oscillantes de Sussmann et Liu, afin de synthetiser des retours d’etatexponentiellement stabilisants. L’idee consiste a coupler les proprietes des systemes homogenesavec celles des commandes oscillantes. Le resultat principal est enonce ci-dessous (voir (Morinet al., 1999, Prop. 6.2 et Th. 6.5)).

Theoreme 27 (Morin et al., 1999). Soit Z0, Z1, . . . , Zm ∈ C0(Rn; Rn) ∩ C∞(Rn \ 0; Rn) deschamps de vecteurs ∆r-homogenes de degre 0 pour un vecteur de poids r. Soit K ∈ N∗ et pour toutk = 1, . . . ,K, un entier `(k), un multi-index τk, une fonction ηk, et un ensemble Ωk satisfaisantles hypotheses du Theoreme 24, avec en outre ηk definie, bornee, et de derivee bornee sur [0,+∞).On suppose que l’origine du systeme

z = Z0(z) +∑

0<|I|≤L

vI(t)|I|

[ZI ](z) (4.14)

est asymptotiquement stable, avec vI les fonctions donnees par (4.8), supposees periodiques dememe periode. Alors, l’origine du systeme

z = Z0(z) +m∑

i=1

uεi (t)Zi(z) (4.15)

avec uεi donne par (4.8) est aussi asymptotiquement (et donc exponentiellement) stable pour ε > 0

suffisamment petit.

En d’autres termes, ce resultat signifie que si on utilise les “commandes approximantes” uε duTheoreme 24 avec des champs homogenes de degre zero et un systeme limite (systeme etendu)periodique par rapport a t, la stabilite asymptotique de l’origine du systeme etendu impliquela stabilite asymptotique de l’origine du systeme de depart, pour ε suffisamment petit. Nousdonnons ci-dessous une preuve de ce resultat. Cette preuve est essentiellement la meme que celledonnee dans (Morin et al., 1999), mais elle est plus courte dans la mesure ou nous exploitonsplus les resultats de Sussmann et Liu, au lieu de les redemontrer comme ceci est implicitementfait dans (Morin et al., 1999).

Preuve : Considerons d’abord le cas ou les fonctions vI sont constantes, de sorte que (4.14) estun systeme autonome. Notons que les champs [ZI ] du systeme (4.14) sont ∆r-homogenes de degre0. Puisque l’origine de ce systeme est asymptotiquement stable, il existe d’apres le theoreme deRosier (Th. 26) une fonction de Lyapunov V (z) pour ce systeme, homogene et de classe CL+1,i.e. le long des trajectoires du systeme (4.14),

V(4.14) ≤ −τV (τ > 0) (4.16)

Calculons la derivee de V le long des trajectoires du systeme (4.15). On utilise la Proposition 19avec ϕ = V , vε

I ,WεI , les fonctions evoquees dans le Theoreme 24, et X0, XI remplaces par Z0, ZI

Page 108: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

94 Synthese de retour d’etat

respectivement.

V(4.15) = Z0(V ) +∑

0<|I|≤L

vεIZI(V )

+∑

0<|I|<L

W εI Z0ZI(V )−

∑|I|=L

W εI ZI(V )−

∑0<|I|<L

(˙︷ ︸︸ ︷

W εI ZI(V ))(4.15)

= Z0(V ) +∑

0<|I|≤L

vIZI(V ) +∑

0<|I|≤L

(vI − vεI)ZI(V )

+∑

0<|I|<L

W εI Z0ZI(V )−

∑|I|=L

W εI ZI(V )−

∑0<|I|<L

(˙︷ ︸︸ ︷

W εI ZI(V ))(4.15)

= V(4.14) +∑

0<|I|≤L

(vI − vεI)ZI(V )

+∑

0<|I|<L

W εI Z0ZI(V )−

∑|I|=L

W εI ZI(V )−

∑0<|I|<L

(˙︷ ︸︸ ︷

W εI ZI(V ))(4.15)

(4.17)

Definissons maintenant la fonction

V ′ := V +∑

0<|I|≤L

W εI ZI(V ) (4.18)

Alors, d’apres (4.17),

V ′(4.15) = V(4.14) +∑

0<|I|≤L

(vI − vεI)ZI(V ) +

∑0<|I|<L

W εI Z0ZI(V ) +

∑|I|=L

W εI (

˙︷ ︸︸ ︷ZI(V ))(4.15)

Et donc, d’apres (4.16),

V ′(4.15) ≤ −τV +∑

0<|I|≤L

(vI − vεI)ZI(V ) +

∑0<|I|<L

W εI Z0ZI(V ) +

∑|I|=L

W εI (

˙︷ ︸︸ ︷ZI(V ))(4.15) (4.19)

A ce stade, rappelons que d’apres le Theoreme 24, les fonctions vεI et W ε

I satisfont les proprietesi), ii), et iii) du Theoreme 23. En particulier, on souhaiterait utiliser les proprietes de convergenceindiquees dans ce theoreme, lorsque ε tend vers zero, pour montrer que V ′ est une fonction deLyapunov pour le systeme (4.15) lorsque ε est suffisamment petit. Ces proprietes de convergencene sont en fait pas assez fortes pour cela, mais il se trouve que les fonctions vε

I et W εI verifient

des proprietes supplementaires qui vont s’averer suffisantes :

1. Pour tout 0 < |I| ≤ L, W εI converge vers zero uniformement sur [0,+∞), lorsque ε −→ 0,

2. Pour |I| = L, W εI = O(ε) uniformement par rapport a t ∈ [0,+∞)

3. Pour tout 0 < |I| ≤ L, il existe des entiers KI , GI , des reels αIk > 0, ωI

k, et des fonctionsbornees gI

k telles que∫ t

0(vI − vε

I)(τ) dτ =KI∑k=1

εαIk

∫ t

0gIk(τ)e

jωIkτ/ε dτ +

GI∑k=KI+1

∫ t

0gIk(τ)e

jωIkτ/ε dτ (4.20)

Page 109: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation exponentielle par retour d’etat homogene 95

De plus, si k > KI , gIk est bornee et ωI

k 6= 0 (notons que cette propriete des ωIk est necessaire

pour obtenir la convergence uniforme vers zero, lorsque ε tend vers zero, des integrales∫ t0 (vI − vε

I)(τ) dτ , puisque les fonctions gIk sont independantes de ε).

Ces trois proprietes decoulent des expressions donnees dans (Liu, 1997a, Sec. 6), et des hypothesesque nous avons faites sur les fonctions ηk (bornitude de ces fonctions et de leurs derivees).

Montrons maintenant comment ces trois proprietes permettent de conclure. Etant donne quechaque fonction ZI(V ) est homogene de meme degre que V , on deduit de (4.18) et de la Propriete1 ci-dessus que pour ε suffisamment petit,

V/2 ≤ V ′ ≤ 3V/2 (4.21)

La Propriete 1 implique egalement, par les memes arguments et en utilisant (4.19), que pour εsuffisamment petit

V ′(4.15) ≤ −τ2V +

∑0<|I|≤L

(vI − vεI)ZI(V ) +

∑|I|=L

W εI (

˙︷ ︸︸ ︷ZI(V ))(4.15) (4.22)

A partir de cette inegalite, de la Propriete 2, et de l’expression (4.8) des fonction uεi , on deduit

que pour ε suffisamment petit,

V ′(4.15) ≤ −τ4V +

∑0<|I|≤L

(vI − vεI)ZI(V ) (4.23)

Notons en effet que le terme de droite de (4.15) est une somme de champs homogenes de degrezero, avec des coefficients en O(ε−`) ou ` < 1. Il reste a considerer la somme dans (4.23). L’egalite(4.20) implique que

(vI − vεI)(t) =

KI∑k=1

εαIkgI

k(t)ejωI

kt/ε +GI∑

k=KI+1

gIk(t)e

jωIkt/ε (4.24)

Puisque les fonctions gIk sont bornees et αI

k > 0, il decoule de cette egalite et de (4.23) que pourε suffisamment petit,

V ′(4.15) ≤ −τ8V +

∑0<|I|≤L

GI∑k=KI+1

gIk(t)e

jωIkt/εZI(V ) (4.25)

Posons enfin

V ′′ := V ′ −∑

0<|I|≤L

GI∑k=KI+1

gIk(t)

ε

jωIk

ejωIkt/εZI(V )

Cette fonction est bien definie car ωIk 6= 0 pour k > KI , et c’est une fonction de Lyapunov

candidate pour ε suffisamment petit. En effet puisque les fonctions gIk sont bornees et que ZI(V )

est ∆r-homogene de degre zero, on deduit de (4.21) que pour ε suffisamment petit,

V/4 ≤ V ′′ ≤ 2V

Page 110: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

96 Synthese de retour d’etat

D’apres (4.25), la derivee de V ′′ le long des solutions de (4.15) verifie

V ′′(4.15) ≤ −τ8V −

∑0<|I|≤L

GI∑k=KI+1

(gIk(t)

ε

jωIk

ejωIkt/εZI(V ) + gI

k(t)ε

jωIk

ejωIkt/ε(

˙︷ ︸︸ ︷ZI(V ))(4.15)

)

≤ − τ

16V −

∑0<|I|≤L

GI∑k=KI+1

gIk(t)

ε

jωIk

ejωIkt/ε(

˙︷ ︸︸ ︷ZI(V ))(4.15)

ou la derniere inegalite est verifiee pour ε suffisamment petit, du fait de l’homogeneite des fonc-tions ZI(V ) et de la bornitude des fonctions gI

k pour k > KI . En utilisant le meme argument quecelui utilise pour passer de (4.22) a (4.23), on obtient finalement que pour ε suffisamment petit,

V ′′(4.15) ≤ − τ

32V

Ceci conclut la preuve lorsque les fonctions vI sont constantes. Lorsque ces fonctions sont seule-ment periodiques de meme periode, la preuve est tout a fait similaire : le Theoreme 26 garantitl’existence d’une fonction de Lyapunov V (z, t) pour le systeme (4.14), avec V periodique parrapport a t. En posant M := M × R, X0 := X0 + ∂/∂t et Xi := Xi, on peut encore utiliser laProposition 19 pour exprimer la derivee de V le long des solutions du systeme (4.15), et la memeconstruction que la precedente conduit a une fonction de Lyapunov V ′′ pour ce systeme.

Le Theoreme 27 peut etre vu comme un resultat de moyenne a “haute frequence”. Notons eneffet que d’apres (4.8), le systeme (4.15) peut aussi s’ecrire

z = Z0(z, t) +L∑

`=2

ε−`−1

`

Jl∑j=1

Zj` (z, t, t/ε) (4.26)

avec entre autre

Z0(z, t) := Z0(z) +m∑

i=1

∑(k,s):`(k)=1,τs

k=i

Re(ηsk(t))

Zi(z)

et Z0, Zj` ∆r-homogenes de degre zero, et Zj

` (z, t, τ) periodique par rapport a τ (de periodeindependante de (z, t) bien sur) et de moyenne nulle. Le Theoreme 27 est a rapprocher du resultatsuivant qui generalise un resultat classique de la methode de moyenne (cf. e.g. (Hale, 1969, Sec.5.3)).

Theoreme 28 (M’Closkey, 1997) On considere le systeme

z = Z0(z) + Z1(z, t/ε) (4.27)

aveci) Z0, Z1 ∈ C0(Rn; Rn), ∆r-homogenes de degre zero pour un vecteur de poids r,ii) Z1(z, τ) periodique par rapport a τ et de moyenne nulle.

Alors, si l’origine z = 0 de z = Z0(z) est un equilibre asymptotiquement stable, l’origine de (4.27)est egalement asymptotiquement stable pour ε > 0 suffisamment petit.

Page 111: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation exponentielle par retour d’etat homogene 97

Remarque 9 A ce stade, il est naturel de se demander si l’on peut combiner les Theoremes 27et 28. Plus precisement, le Theoreme 27 est-il toujours vrai lorsque le systeme (4.15), egal a(4.26), est remplace par

z = Z0(z, t) +L∑

`=1

ε−`−1

`

Jl∑j=1

Zj` (z, t, t/ε) (4.28)

Une legere adaptation de la preuve du Theoreme 27 (definition d’une fonction de Lyapunov V ′′′

a partir de V ′′) permet de conclure que c’est bien le cas si, par exemple, les Zj1 satisfont les

proprietes suivantes, egalement verifiees pour les autres termes Zj` (` ≥ 2) :

i) Zj1 ∈ C0(Rn×R×R; Rn)∩C∞((Rn \ 0)×R×R; Rn) et Zj

1(z, t, τ) est C1 par rapport a t,ii) Zj

1 est ∆r-homogene de degre zero,

iii) pour tout (z, τ), Zj1(z, t, τ) et ∂Zj

1(z,t,τ)∂t sont bornes par rapport a t,

iv) chaque Zj1(z, t, τ) est periodique par rapport a τ et de moyenne nulle.

4.2.3 Homogeneite et ajout d’un integrateur

Nous terminons cette section en donnant un autre resultat utile pour la synthese de retoursd’etat homogenes. Ce resultat porte sur le probleme d’ajout d’integrateur (voir e.g. (Coron &Praly, 1991) pour d’autres resultats sur ce probleme).

Proposition 22 (Morin & Samson, 1997) On considere le systeme

x = X(x, v1, (x1, t), . . . , vm(xm, t), t) (4.29)

sur Rn, et l’on suppose quei) chaque xi est un sous-vecteur de x, i.e. xi = P ix pour une matrice de projection P i ∈

Rni×n,ii) X ∈ C0(Rn × Rm × R; Rn) avec X(x, v, t) periodique de periode T par rapport a t,iii) chaque vi ∈ C0(Rni ×R)∩ C1((Rni \ 0)×R) est de classe C1 et periodique de periode T

par rapport a t, et vi P i est ∆r-homogene de degre rn+i > 0,iv) le champ de vecteur associe a (4.29) est ∆r-homogene de degre zero et x = 0 est un point

d’equilibre asymptotiquement stable de ce systeme.Soit r := (r1, . . . , rn+m). Alors, pour tout entiers αi (i = 1, . . . ,m) impairs et toute norme ∆r-homogene ρ, de classe C1 en dehors de l’origine, il existe des constantes ki > 0 (i = 1, . . . , p)telles que pour ki > ki, l’origine du systeme

x = X(x, y1, . . . , ym, t)

yi = −ki

(yαi

i − vαii (xi, t)

ρ(αi−1)rn+i(x, y)

)i = 1, . . . ,m

(4.30)

est ρ-exponentiellement stable.

Cette proposition a ete montree dans (Morin & Samson, 1997), pour le cas particulier αi = 1, i.e.

yi = −ki(yi − vi)

Page 112: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

98 Synthese de retour d’etat

en utilisant la“methode de desingularisation”de (Praly et al., 1991). La preuve s’etend sans grandedifficulte a la presente version (voir (Morin, 1996b, Sec. 3.2.5)). L’interet d’utiliser des αi > 1reside dans la possibilite d’appliquer recursivement ce resultat (e.g. sur une chaıne d’integrateurs).Notons enfin que le systeme (4.30) est ∆r-homogene de degre zero.

La Proposition 22 associee aux resultats de moyenne precedents (Th. 27,28) fournit un outiltres efficace pour aborder la stabilisation exponentielle de points d’equilibre de systemes critiques.Nous en donnons des exemples d’application dans les deux sections suivantes.

4.2.4 Synthese de retours d’etat stabilisants via l’algorithme de Sussmann etLiu (Version 1)

Il n’est pas difficile de deduire du Theoreme 27 un algorithme pour la synthese de retours d’etatstabilisant ρ-exponentiellement l’equilibre x0 d’un systeme (S0) tel que L(X1, . . . , Xm)(x0) = Rn,ou plus generalement de tout systeme (S) pour lequel,

Hypothese 4 On disposei) d’une approximation homogene de (S) :

y = Y0(y) +m∑

i=1

uiYi(y) (4.31)

avec Yi ∆r-homogene de degre −`i et `0 = 0,ii) d’un retour d’etat a(y) = (aI(y))0<|I|≤L, avec aI ∈ C0(Rn) ∩ C∞(Rn \ 0), ∆r-homogene

de degre `I := `i1 + . . .+ `i|I|, qui stabilise asymptotiquement l’origine du systeme

y = Y0(y) +∑

0<|I|≤L

aI [YI ](y) (4.32)

Notons que `I est l’oppose du degre d’homogeneite de [YI ], de sorte que le systeme boucle (4.32) esthomogene de degre zero. Notons egalement que l’hypothese ci-dessus est bien satisfaite pour toutsysteme sans-derive (S0) qui verifie la condition de rang en x0. L’existence d’une approximationhomogene commandable pour un tel systeme a ete rappelee au Chapitre precedent (Remarque 6).Quand a l’existence d’un retour d’etat γ satisfaisant la condition ii) ci-dessus, il suffit de consi-derer n crochets [YI1 ], . . . , [YIn ] lineairement independants en y = 0 (et donc, par homogeneite,lineairement independants en tout y) et de poser par exemple

(aI1(y), . . . , aIn(y))′ = −k ([YI1 ](y) · · · [YIn ](y))−1 yaI(y) = 0 si I /∈ I1, . . . , In

avec k > 0. Le systeme boucle (4.32) est alors donne par y = −ky et il n’est pas difficile demontrer (voir (Morin et al., 1999, Prop. 4.4)) que les aI ainsi construits sont bien homogenes dedegre `I .

L’algorithme de construction de commandes homogenes stabilisant asymptotiquement l’ori-gine d’un systeme (S) satisfaisant l’hypothese 4 ci-dessous, qui correspond a celui donne dans(Morin et al., 1999) pour les systemes sans derive, est le suivant :

Page 113: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation exponentielle par retour d’etat homogene 99

Etape 1 : Determiner, pour tout 0 < |I| ≤ L, une fonction βI = (β1I , . . . , β

|I|I ) ou chaque

composante βsI ∈ C∞(Rn \ 0) ∩ C0(Rn) est ∆r-homogene de degre `is , telle que

Y0 +∑

0<|I|≤L

[βIYI ] = Y0 +∑

0<|I|≤L

aI [YI ] (4.33)

avec [βIYI ] := [β1IYi1 , [. . . , [β

|I|−1I Yi|I|−1

, β|I|I Yi|I| ] . . .]].

Bien que cette etape conduise a une importante complexite de calcul des que L devientgrand, elle ne pose pas, formellement, de difficulte. Nous indiquons ci-dessous la demarche asuivre a partir du cas L = 2. Celle ci se generalise sans difficulte a toute autre valeur de L (voir(Morin et al., 1999, Sec. 4) pour plus de details). La definition des βI se fait par une recurrencedecroissante sur |I|. Pour L = 2, le terme de gauche de (4.33) est donne par

Y0 +∑

0<|I|≤2

[βIYI ] = Y0 +m∑

i=1

βiYi +m∑

i,j=1

[β1(i,j)Yi, β

2(i,j)Yj ]

= Y0 +m∑

i=1

βi +m∑

j=1

Yj(β2(j,i) − β1

(i,j))

Yi +m∑

i,j=1

β1(i,j)β

2(i,j)[Yi, Yj ]

La derniere egalite etant obtenue a partir de la relation [fX, gY ] = fg[X,Y ] +X(g)Y − Y (f)X,ou f, g designent des fonctions et X,Y des champs de vecteurs. Afin d’obtenir l’egalite (4.33), ilsuffit alors de poser

∀(i, j), β1(i,j) :=

a(i,j)

ρ`j, β2

(i,j) := ρ`j

avec ρ ∈ C∞(Rn \ 0; R) une norme homogene, puis de poser

∀i, βi = ai −m∑

j=1

Yj(β2(j,i) − β1

(i,j))

Etape 2 : Calculer des commandes uεI,s du type (4.8) avec des ηk constantes (par exemple), de

sorte que les trajectoires du systeme

y = Y0(y) +∑

0<|I|≤L

∑0<s≤|I|

uεI,s(t)β

sI (y)Yis(y) (4.34)

approximent celles du systeme

y = Y0(y) +∑

0<|I|≤L

[βIYI ](y) (4.35)

La loi de commande est alors donnee par

∀i = 1, . . . ,m, uεi (y, t) =

∑0<|I|≤L

∑s:is=i

uεI,s(t)β

sI (y) (4.36)

Theoreme 29 (Morin et al., 1999) L’origine du systeme (4.31) controle par la commande uε

definie par (4.36) est ρ-exponentiellement stable pour ε suffisamment petit.

Page 114: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

100 Synthese de retour d’etat

Preuve : Par construction des fonctions βI , chaque champ βsIYis est ∆r-homogene de degre 0,

et d’apres (4.33) l’origine de (4.35) est asymptotiquement stable. Il decoule donc du Theoreme27 que l’origine du systeme (4.34) est ρ-exponentiellement stable pour ε suffisamment petit. Parailleurs,

Y0(y) +∑

0<|I|≤L

∑0<s≤|I|

uεI,s(t)β

sI (y)Yis(y) = Y0(y) +

m∑i=1

∑0<|I|≤L

∑s:is=i

uεI,s(t)β

sI (y)

Yi(y)

de sorte qu’avec la definition (4.36), le systeme (4.34) et le systeme controle (4.31) coıncident.D’ou la stabilite ρ-exponentielle de ce dernier pour ε suffisamment petit.

4.2.5 Exemple d’application

Nous illustrons les resultats precedents sur l’exemple du satellite sous-actionne (Chapitre 1,Partie I). L’exemple du glisseur peut etre traite de facon tout a fait similaire (il possede uneapproximation homogene identique, a un changement de variables pres, a celle du satellite).L’exemple du corps rigide sur SE(3) (Section 1.5.3) a aussi ete traite avec la meme methode dans(M’Closkey & Morin, 1998).

La synthese de commandes exponentiellement stabilisantes pour le satellite sous-actionne aete abordee dans (Coron & Kerai, 1996) et (Morin & Samson, 1997). Nous considerons le modele(1.46) de ce systeme, avec na = 2, F 1 = (1, 0, 0)′, et F 2 = (0, 1, 0)′. Nous avons etabli au chapitreprecedent qu’il possede une approximation homogene commandable en (α, ω) = 0, definie par

Y0(y) =12(y4, y5, y6 + y1y5 − y2y4, 0, 0, cy4y5)′ , Y1(y) = e4, Y2(y) = e5 (4.37)

avec c une constante non nulle et ei le i-eme vecteur unitaire de R6. Pour le vecteur de poidsr = (1, 1, 2, 1, 1, 2), le champ Y0 est ∆r-homogene de degre 0 et Y1, Y2 sont ∆r-homogenes dedegre −1. La synthese de commandes homogenes exponentiellement stabilisantes, avec les outilspresentes precedemment, peut se faire de deux facons.

Methode 1 : Les champs Yi de l’approximation homogene ne satisfont pas l’Hypothese 4 ; on nepeut donc pas utiliser directement l’algorithme precedent sur ce systeme. La methode que nousdonnons ici est celle utilisee dans (Morin & Samson, 1997).

L’approximation homogene avec les champs Yi donnes par (4.37) peut s’ecrirey1 = v1/2y2 = v2/2y3 = (y6 + y1v2 − y2v1)/2y6 = cv1v2

v1 = u1

v2 = u2(4.38)

avec v1 = y4, v2 = y5. Ceci suggere de synthetiser d’abord un retour d’etat homogene (v1, v2)pour stabiliser y1, y2, y3, y6 a zero, puis d’utiliser la Proposition 22 sur l’ajout d’integrateur, afinde deduire une loi de commande (u1, u2) qui stabilise le systeme complet. Soit vε

1(y1, y3, y6, t) := −2k1y1 − sin(t/ε)k3y3 + k6y6

ρ(y1, y3, y6)vε2(y2, y3, y6, t) := −2k2y2 + 2c sin(t/ε)ρ(y2, y3, y6)

Page 115: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation exponentielle par retour d’etat homogene 101

avec ρ ∈ C1(R3 \ 0) une norme homogene pour le vecteur de poids (1, 2, 2), et ki des constantespositives. En appliquant cette commande au systeme de gauche de (4.38), on obtient un systemedu type

z = Z0(z) + Z1(z, t/ε)

avec z := (y1, y2, y3, y6)′,

Z0(z) :=

−k1z1−k2z2

z4/2 + (k1 − k2)z1z2c(4k1k2z1z2 − ck3z3 − ck6z4)

et Z0 et Z1 satisfaisant les hypotheses du Theoreme 28. De plus l’origine du systeme z = Z0(z) estasymptotiquement stable. On en deduit que le retour d’etat vε rend l’origine du systeme boucleasymptotiquement stable pour ε suffisamment petit. Alors, par application de la Proposition 22,le retour d’etat

uε1(y, t) := −k4(y4 − vε

1(y1, y3, y6, t))uε

2(y, t) := −k5(y5 − vε2(y2, y3, y6, t))

stabilise ρ-exponentiellement l’origine de l’approximation homogene du satellite (et donc egale-ment celle du satellite lui-meme, localement) pour k4, k5 suffisamment grand.

Methode 2 : (Selon la methode de la Section 4.2.4) Une autre facon d’ecrire l’approximationhomogene du satellite (a comparer a (4.38)) est :

y1 = v1/2y2 = y5/2y3 = (y6 + y1y5 − y2v1)/2y5 = u2

y6 = cv1y5

v1 = u1 (4.39)

toujours avec v1 = y4. En assimilant (v1, u2) au vecteur de commande, le systeme de gauche de(4.39) s’ecrit

˙y = Y0(y) + v1Y1(y) + u2Y2(y) (4.40)

avec y := (y1, y2, y3, y5, y6)′, et

Y0(y) =

0

y4/2(y5 + y1y4)/2

00

, Y1(y) =

1/20

−y2/20cy4

, Y2(y) =

00010

,

Le crochet [Y1, Y2] est donne par [Y1, Y2] = (0, 0, 0, 0,−c)′. Il est facile de verifier que le retourd’etat

a1(y) = −2k1y1

a2(y) = −k2y2 − k4y4

a(1,2)(y) = c(k3y3 + k5y5)

Page 116: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

102 Synthese de retour d’etat

(avec ki des constantes positives) rend l’origine du systeme

˙y = Y0(y) + a1Y1(y) + a2Y2(y) + a(1,2)[Y1, Y2](y) (4.41)

asymptotiquement stable, et que toutes les conditions de l’Hypothese 4 de la section precedentesont verifiees, avec L = 2. On peut alors appliquer l’algorithme correspondant pour synthetiserun retour d’etat homogene (v1, u2) qui stabilise asymptotiquement l’origine du systeme (4.40),puis appliquer a nouveau la Proposition 22 afin d’en deduire une commande (u1, u2) stabilisantl’origine du systeme (4.39).Calcul de (v1, u2) : Nous appliquons l’algorithme de la Section 4.2.4. Le terme de droite de(4.41) s’ecrit

Y0 + a1Y1 + a2Y2 + a(1,2)[Y1, Y2] = Y0 + β11 Y1 + β1

2 Y2 + [β1(1,2)Y1, β

2(1,2)Y2]

avec, par exemple, β1

1 = a1 + Y2(β1(1,2)), β1

(1,2) = a(1,2)

ρ

β12 = a2 − Y1(β2

(1,2)), β2(1,2) = ρ

ou ρ ∈ C∞(R5 \ 0) est une norme homogene pour la dilatation associee au systeme (4.40),comme par exemple ρ(y) := (y4

1 + y42 + y2

3 + y44 + y2

5)1/4. Il s’agit ensuite d’utiliser le Theoreme 24

pour calculer des commandes uε1, u

ε2, u

ε(1,2),1, u

ε(1,2),1 telles que les trajectoires du systeme

˙y = Y0(y) + uε1(t)β

11 Y1(y) + uε

2(t)β12 Y2(y) + uε

(1,2),1(t)β1(1,2)Y1(y) + uε

(1,2),2(t)β2(1,2)Y2(y)

approximent celles du systeme

˙y = Y0(y) + β11 Y1(y) + β1

2 Y2(y) + [β1(1,2)Y1, β

2(1,2)Y2](y)

Un choix simple est donne par

uε1 = uε

2 = 1, uε(1,2),1 = ε−1/2 sin(t/ε), uε

(1,2),2 = 2ε−1/2 cos(t/ε)

D’ou finalement la commandevε1(y, t) := β1

1(y) + ε−1/2 sin(t/ε)β1(1,2)(y)

uε2(y, t) := β1

2(y) + 2ε−1/2 cos(t/ε)β2(1,2)(y)

qui stabilise exponentiellement l’origine du systeme (4.40) pour ε suffisamment petit. La loi decommande (u1, u2) pour le systeme (4.39) est simplement obtenue en utilisant la commande uε

2

ci-dessus, et en posant uε1(y, t) = −k(y4 − vε

1(y, t)) avec k suffisamment grand.

4.3 Stabilisation asymptotique par retour d’etat hybride

Comme nous l’avons signale dans la premiere partie de ce memoire (Section 2.2.2, premierepartie), un inconvenient des retours d’etat homogenes reside dans le fait qu’ils ne garantissent pasune robustesse de la propriete de stabilite asymptotique vis-a-vis de dynamiques non modelisees.Afin de preciser ce point, introduisons la famille de systemes de commande :

(Sδ)δ∈R : x =m∑

i=1

ui(Xi(x) +Ri(δ, x)) (4.42)

On a alors le resultat suivant

Page 117: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation asymptotique par retour d’etat hybride 103

Proposition 23 (Lizarraga et al., 1999) Soit (S0) un systeme sans derive sur Rn. On supposeque dim L(X1, . . . , Xm)(0) = Rn et

∀k = 1, . . . ,m, dim L(X1, . . . , Xk−1, Xk+1, . . . , Xm)(0) < Rn−1 (4.43)

Alors, il n’existe pas de stabilisateur homogene ρ-exponentiel garantissant la robustesse de la pro-priete de stabilite asymptotique vis-a-vis de dynamiques non modelisees, i.e. il existe des fonctionsR1, . . . , Rm ∈ Cω(R × Rn; Rn) telles que Ri(0, .) = 0 ∀i, et telles que l’origine du systeme (Sδ)controle est instable pour tout δ 6= 0.

Notons que la condition (4.43) est par exemple toujours satisfaite si m = 2 et n ≥ 3. Par ailleurs,pour les systemes avec derive, il est aussi possible d’enoncer des obstructions a l’existence destabilisateurs homogenes ρ-exponentiel robustes (voir (Lizarraga et al., 1999) pour plus de details).

Dans (Bennani & Rouchon, 1995), des retours d’etat hybrides du type u(x(kT ), t) ont eteproposes pour la commande de certains vehicules non-holonomes. Ces retours d’etat sont hybridesdans le sens ou la partie instationnaire de la commande evolue en continu, alors que l’etat n’estremis a jour que periodiquement (a chaque instant kT ou k parcourt N et T > 0 est une constante).Les commandes proposees sont des “stabilisateurs K(T )-exponentiels” (cf. Definition 11, Chapitre2, Partie I) : elles assurent une convergence exponentielle des trajectoires vers le point d’equilibreconsidere, ainsi qu’une certaine forme de stabilite. Le principal interet de ce resultat est qu’ilgarantit aussi ces proprietes en presence de dynamiques non-modelisees du type (4.42). Dans(Morin & Samson, 1999), nous avons generalise ce resultat a tout systeme sans derive analytiquecommandable. Le but de cette section est de presenter ce travail. Nous nous limiterons ici auxsystemes sans derive, sachant que l’extension de cette approche aux systemes avec derive sembleassez delicate.

4.3.1 Une condition suffisante de robustesse aux dynamiques non modelisees

Les proprietes de robustesse des lois de commande hybrides que nous allons proposer reposentsur le resultat suivant.

Theoreme 30 (Morin & Samson, 1999, Th.1) On considere la famille de systeme sans derive(Sδ). On suppose que les Xi et les Ri sont analytiques sur Rn et R × Rn respectivement, et queRi(0, .) = 0. Soit U un voisinage de x = 0, et u ∈ C0(U ×R+; Rm) avec u(x, .) T -periodique pourtout x. On suppose en outre que

i) il existe α,M > 0 tels que |u(x, t)| ≤M |x|α pour tout (x, t) ∈ U × [0, T ],ii) il existe une matrice A stable au sens discret, i.e. |λi(A)| < 1, telle que x(T ) = Ax0+o(x0),

avec x(.) la solution de

x =m∑

i=1

ui(x0, t)Xi(x), x(0) = x0 ∈ U

iii) pour tout multi-index I tel que 0 < |I| ≤ 1/α,∫ T

0uI dτI = O(x0) (4.44)

Page 118: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

104 Synthese de retour d’etat

Alors, il existe δ0 > 0 tel que u(x(kT ), t) est un stabilisateur K(T )-exponentiel en x = 0 pourtout systeme (Sδ) avec |δ| < δ0.

Rappelons que le terme de gauche de (4.44) est l’integrale iteree de la serie de Chen-Fliess (cf.Definition 3.2).

Preuve (resumee) : Modulo quelques details techniques, la preuve de ce resultat est assezsimple. Nous indiquons ci-dessous les principaux arguments pour la propriete de convergence dessolutions vers zero. Considerons d’abord le systeme non perturbe (S0). La convergence vers zerodes solutions du systeme commande decoule de l’hypothese ii) et de la periodicite de la fonction upar rapport a t. Considerons maintenant les systemes perturbes (Sδ). Etant donne que les champsde vecteur Xi et Ri sont supposes analytiques, le developpement en serie de Chen-Fliess donne :

x(T ) =∑

I

(∫ T

0uI dτI

)(X +R)I(id)(x0)

D’apres l’hypothese ii),

∑I

(∫ T

0uI dτI

)XI(id)(x0) = Ax0 + o(x0)

et donc,

x(T ) = Ax0 + o(x0) + β(δ, x0) + γ(δ, x0)

avec

β(δ, x0) =∑|I|≤1/α

(∫ T

0uI dτI

)((X +R)I −XI)(id)(x0)

γ(δ, x0) =∑|I|>1/α

(∫ T

0uI dτI

)((X +R)I −XI)(id)(x0) (4.45)

Grace a l’hypothese iii) et au fait que Ri(0, .) = 0, on montre que

β(δ, x0)|x0|

−→ 0 si δ −→ 0

et ceci uniformement en x0 dans un voisinage de x0 = 0. Enfin, grace a l’hypothese i), qui impliqueque les integrales iterees dans l’expression de γ sont des o(x0), on montre que

γ(δ, x0)|x0|

−→ 0 si |x0| −→ 0

uniformement en δ dans un voisinage de δ = 0. Ces arguments suffisent a prouver, localement, laconvergence des solutions vers l’origine si δ est suffisamment petit.

Page 119: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation asymptotique par retour d’etat hybride 105

4.3.2 Synthese de retours d’etat stabilisants via l’algorithme de Sussmann etLiu (Version 2)

Il est possible de transformer l’algorithme de Sussmann et Liu afin de synthetiser, pour toutsysteme (S0) analytique et commandable, des fonctions u(x, t) qui verifient les conditions duTheoreme 30. Contrairement a notre algorithme de synthese de retours d’etat homogenes (Section4.2.4), l’algorithme que nous allons rappeler ici (cf. (Morin & Samson, 1999, Sec. 4)) ne necessitepas d’utiliser des ε petits. Par contre, les fonctions uε

i utilisees doivent satisfaire deux conditionssupplementaires.

Proposition 24 Soient T ∈ R, et uεi les fonctions definies par (4.8). Supposons, en plus des

conditions i)–iv) du Theoreme 24, que pour tout k = 1, . . . ,K et s = 1, . . . , `(k)v) 2π

T est un diviseur de ωsk,

vi) ηsk est une fonction de x0 seulement (elle ne depend pas de t), homogene de degre 1/`(k),

i.e. ηsk(λx0) = λ

1`(k) ηs

k(x0) ∀λ ≥ 0.Alors,

0 < |I| ≤ L =⇒ limε→0

∫ T

0uε

I dτI =∫ T

0u1

I dτI + o(x0) (4.46)

La preuve de ce resultat est donnee en Annexe A.2.3.

Nous pouvons maintenant donner l’algorithme de construction de retours d’etat hybridesstabilisant. Il correspond, modulo une legere difference de presentation, a celui donne dans (Morinet al., 1999, Sec. 4). Cet algorithme est applicable a tout systeme sans derive (S0) sur Rn,analytique, et verifiant la condition de rang a l’origine.

Etape 1 : Determiner n crochets [XI1 ], . . . , [XIn ] lineairement independants en x = 0, et unematrice H telle que

A := In + ([XI1 ](0) · · · [XIn ](0))H

soit stable au sens discret.

Etape 2 : Appliquer l’algorithme de Sussmann et Liu de la section 4.1.2 afin de calculer desfonctions uε

i telles que les trajectoires du systeme

x =m∑

i=1

uεi (x0, t)Xi(x) (4.47)

approximent, pour tout x0, celles du systeme

x =n∑

j=1

vIj (x0)|Ij |

[XIj ](x) avec vIj (x0) :=|Ij |THjx0 (4.48)

et Hj la j-eme ligne de H. En outre, on impose que les frequences ωsk et les fonctions ηs

k satisfontles conditions v) et vi) de la Proposition 24. Pour les fonctions ηs

k, un choix possible est donnepar (comparer avec (4.11)) : η1

k(x0) = 12 |x0|−

`(k)−1`(k) (ΓpGp)−1Γp (vI(x0))I∈Jp

ηsk(x0) = j|x0|

1`(k) (s = 2, . . . , `(k))

Page 120: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

106 Synthese de retour d’etat

Theoreme 31 (Morin & Samson, 1999) L’algorithme precedent est realisable et toute fonctionu1(x, t) ainsi calculee satisfait les hypotheses du Theoreme 30, avec α := 1/L ou L := maxk `(k) =maxj |Ij |.

Preuve (resumee) : Concernant la mise en œuvre de l’algorithme, le seul point non trivialconcerne la possibilite de choisir les frequences ωs

k telles que 2π/T en soit un diviseur commun.En identifiant ces frequences a des points d’un certain espace vectoriel RN , on peut verifier quela mise en œuvre de l’algorithme de Sussmann et Liu revient a choisir ces points en dehors d’uneunion finie d’ensembles definis par des egalites algebriques. L’ensemble des solutions possibles estdonc ouvert et l’on peut alors toujours choisir ces frequences parmi les nombres rationnels. Dansce cas les ωs

k possedent un diviseur commun ω, et T est alors defini par la relation ω = 2π/T .Notons que T peut bien etre defini a posteriori, apres le choix des ωs

k, car seules les fonctions ηsk

dependent des vI (et donc de T ).Montrons maintenant que u1(x, t) ainsi construite verifie les hypotheses du Theoreme 30.

La periodicite de u1 par rapport a t, ainsi que la propriete associee a l’hypothese i), decoulentdes proprietes v) et vi) de la Proposition 24. Les proprietes associees aux hypotheses ii) et iii)reposent sur la relation suivante (Liu, 1997a, Rem. 2.3) :

0 < |I| ≤ L =⇒ limε→0

∫ T

0uε

I dτI = aI(T, x0) (4.49)

avec aI le coefficient de XI dans la serie de Chen-Fliess associee au systeme etendu (4.48), i.e.avec les notations du chapitre precedent, CF =

∑I aIXI . Il decoule alors de la Proposition 24

que

0 < |I| ≤ L =⇒∫ T

0u1

I dτI = aI(T, x0) + o(x0) (4.50)

Pour tout I, aI(T, x0) = O(x0) car chaque fonction vI(x0) dans (4.48) est lineaire en x0, et lapropriete iii) du Theoreme 30 decoule alors de (4.50). Quand a la propriete ii), elle decoule ausside cette relation, en utilisant le fait que

x0(T ) = Ax0 + o(x0)= x0 +

∑0<|I|≤L

aI(T, x0)XI(id)(x0) + o(x0)

= x0 +∑

0<|I|≤L

(∫ T

0u1

I dτI

)XI(id)(x0) + o(x0)

= x0 +∑0<|I|

(∫ T

0u1

I dτI

)XI(id)(x0) + o(x0)

= x(T ) + o(x0)

ou x0(.) designe la solution du systeme etendu (4.48), et x(.) la solution du systeme (4.47) avecε = 1. La premiere egalite est obtenu par un developpement au premier ordre des solutions de(4.48), pour |x0| petit. La deuxieme provient du developpement en series de Chen-Fliess pour lesysteme etendu (4.48). La troisieme resulte de (4.50). La quatrieme provient du fait que, puisquela propriete i) du Theoreme 30 est satisfaite,

|I| > L =⇒∫ T

0u1

I dτI = o(x0)

Page 121: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation asymptotique par retour d’etat hybride 107

Enfin, la derniere egalite decoule du developpement en series de Chen-Fliess pour le systeme(4.47) controle par u1.

Par rapport a l’algorithme de synthese de retours d’etat homogenes ρ-exponentiels presentedans la Section 4.2.4, l’algorithme ci-dessus presente quelques differences interessantes. Toutd’abord, nous n’avons plus besoin de la condition “ε suffisamment petit” qui correspond a desfrequences elevees et induit generalement des trajectoires presentant des oscillations rapides. Enpratique, l’utilisation de hautes frequences est rarement souhaitable. Un autre aspect positif estque cet algorithme et les commandes qu’il produit sont nettement plus simples que dans le casprecedent. Leur complexite est similaire a celles des commandes en boucle ouverte de Sussmannet Liu, alors que l’algorithme de synthese de commandes homogenes necessite un calcul supple-mentaire, complexe, de termes dependant de l’etat. On ne peut cependant pas en deduire que lescommandes hybrides ainsi obtenues sont, en pratique, toujours meilleures que les retours d’etathomogenes. En premier lieu, nous avons vu dans la premiere partie de ce memoire qu’elles ontaussi des limitations en terme de robustesse. Ceci est liee a la condition iii) du Theoreme 30, quipeut etre tres facilement violee en pratique du fait des erreurs de calcul et des retards d’applica-tion de la commande inherents a toute mise en œuvre physique. Enfin, il est aussi evident quepar leur principe, ces commandes hybrides correspondent a des commandes en boucle ouverte surchaque intervalle [kT, (k+ 1)T ), d’ou une moindre reactivite que celle de retours d’etat continus.

4.3.3 Synthese a partir d’une approximation homogene et exemple

Il n’est pas systematiquement garanti qu’un stabilisateur K(T )-exponentiel remplissant lesconditions du Theoreme 30 pour une approximation homogene (Sh) d’un systeme (S0), et doncrobuste vis-a-vis de dynamiques non-modelisees pour le systeme (Sh), soit encore un stabilisateurK(T )-exponentiel robuste pour (S0) lui-meme. Dans (Morin & Samson, 1999, Sec. 4.2), nousavons cependant montre que cette propriete pouvait etre obtenue en imposant une conditionsupplementaire sur certaines integrales iterees. La condition en question peut, par exemple, etresatisfaite avec l’algorithme precedent en choisissant convenablement la matrice de gain K. Nousrenvoyons a (Morin & Samson, 1999) pour plus de details sur ce point. Nous illustrons ci-dessouscette possibilite en donnant une classe de lois de commande pour les systemes possedant uneapproximation homogene sous forme chaınee.

Proposition 25 Soit (S0) un systeme analytique sur Rn. On suppose que (Sc), le systeme chaınede dimension n, est une approximation homogene de (S0), pour le vecteur de poids r = (1, q, . . . , q+n− 2) ou q ≥ n− 2, et le changement de coordonnees ψ (voir Definition 20 pour cette notation).Soit u ∈ C0(Rn × [0, T ]; R2) definie par

u1(y, t) =1T

[(k1 − 1)y1 + 2πρq(y) sin(ωt)]

u2(y, t) =1T

[(k2 − 1)y2 +n∑

i=3

2i−2(i− 2)!(ki − 1)yi

ρi−2q (y)

cos((i− 2)ωt)] ,(4.51)

avecT = 2π/ω (ω 6= 0) ,

ρq(y) =n∑

j=3

aj |yj |1

q+j−2 , (q ≥ n− 2 , aj > 0) ,

|ki| < 1 , ∀i = 1, . . . , n ,

(4.52)

Page 122: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

108 Synthese de retour d’etat

Alors, la fonction u definie par u(x, t) := u(ψ(x), t) verifie les conditions du Theoreme 30 pourle systeme (S0).

4.4 Stabilisation pratique via les fonctions transverses

Le but de cette section est de presenter nos travaux les plus recents sur l’approche de com-mande par fonction transverse (Morin & Samson, 2001a; Morin & Samson, 2003). On peut etablirune comparaison entre les approches de commande precedentes, utilisant les travaux de Sussmannet Liu, et les approches basees sur les fonctions transverses. Dans le premier cas, les termes insta-tionnaires (necessaires aux proprietes de convergence asymptotique) sont du type ε−αi sin(ωit/ε).Dans le second ces termes sont du type δθi sin θi, ou θi ∈ S1 est une variable exogene. Autrementdit, dans le premier cas on utilise implicitement l’extension dynamique t = 1 du systeme considereet l’on cherche des commandes de la forme u(x, t), alors que dans le second cas, cette extensiondynamique est du type θi = ui (i = m + 1, . . . , N) avec ui une variable libre et θi ∈ S1, et l’oncherche des commandes du type u(x, θm+1, . . . , θN ).

Cette approche faisant actuellement l’objet de differents travaux de notre part, nous nouscontenterons ici d’exposer les resultats generaux de (Morin & Samson, 2001a; Morin & Samson,2003).

4.4.1 Definition et resultat de base

Definition 23 Soient X1, . . . , Xm des champs de vecteurs C∞ sur une variete M de dimensionn. Soit p ∈ N. Une fonction f ∈ C∞(Tp;M) est dite fonction transverse (aux champs devecteurs X1, . . . , Xm) si

∀σ ∈ Tp, spanX1(f(σ)), . . . , Xm(f(σ))+ df(σ)(TσTp) = Tf(σ)M (4.53)

Le resultat principal de (Morin & Samson, 2001a) est le suivant.

Theoreme 32 (Morin & Samson, 2001a) Soient X1, . . . , Xm des champs de vecteurs C∞ surune variete M de dimension n. On suppose que L(X1, . . . , Xm)(x) est de dimension constantedans un voisinage de x0. Alors les deux conditions suivantes sont equivalentes :

1. dim L(X1, . . . , Xm)(x0) = n,

2. il existe p ∈ N tel que, pour tout voisinage U de x0, il existe une fonction f ∈ C∞(Tp;U)transverse aux champs X1, . . . , Xm.

La relation 2 =⇒ 1 est facile a demontrer (on procede par contradiction, et l’on applique letheoreme de Frobenius). La relation 1 =⇒ 2 est beaucoup plus difficile. La preuve de cettepropriete donnee dans (Morin & Samson, 2001a) est basee sur l’utilisation des systemes libres(cf. Section 3.1). Un algorithme de construction de fonctions transverses est aussi donne danscet article, mais il n’est pas vraiment “transparent”. En considerant le cas particulier ou G estun groupe de Lie et les champs X1, . . . , Xm sont invariants a gauche sur G (Morin & Samson,2003), nous avons pu obtenir un resultat plus fort et un algorithme de construction beaucoup plussynthetique. Par ailleurs, c’est pour les systemes sur les groupes de Lie que l’on peut obtenir, viales fonctions transverses, les resultats de stabilisation les plus forts. Notons cependant que leur

Page 123: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation pratique via les fonctions transverses 109

interet n’est nullement limite a ces systemes (cf. e.g. Section 2.4.2 de la Partie I de ce memoire).Notons egalement que pour les systemes sans derive, les systemes sur des groupes de Lie sont dansun sens “generiques”, i.e. tout systeme sans derive satisfaisant la condition de rang en x0 possedeune approximation homogene nilpotente en ce point, qui peut etre “relevee” sur un groupe de Lie(Theoreme 22).

4.4.2 Le cas des systemes sur les groupes de Lie

Tout au long de cette section G represente un groupe de Lie connexe, de dimension n, et g

est son algebre de Lie, identifiee a l’algebre de Lie des champs de vecteurs invariants a gauche surG. Pour les autres notations (relatives aux groupes de Lie) utilisees, voir la section preliminaireau debut de ce memoire.

Definition 24 Soient X1, . . . , Xm ∈ g des champs de vecteurs independants avec L(X1, . . . , Xm) =g. On note uk := Lk(X1, . . . , Xm) et K = mink : uk = g. On appelle base graduee deg associee a X1, . . . , Xm, toute base ordonnee X1, . . . , Xn de g munie de deux applicationsλ, ρ : m+ 1, . . . , n −→ 1, . . . , n telle que :

1. Pour tout k = 1, . . . ,K, uk = spanX1, X2, . . . , Xdim uk.

2. Pour tout k ≥ 2 et dim uk−1 < i ≤ dim uk, Xi = [Xλ(i), Xρ(i)] avec Xλ(i) ∈ ua, Xρ(i) ∈ ub,et a+ b = k.

A toute base graduee de g, on peut associer le vecteur de poids r = (r1, . . . , rn) defini par

ri = k ⇐⇒ Xi ∈ uk \ uk−1 ⇐⇒ dim uk−1 + 1 ≤ i ≤ dim uk (4.54)

Le lemme technique suivant est intuitivement clair.

Lemme 4 Soient X1, . . . , Xm ∈ g des champs de vecteurs independants tels que L(X1, . . . , Xm) =g. Alors,

1. Il existe une base graduee de g associee a X1, . . . , Xm,

2. Le vecteur de poids r defini par (4.54) verifie 1 = r1 = · · · = rm < rm+1 ≤ · · · ≤ rn = Ket, ∀i > m, ri = rλ(i) + rρ(i).

On peut maintenant enoncer le resultat qui precise, pour les systemes sur des groupes de Lie, leTheoreme 32.

Theoreme 33 (Morin & Samson, 2003, Th. 1) Soit G un groupe de Lie et g son algebre de Lie.Soient X1, . . . , Xm ∈ g des champs de vecteurs independants. Alors, les proprietes suivantes sontequivalentes :

1. L(X1, . . . , Xm) = g

2. Pour tout voisinage U de l’element neutre e de G, il existe une fonction f ∈ C∞(Tn−m;U)transverse aux champs X1, . . . , Xm.

Page 124: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

110 Synthese de retour d’etat

De plus, si X1, . . . , Xn est une base graduee de g, il existe des constantes βm+1, . . . , βn, ε0 > 0telles que, pour tout ε ∈ (0, ε0), la fonction fε donnee par

∀θ = (θm+1, . . . , θn) ∈ Tn−m, f ε(θ) := fεn(θn)fε

n−1(θn−1) · · · fεm+1(θm+1) (4.55)

avec fεj : T −→ G definie par

∀θj ∈ T, f εj (θj) := exp

(εrλ(j)

j sin θjXλ(j) + εrρ(j)

j cos θjXρ(j)

); εj := εβj (4.56)

est une fonction transverse.

Par rapport au Theoreme 32, le resultat precedenti) fournit une valeur de p, la dimension de l’espace de definition de fε. Cette valeur p = n−m

est clairement la plus petite possible afin de pouvoir satisfaire la condition (4.53).ii) fournit une expression, (4.55), pour calculer des fonctions transverses (modulo les constantesβm+1, . . . , βn qui ne sont pas precisees). Evidemment, il existe d’autres expressions pos-sibles. Une definition un peu plus generale consiste a introduire dans (4.56) deux parametresεj,1, εj,2 au lieu du seul parametre εj , i.e.

fεj (θj) := exp

(εrλ(j)

j,1 sin θjXλ(j) + εrρ(j)

j,2 cos θjXρ(j)

)Les parametres supplementaires sont utiles dans les applications de commande pour reglerles comportements transitoires. Dans le meme but, il peut aussi etre interessant d’introduiredes variables θi supplementaires (voir e.g. (Morin & Samson, 2004)).

Preuve (resumee) : La preuve consiste principalement a montrer que les fonctions fε definissentbien des fonctions transverses pour un choix adequat des βj et pour ε suffisamment petit. Enutilisant des proprietes classiques du calcul sur les groupes de Lie, on montre tout d’abord lapropriete suivante :

Lemme 5 Il existe des fonctions analytiques vεi,j (i ∈ 1, . . . , n, j ∈ m+ 1, . . . , n) telles que

∂f εj

∂θj(θj) =

n∑i=1

vεi,j(θj)Xi(fε

j (θj)) (4.57)

avec

vεi,j =

O(|εj |ri) ∀io(|εj |ri) si i < j et ri = rj

εrj

j

2+ o(|εj |rj ) si i = j

(4.58)

Ceci permet de montrer, toujours par le calcul, que

Lemme 6 Il existe des fonctions analytiques aεi,j (i ∈ 1, . . . , n, j ∈ m+ 1, . . . , n) telles que

∂f ε

∂θj(θ) =

n∑i=1

aεi,j(θ)Xi(fε(θ)) (4.59)

Page 125: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation pratique via les fonctions transverses 111

avec

aεi,j =

O(|εj |ri) ∀i∑k<ri

O(|εj |k)O(|εj−1|ri−k) + o(|εj |ri) si i < j et ri = rj

εrj

j

2+∑k<rj

O(|εj |k)O(|εj−1|rj−k) + o(|εj |rj ) si i = j

(4.60)

ou εk := (εm+1, . . . , εk) si k = m+ 1, . . . , n, et εm := 0.

Notons que ce lemme serait une consequence directe de (4.57-4.58) si la derivee partielle de fε

par rapport a θj etait egale a la derivee partielle de fεj par rapport a θj (ce qui serait le cas si

G etait un espace vectoriel et si l’operation de groupe etait l’addition). Notons par ailleurs quesi tous les termes O et o dans (4.60) etaient nuls, la propriete de transversalite de fε decouleraitdirectement de (4.59-4.60) et du fait que X1, . . . , Xn est une base de g. Ceci n’etant cependantpas le cas, un autre argument doit etre utilise pour conduire au resultat souhaite.

Lemme 7 Il existe βm+1, . . . , βn, et ε0 > 0, tels que pour (εm+1, . . . , εn) := ε(βm+1, . . . , βn) et0 < ε < ε0,

∀θ ∈ Tn−m, det(aεi,j(θ))i,j=m+1,...,n 6= 0 (4.61)

Notons que, bien que ce lemme ne precise pas de valeurs pour βm+1, . . . , βn et ε0, la preuveindique une facon recursive de les choisir. Independamment de ε0, on peut poser βm+1 := 1 puischoisir pour tout k ≥ m + 1, βk+1 “grand” par rapport a βk afin d’assurer l’inversibilite d’unematrice (k+1−m)×(k+1−m). Une fois les βj choisis, la propriete de transversalite est garantiepour ε0 suffisamment petit.

Remarques sur le calcul de fonctions transverses

Un inconvenient de l’expression (4.56) est qu’elle necessite d’integrer des equations differen-tielles et que cette integration n’a, dans le cas general, aucune raison de conduire a des fonctionsexprimables comme la somme ou le produit de fonctions elementaires composees. On peut enfait se ramener a un cas plus simple permettant de calculer des fonctions transverses pour toutefamille X1, . . . , Xm de champs de vecteurs sur une variete M (pas necessairement un groupede Lie), des lors qu’elle satisfait la condition de rang en un point x0. La methode est constitueede quatre etapes.

1. L’algorithme d’approximation homogene pour une famille X1, . . . , Xm de champs de vec-teur satisfaisant la condition de rang en un point x0 (voir Annexe A.2.1) permet de calculer,pour une dilatation de poids r, une approximation homogene nilpotente et commandableY1, . . . , Ym du systeme sans derive (S0) associe a X1, . . . , Xm,

2. L’algorithme de relevement de champs nilpotents (voir Annexe A.2.2) permet de calcu-ler un relevement des champs Y1, . . . , Ym de l’approximation homogene a des champsY1, . . . , Ym nilpotents et invariants a gauche sur un groupe de Lie.

3. On peut calculer des fonctions fε transverses aux champs Y1, . . . , Ym a partir du Theoreme33. Du fait de la nilpotence de la famille Y1, . . . , Ym, les fε

j correspondant peuvent etre

Page 126: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

112 Synthese de retour d’etat

obtenues explicitement, par un calcul algebrique. De plus, la projection P fεj des fonctions fε

j

sur l’espace initial (espace d’etat associe aux champs Yi), fournit des fonctions transversespour la famille Y1, . . . , Ym.

4. Par application de (Morin & Samson, 2001a, Prop. 2), l’expression des fonctions P fεj dans

les coordonnees de depart (associees aux champs Xi) sont des fonctions transverses auxchamps X1, . . . , Xm, si ε est suffisamment petit.

4.4.3 Application a la commande

Considerons un systeme de commande

g =m∑

i=1

uiXi(g) + P (g, t) (4.62)

avec g ∈ G un groupe de Lie connexe de dimension n, X1, . . . , Xm ∈ g des champs de vecteurstels que L(X1, . . . , Xm) = g, et P ∈ C0(G×R;TG). L’interet de la notion de fonction transversepour la commande du systeme (4.62) decoule de la propriete suivante.

Proposition 26 Soit f ∈ C1(Tp;G). Alors,i) le long de toute solution de (4.62), et de toute courbe θ(.) sur Tp de classe C1,

z = drf(θ)−1(g)dlz(f(θ))

(m∑

i=1

uiXi(f(θ))− df(θ)θ + dlz−1(g)P (g, t)

)(4.63)

avec z := gf(θ)−1 et l (resp. r) la translation a gauche (resp. a droite) sur G, i.e. lg(h) =rh(g) = gh.

ii) si de plus f est une fonction transverse a X1, . . . , Xm, et Z est un champ de vecteurs surG, tout retour d’etat dynamique (u, θ)(θ, g, t) tel que

m∑i=1

ui(θ, g, t)Xi(f(θ))− df(θ)θ(θ, g, t) = dlz−1(g)(drf(θ)(z)Z(z)− P (g, t)

)(4.64)

entraıne, le long des solutions du systeme (4.62) controle,

z = Z(z) (4.65)

La preuve de (4.63) s’obtient facilement en differentiant l’egalite zf = g et en utilisant desrelations classiques sur les groupes de Lie (i.e. (dlz(f))−1 = dlz−1(g), (drf (z))−1 = drf−1(g). Lapreuve de (4.65) est immediate, avec la propriete de transversalite qui garantit l’existence d’unesolution (u, θ) a l’equation (4.64). Cette solution est unique lorsque p = n−m.

En corollaire de la proposition precedente on a le resultat suivant.

Corollaire 2 Si e est un equilibre asymptotiquement stable de (4.65), alors,i) pour toute valeur initiale (g0, θ0) telle que z0 = g0f(θ0)−1 appartient au bassin d’attraction

de Z, la solution de (4.62) avec le controle (u, θ) defini par (4.64) converge asymptotique-ment vers f(Tp),

Page 127: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Stabilisation pratique via les fonctions transverses 113

ii) si de plus θ0 = arg minθ d(g, f(θ)), avec d une distance sur G invariante a gauche, alorsl’ensemble f(Tp) est asymptotiquement stable pour (4.62).

Le principal interet du resultat precedent est qu’il garantit, sous reserve de la stabilite asymp-totique de e pour le systeme (4.65), la convergence de g vers l’ensemble f(Tp), voir meme lastabilite asymptotique de cet ensemble, quelque soit la perturbation P , a condition bien sur dela connaıtre. Par contre, le comportement asymptotique de la variable θ reste a priori inconnu.Si P (g(t), t) tend asymptotiquement vers zero lorsque t tend vers l’infini, il decoule de (4.64) queθ(t) va aussi tendre asymptotiquement vers zero. Si de plus a la fois P (g(t), t) et z(t) tendentexponentiellement vers zero, alors θ(t) tendra vers une valeur finale constante. En dehors de cescas particuliers, l’analyse asymptotique de θ(t) devra etre faite au cas par cas, via l’etude de lazero dynamique z = e du systeme.

Le choix de θ0 donne par la condition ii) est en general difficile a calculer. Ce choix n’estcependant pas le seul permettant de garantir la stabilite asymptotique de l’ensemble f(Tp).Pour des systemes particuliers, des expressions plus explicites peuvent parfois etre proposees.L’obtention d’une expression explicite generale reste un probleme ouvert.

Stabilisation pratique de trajectoires de reference generales

La Proposition 26 peut etre utilisee directement pour la stabilisation asymptotique de trajec-toires de reference gr(.) generales. Considerons en effet une courbe gr(.) sur G, de classe C1. Ildecoule facilement de l’invariance des champs de vecteurs Xi que la variable d’erreur g := g−1

r gsatisfait l’equation suivante :

˙g =m∑

i=1

uiXi(g)− drg(e)(dlgr(e))−1gr (4.66)

Puisque le systeme (4.66) est de la forme (4.62), avec

P (g, t) := −drg(e)(dlgr(e))−1gr

la Proposition 26 et son Corollaire 2 s’appliquent directement, de sorte que la connaissance d’unefonction transverse f et d’un champ Z asymptotiquement stable sur G permet d’obtenir la conver-gence de z vers e, ce qui implique la convergence asymptotique de d(g(t), gr(t)) − d(f(θ(t)), e)vers zero pour d une distance sur G invariante a gauche. Si de plus fε est une famille de fonctionstransverses telles que maxθ d(fε(θ), e) −→ 0 lorsque ε −→ 0 (comme par exemple les fonctionsfε du Theoreme 33), alors

limε−→0

limt−→+∞

d(gε(t), gr(t)) = 0

avec gε la solution du systeme controle associe a la fonction transverse fε. L’analogie de cettepropriete avec l’approximation de trajectoires via les commandes de Sussmann et Liu est evidente.Outre le fait que les fonctions transverses permettent de calculer des retours d’etat, ce que l’onobtient de plus par rapport a la solution de Sussmann et Liu, est la convergence sur un intervallede temps infini et l’uniformite vis-a vis des trajectoires de reference.

Page 128: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis
Page 129: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Conclusion et perspectives

Apres plus d’une decennie de travaux sur le sujet, le probleme de stabilisation de trajectoirespour les systemes critiques n’est encore que partiellement compris. Toutefois, certains resultatsont permis de mieux cerner ce qu’il est possible/impossible de realiser. Rappelons en particulierles points suivants, qui illustrent la specificite de ces systemes :

i) impossibilite, pour de nombreux systemes critiques, de stabiliser asymptotiquement unpoint fixe par du retour d’etat autonome u(x) regulier (Brockett, 1983),

ii) existence, pour la plupart des systemes commandables, de retours d’etat instationnairesperiodiques u(x, t) continus qui stabilisent asymptotiquement un point fixe (Coron, 1995),

iii) impossibilite d’obtenir, par de tels retours d’etat, une convergence exponentielle lorsquela commande est Lipschitz-continue par rapport a la variable d’etat et, (tres probablement)impossibilite d’obtenir de facon robuste un tel taux de convergence par des retours d’etatseulement continus,

iv) non-existence, pour de nombreux systemes critiques, de retours d’etat reguliers qui stabi-lisent asymptotiquement toutes les trajectoires admissibles du systeme (Lizarraga, 2004).

Ces proprietes suggerent que l’objectif de stabilisation asymptotique, pour les systemes critiques,est peu realiste d’un point de vue pratique. Elles remettent aussi en question l’interet qu’il peuty avoir, dans cette perspective, a utiliser des retours d’etat essentiellement non-lineaires en lavariable d’etat (e.g. retours d’etat homogenes non-lineaires, retours d’etat synthetises via destechniques de type variete-centre, etc.). En accord avec ce constat, nous avons principalementtravaille ces dernieres annees sur une approche de commande dont l’objectif est de garantir unestabilite pratique (Morin & Samson, 2003). S’il est encore un peu tot pour evaluer la porteede cette approche d’un point de vue pratique, elle apporte toutefois des perspectives nouvellesvis-a-vis des difficultes que nous avons mentionne precedemment.

Quelles sont les perspectives de ces travaux ? Commencons par mentionner quelques etudesen cours, dans le cadre de travaux de these ou de stage. Ces travaux concernent tous l’approchepar fonctions transverses.

i) Application au probleme de suivi d’un autre vehicule susceptible de faire des manœuvres.C’est le sujet de these de G. Artus, dans un cadre principalement experimental. Des valida-tions de l’approche sur un robot de type unicycle ont deja eu lieu (Artus et al., 2003; Artuset al., 2004). L’extension a un vehicule de type voiture est en cours de developpement.

ii) Commande d’un bras manipulateur monte sur une base mobile non-holonome. C’est lesujet de these de M. Fruchard. Ce travail comporte une partie methodologique (commandecoordonnee de la base mobile et du bras), et doit aussi deboucher sur des experimentations.

iii) Commande referencee capteur d’un robot non-holonome. Il s’agit du travail de these de M.Maya Mendez qui vient de debuter. Pour les systemes holonomes, la commande referencee

Page 130: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

116 Conclusion et perspectives

capteurs presente des interets en terme de robustesse (marge de robustesse importante vis-a-vis de dynamiques non-modelisees, moindre sensibilite aux bruits de mesure du fait del’absence de reconstruction a partir des mesures). Il s’agit de voir si cette approche decommande peut aussi etre utile a la commande des systemes non-holonomes.

iv) Stabilisation de trajectoires pour un robot mobile avec remorques a attaches decentrees.Il s’agit du sujet de stage de T. Alfaro. Outre l’interet pratique qu’il peut y avoir a com-mander de tels systemes, ce probleme est aussi l’occasion de mieux evaluer les proprietesde robustesse de l’approche.

Au dela de ces etudes en cours, les problemes suivants nous semblent potentiellement interes-sants.

i) Stabilisation de systeme avec derive. L’approche par fonctions transverses n’est pas limiteeaux seuls systemes sans derive. Elle permet de stabiliser pratiquement un point fixe d’unsysteme possedant un terme de derive arbitraire des lors que la commandabilite du systemeest assuree par les seuls champs de commande. Cependant, lorsque cette condition n’estpas satisfaite, son utilisation n’est pas systematique. Savoir ce qu’une telle approche peutapporter de plus que les retours d’etat existants reste un probleme ouvert.

ii) Autres methodes de synthese de stabilisateurs pratiques. L’approche par fonctions trans-verses est une methode possible pour obtenir la stabilisation pratique d’un point, maisce n’est pas la seule. Jusqu’a present, il existe tres peu de methodes de synthese de telsstabilisateurs (si l’on exclut bien sur les stabilisateurs asymptotiques dont nous avons vules limitations). Dans le but d’obtenir des commandes plus simples, il paraıt interessantd’explorer d’autres methodes de synthese de tels retours d’etat.

iii) Liens avec la commande lineaire. Les retours d’etat synthetises via l’approche par fonc-tions transverses sont typiquement des retours d’etat lineaires (variants dans le temps),ou plus precisement des retours d’etat affines par rapport aux variables d’etat. Cette af-firmation est evidemment mathematiquement abusive lorsque l’espace d’etat du systemeconsidere n’est pas un espace vectoriel ; mais d’un point de vue local elle a un sens. Cecisuggere des connections possibles avec l’automatique des systemes lineaires. En particu-lier, les questions suivantes meritent d’etre considerees : les techniques d’optimisation etde commande robuste issues de l’automatique lineaire peuvent-elles etre utilisees dans lecadre de l’approche par fonctions transverses ? peut-on faire le lien entre les commandesobtenues via cette approche et les commandes basees sur le linearise du systeme le longde trajectoires de reference ? Etablir des connections avec les methodes de linearisation parextension dynamique (platitude) semble aussi pertinent dans la mesure ou l’approche parfonctions transverses permet de“lineariser” le systeme sans singularites. En contrepartie, onobtient seulement une linearisation approchee (linearisation de la dynamique de la variablez dans (4.65) et non pas de celle de la variable initiale g).

Page 131: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Annexe A

Preuves et complements

A.1 Resultats de la Partie I

A.1.1 Extensions du theoreme de Brockett (Section 2.2.1)

Lorsque la classe des retours d’etat possibles est etendue en permettant des retours d’etatdiscontinus, il est necessaire de preciser le sens mathematique qu’il est possible de donner auxsolutions du systeme commande, ainsi que celui donne a la propriete de stabilisation asymptotique.En ce qui concerne le premier point les solutions definies au sens de (Filippov, 1964) constituentune possibilite (pour une motivation de ce choix dans le contexte de la stabilisation, voir (Coron& Rosier, 1994)).

Definition 25 Soitx = f(x) (A.1)

une equation differentielle definie sur un voisinage U ⊂ Rn de x = 0, avec f localement bornee.On note

Kf(x) :=⋂δ>0

⋂µ(N)=0

cof(Bδ(x)\N

avec co E le plus petit ensemble convexe et ferme contenant E, et µ la mesure de Lebesgue surRn. Alors

1. On appelle solution au sens de Filippov de (A.1) toute fonction x(t) definie sur unintervalle I ⊂ [0,+∞), absolument continue sur tout sous-intervalle compact de I, et telleque x ∈ Kf(x(t)) presque-partout sur I.

2. On dit que x = 0 est localement asymptotiquement stable pour (A.1) sii) pour tout ε ≥ 0, il existe δ > 0 telle que toute solution au sens de Filippov de (A.1) avec|x(0)| < δ est definie sur [0,+∞) et

|x(0)| < δ =⇒ |x(t)| < ε, ∀t ∈ [0 +∞)

ii) il existe η > 0 telle que toute solution au sens de Filippov de (A.1) avec |x(0)| < η estdefinie sur [0,+∞) et, pour toute solution x(t),

|x(0)| < η =⇒ |x(t)| −→ 0 lorsque t −→ 0 (A.2)

Page 132: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

118 Preuves et complements

Le resultat suivant fournit une premiere obstruction a la stabilisabilite des systemes singulierspar des retours d’etat discontinus.

Theoreme 34 (Coron & Rosier, 1994) On suppose que x = 0 est un point d’equilibre du systeme(S) sur Rn et que les champs de vecteur Xi sont C0. Soit u(x) un retour d’etat mesurable,localement borne, et tel que

sup. ess.|u(x)| : |x| < ε −→ 0 lorsque ε −→ 0 (A.3)

Alors, si u(x) rend l’origine du systeme (S) localement asymptotiquement stable, il existe aussiun retour d’etat C0 qui rend l’origine de ce systeme localement asymptotiquement stable.

Une consequence immediate de ce resultat est que tout systeme du type (S) qui ne satisfaitpas la condition necessaire de Brockett ne peut etre stabilise par du retour d’etat u(x) mesurableet localement borne satisfaisant (A.3). Cette derniere condition est toutefois assez forte car elleimplique une sorte de continuite a l’origine. Lorsque l’on se limite aux systemes qui ne satisfontpas la condition de Brockett, il est possible de supprimer cette hypothese. Comme ceci est indiquedans (Bacciotti & Rosier, 2001, Sec. 1.2 et Th. 2.13), cela decoule du resultat de (Ryan, 1994).

Theoreme 35 On suppose que x = 0 est un point d’equilibre du systeme (S) sur Rn et queles champs de vecteur Xi sont C0. Une condition necessaire pour qu’il existe un retour d’etatmesurable et localement borne u(x) qui rend l’origine du systeme (S) localement asymptotiquementstable est que pour tout voisinage U de 0 ∈ Rn, X(U ×Rm) contient un voisinage de 0 ∈ Rn avecX(x, u) := X0(x) +

∑i uiXi(x).

Remarque 10 La notion de stabilite asymptotique utilisee dans (Ryan, 1994) est un peu plusforte que celle de la Definition 25 puisqu’elle suppose l’equi-attractivite de x = 0, i.e. le Point 2ii) de la Definition 25 est remplace par :

“il existe η > 0 telle que toute solution au sens de Filippov de (A.1) avec |x(0)| < η est definiesur [0,+∞) et, pour tout ε > 0, il existe T > 0 tel que

|x(0)| < η =⇒ |x(t)| ≤ ε si t ≥ T

pour toute solution x(.) au sens de Filippov.”C’est donc avec cette definition qu’il faut comprendrele Theoreme 35. Notons enfin que cette propriete d’equi-attractivite correspond a la proprieted’attractivite de la Definition 4.

A.1.2 Preuve de la Proposition 14 (Section 2.3.2)

Commencons par considerer le systeme d’erreur linearise. Apres bouclage par la commande,on obtient le systeme suivant ξ = A(t)ξ avec

A(t) := (ur1A1(ζr) +BK)(t) =

−k1|ur

1| ur1ζr − k1

2k2ζr|ur

1| 0−ur

1ζr 0 ur1 0

−k1ζr|ur1| 0 − k1

2k2ζ2r |ur

1| ur1

2k2ur1ζr −2k2k4|ur

1| −ur1(2k2 + k3

2 ) −k4|ur1|

Page 133: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Resultats de la Partie I 119

(pour simplifier les expressions, la variable t est omise dans les termes matriciels). Avec z :=ξ4 + 2k2ξ2, notons ξz := (ξ1, ξ2, ξ3, z) qui definit un changement de variable lineaire. On deduitde l’expression precedente que

ξz =

−k1|ur

1| ur1ζr − k1

2k2ζr|ur

1| 0−ur

1ζr 0 ur1 0

−k1ζr|ur1| −2k2u

r1 − k1

2k2ζ2r |ur

1| ur1

0 0 −ur1

k32 −k4|ur

1|

ξz (A.4)

Soit V la fonction definie positive donnee par

V (ξz) =12

(ξ21 + ξ22 +

12k2

ξ23 +z2

k2k3

)(A.5)

La derivee de V le long des solutions du systeme (A.4) est alors donnee par

V = −|ur1|k4

k2k3z2 − k1|ur

1|(ξ1 +1

2k2ζrξ3)2 ≤ 0 (A.6)

La stabilite de l’origine du systeme linearise decoule directement de cette inegalite. La preuve deconvergence asymptotique vers zero des solutions est similaire a celle donnee ci-dessous pour laProposition 15.

Montrons maintenant la stabilite asymptotique locale pour le systeme d’erreur non-lineairesous la condition supplementaire que ur

1(t) est de signe constant. Nous donnons la preuve dansle cas ou ur

1(t) ≥ 0 ; le cas ur1(t) ≤ 0 se deduisant sans difficulte du precedent. Nous procedons en

deux etapes. La premiere partie consiste a synthetiser une fonction de Lyapounov stricte pour lesysteme d’erreur linearise. Dans la deuxieme etape, cette fonction de Lyapounov est utilisee pourmontrer la stabilite asymptotique locale du systeme non-lineaire.

Etape 1 : SoitV (ξz) := V (ξz) + α3/2ξ2ξ3 + αξ3z (A.7)

Il decoule de (A.5) que pour α suffisamment petit, V est une fonction definie positive. Montronsque c’est une fonction de Lyapounov stricte pour le systeme d’erreur linearise controle si α > 0est choisi suffisamment petit. Puisque ur

1(t) ≥ 0, on deduit de (A.4) que

ξz = ur1

−k1 ζr − k1

2k2ζr 0

−ζr 0 1 0−k1ζr −2k2 − k1

2k2ζ2r 1

0 0 −k32 −k4

ξz (A.8)

Par un calcul fastidieux mais direct, on montre que la derivee de V le long des solutions de (A.8)est donnee par

˙V = V + ur1

(−2α3/2k2ξ

22 − α

k3

2ξ23 +R(ξz, ζr)

)(A.9)

avec

R(ξz, ζr) = (ξ1 +1

2k2ζrξ3)

(−k1ζr(α3/2ξ2 + αz)− α3/2ζrξ3

)− 1

2k2ζrξ3

(−k1ζr(α3/2ξ2 + αz)− α3/2ζrξ3

)−2αk2ξ2z + (α3/2ξ2 + αz)(− k1

2k2ζ2r ξ3 + z) + α3/2ξ23 − αk4ξ3z

(A.10)

Page 134: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

120 Preuves et complements

On deduit de (A.6) et (A.9) que

˙V = −ur1W (ξz) + ur

1R(ξz, ζr)

avecW (ξz) :=

k4

k2k3z2 + k1(ξ1 +

12k2

ζrξ3)2 + 2α3/2k2ξ22 + α

k3

2ξ23 (A.11)

Par ailleurs, en utilisant l’inegalite triangulaire pour chaque terme de (A.10), et le fait que ζr estbornee par hypothese, on peut montrer que pour α suffisamment petit, ‖R(ξz, ζr)‖ ≤ W (ξz)/2,et donc que

˙V ≤ −ur1W (ξz)/2 (A.12)

Etape 2 : Le systeme d’erreur (2.18) peut s’ecrire

ξ = (ur1A1(ζr)ξ +Bv) + ur

1

cos θ − 1sin θ − θ

00

+ u1

cos θ − 1

sin θζ0

avec A1 et B les matrices associees au linearise. On a donc

ξ = (ur1A1(ζr)ξ +Bu) + ur

1O(ξ2) + u1O(ξ)

Derivons la fonction V definie par (A.7) le long des solutions de ce systeme controle par le retourd’etat lineaire v = K(t)ξ. Etant donne que ur

1A1(ζr)ξ + Bu correspond a la partie lineaire de(2.18) on a, d’apres (A.12),

˙V ≤ −ur1W (ξz)/2 +

∂V

∂ξ(ξ)(ur

1O(ξ2) +K1(t)ξO(ξ))

avec K1(t) la premiere ligne de K(t). En utilisant l’expression (2.20) de cette matrice et le faitque V est une fonction quadratique de ξ, on deduit de l’inegalite precedente que

˙V ≤ −ur1W (ξz)/2 + ur

1(O(ξ3) + |ζr(t)|O(ξ3))

Puisque par hypothese ζr est une fonction bornee, il decoule de cette inegalite et de (A.11) quepour une constante M ,

˙V ≤ −ur1M‖ξ‖2 + ur

1O(ξ3)

Ainsi, pour ξ suffisamment petit, il existe une constante c > 0 telle que

˙V ≤ −cur1V

Puisque ur1 est supposee positive, la stabilite asymptotique locale de ξ = 0 est assuree des lors

que ∫ t

0ur

1(s) ds −→ +∞ lorsque t −→ +∞

Page 135: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Resultats de la Partie I 121

A.1.3 Preuve de la Proposition 15 (Section 2.3.3)

La preuve consiste en deux etapes. La premiere etape consiste a etablir la proposition dansun systeme de coordonnees adequat. La deuxieme partie consiste simplement a recalculer lacommande dans les coordonnees de depart.

Etape 1 : On effectue tout d’abord le changement de variable ξ 7−→ ξz := (ξ1, ξ2, ξ3, z) avec zdefinie par (2.23). On note egalement w2 := z. Puisque le systeme d’erreur (2.18) est donne par

ξ =

ur

1(cos ξ3 − 1 + ξ2ζr) + u1 cos ξ3ur

1(sin ξ3 − ξ1ζr) + u1 sin ξ3ur

1(ζ − ζr) + u1ζu2

on a dans les nouvelles coordonnees ξz

ξz =

ur

1(cos ξ3 − 1 + ξ2ζr) + u1 cos ξ3ur

1(sin ξ3 − ξ1ζr) + u1 sin ξ3ur

1z − 2k2ur1

(−ξ1 sin ξ3

2 + ξ2 cos ξ32

)cos3 ξ3

2 + u1ζ

w2

(A.13)

On poseu1 = −k1|ur

1|(ξ1 cos ξ3 + ξ2 sin ξ3 + ζ

k2(1 + tan2 ξ3

2 ) tan ξ32

)w2 = −k3u

r1(1 + tan2 ξ3

2 ) tan ξ32 − k4|ur

1|z(A.14)

La derivee de la fonction V definie par

V (ξz) :=12

(ξ21 + ξ22 +

2k2

tan2 ξ32

+1

k2k3z2

)(A.15)

le long des solutions de (A.13) est donnee par

V = −|ur1|k4

k2k3z2 − k1|ur

1|(ξ1 cos ξ3 + ξ2 sin ξ3 +

ζ

k2(1 + tan2 ξ3

2) tan

ξ32

)2

(A.16)

Puisque V est non-positive, on en deduit la stabilite de l’origine du systeme boucle, et le faitque la commande (u1, w2) est bien definie le long des solutions (i.e. notons en particulier quetan ξ3

2 est borne, et ζ l’est egalement d’apres (2.23) puisque z est borne et ζr est aussi bornepar hypothese). Supposons maintenant que ur satisfait les hypotheses supplementaires de laproposition, et montrons la convergence asymptotique des solutions vers l’origine. La preuve suitcelle de (Morin & Samson, 2001b, Prop. 2.4). Puisque V est decroissante le long des trajectoiresdu systeme boucle et qu’elle est definie positive, elle converge vers une valeur Vlim. Il s’agit demontrer que Vlim = 0. Par la decroissance de V et le fait que ur

1 est bornee, u1 et w2 donnees par(A.14) sont bornees. On en deduit que chaque composante de ξz dans (A.13) est bornee. Chaquecomposante de ξz est donc non seulement bornee mais aussi unif. (uniformement) continue. Parhypothese, ur

1 est aussi unif. continue, et ζ l’est aussi d’apres (2.23) car les composantes de ξz lesont et, par les hypotheses de la proposition, ζr l’est aussi. V est donc unif. continue et on deduitdu Lemme de Barbalat, puisque V tend vers une constante, que V tend vers zero, d’ou

limt−→+∞

ur1z = lim

t−→+∞ur

1

(ξ1 cos ξ3 + ξ2 sin ξ3 +

1k2ζ(1 + tan2 ξ3

2) tan

ξ32

)= 0 (A.17)

Page 136: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

122 Preuves et complements

Puisque z = w2, on deduit de (A.14) que

d

dt((ur

1)2z) = 2ur

1ur1z + (ur

1)2(−k3u

r1(1 + tan2 ξ3

2) tan

ξ32− k4|ur

1|z)

ce qui implique, en utilisant (A.17) et l’hypothese de bornitude de ur1 et ur

1, que

limt−→+∞

d

dt((ur

1)2z) + k3(ur

1)3(1 + tan2 ξ3

2) tan

ξ32

= 0 (A.18)

La fonctionk3(ur

1)3(1 + tan2 ξ3

2) tan

ξ32

est unif. continue car de derivee bornee, et d’apres (A.17) le terme (ur1)

2z tend vers zero. Ondeduit donc, par application d’une version tres legerement modifiee du Lemme de Barbalat, que

limt−→+∞

d

dt((ur

1)2z) = 0

d’ou, d’apres (A.18),

limt−→+∞

(ur1)

3 tanξ32

(1 + tan2 ξ32

) = 0 = limt−→+∞

ur1 tan

ξ32

(A.19)

En utilisant le fait que ζ est bornee (voir plus haut), on deduit de (A.17), (A.19), et de la bornitudede chaque variable d’erreur, que

limt−→+∞

ur1ξ1 = 0 (A.20)

Finalement,

d

dt((ur

1)2 tan

ξ32

) = 2ur1u

r1 tan

ξ32

+12(ur

1)2(1 + tan2 ξ3

2) (ur

1(ζ − ζr) + u1ζ)

Il decoule donc de (A.14), (A.17), (A.19), et du fait que ζ est bornee, que

limt−→+∞

d

dt((ur

1)2 tan

ξ32

)− 12(ur

1)3(1 + tan2 ξ3

2)(ζ − ζr) = 0 (A.21)

Le terme(ur

1)3(1 + tan2 ξ3

2)(ζ − ζr)

est unif. continu car de derivee bornee, et d’apres (A.19), le terme

(ur1)

2 tanξ32

tend vers zero d’ou l’ on deduit, en appliquant une derniere fois une version du Lemme de Barbalat,que

limt−→+∞

d

dt((ur

1)2 tan

ξ32

) = 0

et donc, par (A.21),

limt−→+∞

(ur1)

3(1 + tan2 ξ32

)(ζ − ζr) = 0 = limt−→+∞

ur1(ζ − ζr) (A.22)

Page 137: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Resultats de la Partie I 123

On deduit de (2.23), (A.17), (A.20), (A.22), et de la bornitude de tan(ξ3/2), que

limt−→+∞

ur1ξ2 = 0 (A.23)

Par consequent, il decoule de (A.15), (A.17), (A.19), (A.20), et (A.23), que

limt−→+∞

(ur1V )2 = 0 = lim

t−→+∞(ur

1Vlim)

Puisque par hypothese ur1 ne tend pas vers zero, on conclut que Vlim = 0.

Etape 2 : Elle consiste simplement a calculer (u1, u2) a partir de (A.14) et des relations

u1 = u1 − ur1

w2 = u2 − ur2 + d

dt

(2k2 cos3 ξ3

2

(−ξ1 sin ξ3

2 + ξ2 cos ξ32

))A.1.4 Preuve du Lemme 2 (Section 2.4.2)

Nous commencons par etablir le deuxieme point. Par la Definition 15 d’une fonction transverse,et par definition des champs de commande du systeme chaıne, f ∈ C∞(T2; R4) est une fonctiontransverse pour ce systeme si et seulement si

∀α ∈ T2, Det

1 ∂1f1(α) ∂2f1(α)f2(α) ∂1f3(α) ∂2f3(α)f3(α) ∂1f4(α) ∂2f4(α)

6= 0 (A.24)

avec ∂ifj := (∂fj)/(∂αi). La condition (A.24) est equivalente a

∀α ∈ T2, Det(∂1f3(α)− f2(α)∂1f1(α) ∂2f3(α)− f2(α)∂2f1(α)∂1f4(α)− f3(α)∂1f1(α) ∂2f4(α)− f3(α)∂2f1(α)

)6= 0 (A.25)

Avec f = fε donnee par (2.37), la condition precedente devient

∀α ∈ T2, Det(

−η1

2 η3 sinα2 − η1η2 cosα1 cosα2

−η1

6 sinα1η2η3

2 + η3 sinα1 sinα2 − η1η2

4 sin 2α1 cosα2

)6= 0 (A.26)

Apres quelques developpements, on deduit de (A.26) la condition suivante :

∀α ∈ T2, −η1

24(6η2η3 + 8η3 sinα1 sinα2 − η1η2 sin 2α1 cosα2) 6= 0

Il est alors facile de verifier que cette condition est bien satisfaite lorsque les ηi verifient (2.36).Etablissons maintenant la premiere propriete du Lemme. Elle decoule du resultat plus general

suivant.

Proposition 27 Soit un systeme (S0) sur une variete M . On suppose qu’il existe un changementde variables d’etat et de commande(

qu

)7−→

(zv

):=(ϕ(q)ψ(q)u

)avec ϕ un diffeomorphisme de U ⊂M dans ϕ(U) ⊂ Rn et ψ(q) une matrice inversible pour toutq ∈ U , qui transforme (S0) en (Sc), le systeme chaıne de dimension n. Alors, si f , a valeur dansϕ(U), est une fonction transverse pour le systeme (Sc), f := ϕ−1(f) est une fonction transversepour (S0).

Page 138: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

124 Preuves et complements

Preuve de la proposition : Puisque le changement de coordonnees (q, u) 7−→ (z, v) transforme(S0) en (Sc), on a

∀q ∈ U ,(X1(ϕ(q)) X2(ϕ(q))

)= dϕ(q) (X1(q) X2(q)) (ψ(q))−1

avec X1 et X2 les deux champs associes au systeme chaıne. Par definition de f , on a donc

(X1(f) X2(f)

∂f

∂θ1· · · ∂f

∂θp

)= (dϕ(f))−1

(X1(f) X2(f)

∂f

∂θ1· · · ∂f

∂θp

)(ψ(f) 0

0 In−m

)avec In−m la matrice identite sur Rn−m. Il decoule des proprietes de ϕ et ψ, et de l’hypothese detransversalite de f , que les deux membres de l’egalite precedente sont des matrices de rang plein.Ceci conclut la preuve de cette proposition.

Revenons a la preuve de la Propriete du Lemme. Elle decoule directement de la proposi-tion precedente, avec (S0) le modele cinematique (2.7) de la voiture, (Sc) le systeme chaıne dedimension quatre, et ϕ et ψ definis sur U := R2 × (−π/2;π/2)× R par

ϕ(q) := (x,ζ

cos3 θ, tan θ, y)′ ; v := (u1 cos θ,

u2

cos3 θ+ 3

ζ sin θcos4 θ

u1ζ)′

ou q = (x, y, θ, ζ).

A.1.5 Preuve de la Proposition 16 (Section 2.4.2)

Commencons par etablir le point 1. On deduit de (2.30) et (2.32) que le long des trajectoiresdu systeme controle

z =

−k1z1−k2z2

−2k3 tan(z3/2)−k4z4

+ u1A(z, f)C(z) (A.27)

On deduit de (2.31) que la derniere composante du vecteur A(z, f)C(z) est nulle de sorte que, lelong de toute trajectoire du systeme controle,

|z4(t)| ≤ e−k4t|z4(0)| (A.28)

Cette inegalite implique, en utilisant (2.31) et le fait que la fonction A(z, f) est bornee, que

|A(z(t), f(α(t)))C(z(t))| ≤ c0e−k4t|z4(0)| (A.29)

pour une constante c0. Soit z := (z1, z2, tan(z3/2), z4)′. On deduit de (A.27) que

˙z =

−k1z1 + u1(A(z, f)C(z))1−k2z2 + u1(A(z, f)C(z))2

−k3(1 + z23)z3 + 1

2(1 + z23)u1(A(z, f)C(z))3

−k4z4

(A.30)

D’apres (2.31), B(z) est borne, et le calcul de (A(z, f))−1 montre que ce terme est egalementborne. On deduit donc de (2.29), (2.32), et de l’hypothese |P (ξ, t)| ≤ αP |(ξ1, ξ2)|+ βP , que

|u1| ≤ c1(|z|+ |z|+ c2) (A.31)

Page 139: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Resultats de la Partie I 125

(pour d’autres constantes c1, c2) et en utilisant la definition de z, l’inegalite precedente impliqueque

|u1| ≤ c3(|z|+ c4) (A.32)

Considerons maintenant la fonction

V (z) :=14(z4

1 + z42 + z4

4) +12z23 (A.33)

D’apres (A.29) et (A.31), la derivee de V le long des solutions de (A.30) verifie l’inegalite suivante :

V (z) ≤ −kW (z) + c5|u1|e−k4t|z4(0)|(|z1|3 + |z2|3 + |z3|(1 + z23)) (A.34)

avec k := minki etW (z) := z4

1 + z42 + +z4

4 + z23(1 + z2

3) (A.35)

L’inegalite (A.32) implique d’autre part que |u1| ≤ c6(W 1/4 + c7) de sorte que l’on deduit de(A.34) que

V (z) ≤ −kW (z) + c8e−k4t|z4(0)|(W 1/2 +W 3/4 +W )(z)

≤ −kW (z) + ce−k4t|z4(0)|W (z) + ce−k4t|z4(0)|(A.36)

ou la derniere inegalite decoule de l’inegalite de Young, i.e.

Wα ≤ 1pWαp +

1q

avec1p

+1q

= 1

La stabilite asymptotique locale du point d’equilibre z = 0 decoule de (A.36). Le fait que lebassin d’attraction de ce point d’equilibre contienne R2× (−π, π)× (−δ, δ) avec δ > 0 en decouleegalement directement. Il reste a montrer que pour p = 2, δ −→ +∞ lorsque k4 −→ +∞.Cette propriete decoulera egalement de (A.36) a condition de montrer que, lorsque k4 −→ +∞,l’ensemble des conditions initiales pour lesquelles les solutions sont definies pour tout t ≥ 0 tendvers R2 × (−π, π)× R. Cette propriete repose sur le fait que lorsque p = 2, toutes les constantesc∗ dans les relations precedentes sont independantes de k4. Ceci est facile a verifier pour laconstante c0, pour les constantes c1 et c2, cette propriete repose sur le fait que puisque p = 2,H†(α) = (H(α))−1 ; d’ou l’on deduit, par la definition (2.32) de u, que u1 et donc les constantesc1 et c2 sont independants de k4. A partir de la, cette propriete d’independance par rapport a k4

decoule facilement pour les autres constantes.Considerons maintenant une condition initiale z(0). On deduit de (A.36) que

V (z) ≤ (ce−k4t|z4(0)| − k)W (z) + c|z4(0)| (A.37)

Lorsque

t ≥ t :=ln(c|z4(0)|)− ln(k)

k4(A.38)

le terme (ce−k4t|z4(0)| − k) est negatif de sorte que si la solution associee a z(0) est definie sur[0, t], elle le sera sur [0,+∞). Soit t ∈ [0, t] avec t > 0. D’apres (A.33) et (A.35), on a

W (z) ≤ (V + V 2)(z) ≤ 2V 2 + 1

Page 140: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

126 Preuves et complements

Par consequent, on deduit de (A.37) que

V (z) ≤ 2(ce−k4t|z4(0)| − k)V 2(z) + c|z4(0)|+ (ce−k4t|z4(0)| − k)

≤ γ(z(0))V 2(z) + β(z(0))(A.39)

avecγ(z(0)) := 2(c|z4(0)| − k) , β(z(0)) := 2c|z4(0)| − k

Considerons maintenant l’equation

x = γx2 + β (γ, β > 0;x(0) ≥ 0)

Par un changement de variable x 7−→ x+√β/γ, on montre facilement que les solutions de cette

equation existent sur l’intervalle [0,

1γx(0) +

√γβ

)Par application de cette propriete a (A.39), il decoule que la solution z(t) associee a z(0) estdefinie sur l’intervalle [0, t] si

t <1

2V (z(0))(c|z4(0)| − k) +√

2(c|z4(0)| − k)(2c|z4(0)| − k)(A.40)

La constante c est independante de k4 et k = minki l’est aussi pour k4 > minki. Parconsequent, lorsque k4 −→ +∞ (et k4 > minki), le terme de droite de (A.40) reste constant> 0 et d’apres (A.38), t tend vers zero. L’inegalite (A.40) est donc satisfaite si k4 est suffisammentgrand par rapport a |z4(0)|. Ceci conclut la preuve de la propriete 1, qui implique directement lapropriete 2 au vu de la definition (2.29) de z.

Il reste a etablir la propriete 3, c’est a dire, puisque la convergence asymptotique des tra-jectoires vers f(Tp) est deja etablie par la propriete 2, la stabilite de cet ensemble. Il s’agit demontrer que

d(ξ0, f(Tp)) −→ 0 =⇒ suptd(ξ(t), f(Tp)) −→ 0 (A.41)

ou ξ(t) designe la solution au temps t associe a la condition initiale ξ0, et d(ξ, f(Tp)) est ladistance de ξ a l’ensemble f(Tp). Par (2.33),

d(ξ0, f(Tp)) −→ 0 =⇒ d(ξ0, f(α∗(ξ0))) −→ 0=⇒ d(ξ0, f(α(0))) −→ 0=⇒ |z0| −→ 0

(A.42)

Puisque, d’apres le point 1 de la proposition, z = 0 est un point d’equilibre asymptotiquementstable de (2.30), on a

|z0| −→ 0 =⇒ supt |z(t)| −→ 0=⇒ supt d(ξ(t), f(α(t))) −→ 0=⇒ supt d(ξ(t), f(Tp)) −→ 0

(A.43)

(A.41) decoule de (A.42) et (A.43).

Page 141: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Resultats de la Partie I 127

A.1.6 Preuve du Lemme 3 (Section 2.4.2)

La propriete (2.33) est une propriete topologique. Nous allons l’etablir dans les coordonneesξ definies par (2.39). Dans ces coordonnees f est simplement donnee par f , et il s’agit donc demontrer que

minα‖ξ0 − f(α)‖ −→ 0 =⇒ ‖ξ0 − f(α∗(ξ0))‖ −→ 0 (A.44)

On procede par contradiction. Supposons que (A.44) ne soit pas verifiee. Il existe alors δ > 0 etune suite (ξn

0 ) (n ∈ N) telle que

minα‖ξn

0 − f(α)‖ −→ 0 et ‖ξn0 − f(α∗(ξn

0 ))‖ ≥ δ ∀n (A.45)

L’ensemble f(Tp) etant compact, il possede un voisinage compact et donc, il existe une sous-suitede (ξn

0 ), que nous noterons encore (ξn0 ) telle que

ξn0 −→ ξ0 ∈ f(Tp) (A.46)

Puisque ξ0 ∈ f(Tp), il existe α tel que ξ0 = f(α). On considere 2 cas.

Cas 1 : |ξ0,2| < εη1. Puisque ξn0 −→ ξ0, il existe n∗ tel que pour n > n∗, |ξn

0,2| < εη1. Par ladefinition (2.40) de α+

1 et α−1 , et d’apres (A.46), une des deux suites (α+1 (ξn

0 )) et (α−1 (ξn0 )) tend

vers α1 = ± arccos ξ0,2

εη1. On suppose que c’est la suite (α+

1 (ξn0 )) (dans l’autre cas, la preuve est

identique). On deduit alors de cette propriete et de (A.46) que

ξn0,1 − ε sin α+

1 (ξn0 )

η2−→ ξ0,1 − ε sin α1

η2= ε sin α2

ou la derniere egalite decoule de (2.37) et du fait que ξ0 = f(α). De meme,

−ξn0,3 − ε2

4 η1 sin 2α+1 (ξn

0 )εη3

−→ −ξ0,3 − ε2

4 η1 sin 2α1

εη3= ε cos α2

Il decoule alors de (2.40) queα+

2 (ξn0 ) −→ α2

Ainsi, α+(ξn0 ) −→ α, d’ou

f(α+(ξn0 )) −→ f(α) = ξ0

et donc, par (A.46),‖ξn

0 − f(α+(ξn0 ))‖ −→ 0

Il decoule alors de (2.38) que‖ξn

0 − f(α∗(ξn0 ))‖ −→ 0

ce qui est en contradiction avec (A.45).

Cas 2 : |ξ0,2| = εη1. Supposons par exemple que ξ0,2 = εη1 (l’autre cas est similaire). On prolongeα+ et α− par continuite en posant

α+1 (ξ) = α−1 (ξ) = 0 si ξ2 ≥ εη1

Page 142: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

128 Preuves et complements

et (toujours)α+

2 (ξ) = h(ξ, α+1 (ξ)) ; α−2 (ξ) = h(ξ, α−1 (ξ))

A partir de la, on a pour toute valeur de ξ2

α∗(ξ) = arg minα+,α−

‖ξ − f(α+(ξ))‖, ‖ξ − f(α−(ξ))‖

et la preuve peut se faire exactement comme dans le cas precedent.

A.2 Resultats de la Partie II

A.2.1 Approximations homogenes de systemes commandables

L’objet de cette section est de rappeler l’algorithme permettant d’obtenir une approximationhomogene commandable en temps petit d’un systeme qui satisfait les hypotheses du Theoreme19, i.e.

L(X0, . . . , Xm)(x0) = Mx0 , et S(θ), θ ∈ [0, 1] (A.47)

Deux versions legerement differentes de cet algorithme ont ete donnees dans (Stefani, 1985; Bian-chini & Stefani, 1986) et (Hermes, 1991) respectivement. Nous reprenons la version de (Stefani,1985; Bianchini & Stefani, 1986).

Definition 26 Soit L une algebre de Lie de champs de vecteurs C∞ definis sur un voisinage dex0 ∈ M . Une filtration de L en x0 est une famille F = Fi : i ≥ 0 de sous-espaces vectorielsde L tels que

i) Fi ⊂ Fi+1 pour tout i ≥ 0,ii) [Fi, Fj ] ⊂ Fi+j pour tout i, j ≥ 0,iii) ∪i≥0Fi = L,iv) X(x0) = 0 pour tout X ∈ F0.

Etant donne une filtration F, on definit pour tout X ∈ L,

w(X) = mini : X ∈ Fi

et l’on definit egalement une filtration de l’algebre des operateurs differentiels generes par L, i.e.A = Ai : i ≥ 0 avec

Ai = span X1 · · ·Xk :k∑

j=1

w(Xj) ≤ i

Definition 27 Soit L une algebre de Lie de champs de vecteurs C∞ definis sur un voisinagede x0 ∈ M , avec M une variete de dimension n. On suppose que L(x0) = Mx0. On appellecoordonnees adaptees a la filtration F, un systeme de coordonnees y = ψ(x) defini sur unvoisinage de x0 tel que

i) ψ(x0) = 0,ii) pour tout j ∈ N, Fj(x0) = span ∂/∂y1(0), . . . , ∂/∂ymj (0), avec mj = dimFj(0),iii) X(ψk)(0) = 0 des lors que X ∈ Aj et k > mj.

Page 143: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Resultats de la Partie II 129

L’algorithme d’approximation homogene nilpotente repose sur le fait qu’en choisissant conve-nablement une filtration de L(X0, . . . , Xm), tout systeme de coordonnees adaptees a la filtrationpermet d’obtenir une approximation homogene qui conserve les proprietes de commandabilite dusysteme (S). Rappelons que ces proprietes sont donnees par (A.47). Pour simplifier, nous suppo-serons que θ est rationnel, i.e. θ = p/q avec p, q ∈ N. L’algorithme est compose de trois etapes.

Etape 1 : (definition de la filtration)On reprend les notations de la Definition 2 (1ere partie, Chapitre 1). Pour tout j ∈ N, soit

Fj := span BI(X) : q‖I‖θ ≤ j

Notons que par l’hypothese θ = p/q, q‖I‖θ ∈ N. Remarquons egalement que pour les systemessans derive, on peut simplement poser Fj = span BI(X) : |I| ≤ j, ce qui revient a prendreq = 1.

Etape 2 : (calcul du vecteur de poids)Soit D = minj : Fj(x0) = Mx0. On note egalement 0 = j0 < j1 < . . . < jd = D les entiers

definis, pour k = 1, . . . , d, par

jk := minj > jk−1 : Fjk−1(0) 6= Fj(0)

et mk := dimFjk(0). Le vecteur de poids est alors defini par

∀i = 1, . . . , n, ri = jk ⇐⇒ i ∈ mk−1 + 1, . . . ,mk (A.48)

Etape 3 : (calcul de coordonnees adaptees a la filtration (Stefani, 1986, Sec. 2))Soient Z1, . . . , Zn des champs de vecteurs tels que,

∀k = 1, . . . , d, Z1, . . . , Zmk ⊂ Fjk

et spanZ1(0), . . . , Zmk(0) = Fjk

(0)

Soit ϕ0 un systeme de coordonnees autour de x0 tel que ϕ0(x0) = 0. On definit un nouveausysteme de coordonnees ψ0 par

ψ0(x) :=(dϕ0(x0)Z1(x0) · · · dϕ0(x0)Zn(x0)

)−1ϕ0(x)

On pose alors, pour tout k = 1, . . . , d,

∀i = mk−1 + 1, . . . ,mk ψi(x) := ψjk−1

i (x)

ou ψsi (s = 1, . . . , jk−1) est defini recursivement par

ψsi (x) := ψs−1

i (x)−∑

I∈X (s,jk−1)

1I!ZI(ψs−1

i )(x0)[ψ0i (x)]

I

avecX (s, q) := I = (i1, . . . , in) ∈ Nn :

∑k ik = s,

∑k rkik = q

I! := i1! . . . in!∀y ∈ Rn, [y]I := yi1

1 . . . yinn

Page 144: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

130 Preuves et complements

A partir du calcul de ψ on peut alors calculer, pour tout i = 0, . . . ,m, ψ∗Xi qui verifieψ∗Xi = Yi + Ri ou Yi et Ri satisfont les proprietes 1 et 3 de la Definition 20, avec commevecteur de poids r et comme degre d’homogeneite de Y0 et Yi (i = 1, . . . ,m), ¯

0 = p et ¯i = q

respectivement. Cela implique que ces proprietes sont aussi satisfaites avec comme vecteur depoids r = r/q, et comme degres d’homogeneite des champs `0 = ¯

0/q = θ et `i = ¯i/q = 1.

L’approximation homogene nilpotente de (S)

y = Y0(y) +m∑

i=1

uiYi(y)

est une solution du Theoreme 20 (Bianchini & Stefani, 1986, Sec. 3).

A.2.2 Relevement de champs de vecteurs nilpotents sur un groupe

Nous commencons par donner l’algorithme ; nous montrerons ensuite que la solution corres-pondante satisfait les conditions du Theoreme 22.

Etape 1 : Selectionner n −m champs de vecteurs Ym+1, . . . , Yn, du type [Yi1 , [. . . , Yip ] . . .] avecik ∈ 1, . . . ,m pour tout k, tels que Y1, . . . , Yn forme une base de L(Y1, . . . , Ym).

Etape 2 : Appliquer la formule de Campbell-Hausdorff (Theoreme 15) pour calculer l’applicationC : Rn × Rn −→ Rn telle que

∀(α, β) ∈ Rn × Rn , eαY eβY = eC(α,β)Y (A.49)

avec αY :=∑n

i=1 αiYi.

Etape 3 : Calculer l’application ψ : Rn −→ Rn definie par

ψ(α) := exp(αY )(0) = eαY (id)(0) (A.50)

Etape 4 :Cas 1 : n = n. Aucune extension dynamique n’est necessaire. La solution est donnee par

Yi = Yi

r = rϕ(x, y) = ψ(C(ψ−1(x), ψ−1(y)))

(A.51)

Cas 2 : n < n. Determiner une matrice de projection P : Rn −→ Rn−n, i.e. Pα = (αi1 , . . . , αin−n)′

pour des entiers i1, . . . , in−n, telle que l’application ψ : Rn −→ Rn definie par

ψ(α) :=(ψ(α)Pα

)soit un diffeomorphisme. Une solution est alors donnee par

Yi(y) =(

Yi(y)P ∂C

∂βi(ψ−1(y), 0)

)r = (r, `i1 , . . . , `in−n)

ϕ(x, y) = ψ(C(ψ−1(x), ψ−1(y)))

(A.52)

Page 145: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Resultats de la Partie II 131

ou −`i est le degre d’homogeneite du champ Yi.

Montrons maintenant que chaque etape est realisable et que l’algorithme fournit bien unesolution au Theoreme 22. Considerons tout d’abord l’etape 1. Puisque par hypothese Y1, . . . , Ym

sont independants sur R et que la dimension de L(Y1, . . . , Ym) est n, il existe des champs devecteurs Ym+1, . . . , Yn tels que Y1, . . . , Yn forment une base de L(Y1, . . . , Ym). Le fait que l’onpuisse toujours choisir ces champs de la forme [Yi1 , [. . . , Yip ] . . .] est une consequence de (Nijmeijer& Van der Schaft, 1991, Prop. 3.8).

En ce qui concerne l’etape 2, le fait que l’on puisse ecrire (A.49) est une consequence directede la formule de Campbell-Hausdorff et du fait que Y1, . . . , Yn forme une base de L(Y1, . . . , Ym).

Pour l’etape 3, il suffit de montrer que ψ est bien definie. Cela decoule du fait que les Yi sonthomogenes de degre negatif de sorte que (αY )k(id) est necessairement nul pour k grand. Le termede droite de (A.50) peut donc etre developpe comme une combinaison lineaire finie de termes dutype (αY )k(id)(0), et donc ψ(α) est bien definie pour tout α.

Il reste a considerer l’etape 4. Rappelons d’abord que (α, β) 7−→ C(α, β) definit une loi degroupe sur Rn avec 0 comme element neutre et α−1 = −α pour tout α (cela decoule de (A.49)).Soient Xi (i = 1, . . . , n) les champs de vecteur sur Rn definis par

Xi(0) = ei, Xi(α) =∂C

∂β(α, 0)Xi(0) (A.53)

Par construction, les Xi sont invariants a gauche par rapport a la loi de groupe (α, β) 7−→ C(α, β).Nous allons montrer que

∀i = 1, . . . , n, ∀α ∈ Rn,∂ψ

∂α(α)Xi(α) = Yi(ψ(α)) (A.54)

D’apres (A.53), cela revient a montrer que

∀i = 1, . . . , n, ∀α ∈ Rn,∂ψ

∂α(α)

∂C

∂βi(α, 0) = Yi(ψ(α)) (A.55)

Considerons le terme de gauche de cette egalite. On a

∂ψ

∂α(α)

∂C

∂βi(α, 0) =

∂ψ C∂βi

(α, 0)

=∂ exp(CY )(0)

∂βi(α, 0)

=∂eαY eβY (id)(0)

∂βi(α, 0)

= eαY Yi(id)(0)

= Yi(exp(αY )(0)) = Yi(ψ(α))

(A.56)

ou l’on a utilise (3.4) pour l’avant derniere egalite. Cela prouve (A.55) et donc (A.54). Distinguonsles deux cas n = n et n 6= n.Cas 1 : n = n. Dans ce cas, il est immediat que les proprietes 1 et 2 du Theoreme 22 sontverifiees. Pour le point 3, montrons d’abord que l’application ϕ est bien definie. Il est bien connu

Page 146: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

132 Preuves et complements

que ψ est un diffeomorphisme local autour de α = 0 (Helgason, 1978, Pg. 32). D’autre part, enutilisant le fait que chaque Yi est ∆r-homogene de degre −`i, on deduit de (A.50) que

∀λ > 0 , ∀α ∈ Rn , ψ(∆`λα) = ∆r

λψ(α) (A.57)

Par consequent, puisque ψ est une diffeomorphisme local, c’est en fait un diffeomorphisme globalet ϕ est donc bien definie. Or, d’apres (A.51), ϕ n’est autre que l’expression de C dans lescoordonnees y = ψ(α). Puisque (α, β) 7−→ C(α, β) definit une loi de groupe sur Rn, ϕ definitbien une loi de groupe sur Rn et d’apres (A.54), Xi n’est autre que l’expression de Yi dans lescoordonnees α. Puisque par construction les Xi sont invariants a gauche par rapport a l’operationde groupe definie par C, il en decoule que les Yi sont invariants a gauche par rapport a l’operationde groupe definie par ϕ.

Cas 2 : n < n. L’application lineaire dψ(α) etant localement surjective au voisinage de α = 0, ilexiste une matrice de projection P telle que ψ definit un diffeomorphisme local autour de α = 0.Par ailleurs, en utilisant (A.52), (A.57), et la forme de P , on montre que

∀λ > 0 , ∀α ∈ Rn , ψ(∆`λα) = ∆r

λψ(α) (A.58)

Cette propriete d’homogeneite permet de conclure que ψ est un diffeomorphisme global. Tous lestermes de (A.52) sont donc bien definis.

Montrons que la propriete 1 du theoreme est satisfaite. Tout d’abord

dim L(X1, . . . , Xn) = n (A.59)

En effet cette dimension est au plus egale a n car les Xi sont des elements de l’algebre de Liedu groupe de Lie de dimension n associe a la loi definie par C, et elle est aussi au moins egale an d’apres (A.53). Par ailleurs, on deduit facilement de (A.52), (A.53), et (A.54) que Yi = ψ∗Xi

pour tout i = 1, . . . ,m. Par consequent, on deduit de (A.59) que

dim L(Y1, . . . , Yn) = n (A.60)

Supposons maintenant que L(Y1, . . . , Ym)(0) 6= Rn. Alors, d’apres (A.60), il existe necessairementun element de L(Y1, . . . , Yn) qui n’appartient pas a L(Y1, . . . , Ym). Or dim L(Y1, . . . , Ym) ≥ n carpar hypothese dim L(Y1, . . . , Ym) = n et les Yi sont des extensions des Yi. On aurait doncdim L(Y1, . . . , Yn) > n soit une contradiction avec (A.60).

Considerons maintenant la propriete 2 du theoreme. Pour tout λ > 0, l’application lineaire deLie(Y1, . . . , Ym) dans lui-meme qui associe a tout champ Y ∆r-homogene de degre −` le champλ`Y est un homomorphisme d’algebre de Lie. Par consequent,

∀λ > 0,∀(α, β) ∈ Rn × Rn , C(∆`λα,∆

`λβ) = ∆`

λC(α, β) (A.61)

Par ailleurs, on deduit de (A.58) que

∀λ > 0 , ∀α ∈ Rn , ψ−1(∆rλy) = ∆`

λψ−1(y) (A.62)

La propriete d’homogeneite des Yi decoule alors de (A.52), (A.61), (A.62), et du fait que les Yi

sont eux-memes ∆r-homogenes de degre −`i.Il reste a montrer la propriete 3 du theoreme. Comme pour le Cas 1 precedent, elle decoule

du fait que les Xi sont, par construction, invariants a gauche par rapport a l’operation de groupedefinie par C, et que Yi = ψ∗Xi pour tout i = 1, . . . ,m.

Page 147: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Resultats de la Partie II 133

A.2.3 Preuve de la Proposition 24 (Section 4.3.2)

Il decoule des hypotheses v) et vi) que chaque fonction uεi , definie par (4.8), peut se decomposer

comme

uεi (t) =

Ji∑j=1

ε−1+αjihj

i (x0)sji (t/ε) (A.63)

avec Ji ∈ N et, pour tout j,αj

i ∈ 1,12 , . . . ,

1L

hji homogene de degre αj

i > 0sji (τ) := sin(ωj

i τ + ϕji ) avec ωj

i multiple de 2πT

(A.64)

Par un changement d’echelle de temps sous le signe integral, il decoule de (A.63) que∫ t

0uε

i (τ) dτ =Ji∑

j=1

ε−1+αjihj

i (x0)ε∫ t/ε

0sji (τ) dτ

et par recurrence sur |I|,∫ t

0uε

I dτI =∑

j1=1,...,Ji1

...j|I|=1,...,Ji|I|

ε−1+α

j1i1

+···+αj|I|i|I| (hj1

i1· · ·hj|I|

i|I|)(x0)ε

∫ t/ε

0sj|I|i|I|

(τ|I|)∫ τ|I|

0. . .

∫ τ2

0sj1i1

(τ1) dτ1 · · · dτ|I|

L’egalite precedente peut s’ecrire∫ t

0uε

I dτI =∑

J∈J

ε−1+αJI hJ

I (x0) ε∫ t/ε

0sJI dτI (A.65)

avec J := (j1, . . . , j|I|), J un ensemble de multi-indices,

αJI := αj1

i1+ · · ·+ α

j|I|i|I|

, hJI := hj1

i1· · ·hj|I|

i|I|homogene de degre αJ

I > 0

et ∫ t

0sJI dτI :=

∫ t

0sj|I|i|I|

(τ|I|)∫ τ|I|

0. . .

∫ τ2

0sj1i1

(τ1) dτ1 · · · dτ|I| (A.66)

Puisque chaque fonction hJI est homogene, (A.65) definit une somme finie de fonctions homogenes

par rapport a x0. Puisque par construction les fonctions uεi satisfont les hypotheses du Theoreme

24, on sait d’apres (Liu, 1997a, Rem. 2.3) que pour tout 0 < |I| ≤ L (et pour tout x0 et toutt), le membre de gauche (et donc celui de droite) de l’egalite (A.65) converge, lorsque ε tendvers zero, vers le coefficient de XI dans la serie de Chen-Fliess associee au systeme etendu (4.48)(voir Eq. (4.49)). Ce coefficient est egalement une somme finie de termes homogenes par rapporta x0 car chaque fonction vIj de (4.48) est lineaire en x0 et donc homogene. Il n’est pas difficilede montrer que cette convergence implique que chaque composante homogene de degre α de(A.65) (i.e. l’ensemble des termes homogenes de degre α) converge, lorsque ε tend vers zero, vers

Page 148: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

134 Preuves et complements

une fonction homogene de degre α. Decomposons (A.65) en trois termes, en fonction du degred’homogeneite :∫ t

0uε

I dτI = Σε−1(t) + Σε

1(t) + Σε+1(t) avec Σε

−1(t) :=∑

J :αJI <1

ε−1+αJI hJ

I (x0) ε∫ t/ε

0sJI dτI

Σε1(t) :=

∑J :αJ

I =1

hJI (x0) ε

∫ t/ε

0sJI dτI , Σε

+1(t) :=∑

J :αJI >1

ε−1+αJI hJ

I (x0) ε∫ t/ε

0sJI dτI (A.67)

et notons, d’apres la discussion precedente que chaque terme Σε−1(t),Σ

ε1(t),Σ

ε+1(t) converge

lorsque ε tend vers zero, pour tout t (et pour tout x0). Puisque chaque fonction hJI est homogene

de degre αJI , on a donc

∀t, ∀ε, Σε+1(t) = o(x0) (A.68)

et∀t, lim

ε−→0Σε

+1(t) = o(x0) (A.69)

Considerons maintenant la somme Σε−1. Notons tout d’abord que

∀J, ∀t,∫ t

0sJI dτI =

K∑k=1

aJI,kt

βJI,k sin(ωJ

I,kt+ ϕJI,k) (A.70)

pour certaine constantes aJI,k, β

JI,k, ω

JI,k, ϕ

JI,k, avec βJ

I,k ∈ N et ωJI,k multiple de 2π/T . Ceci peut se

verifier par recurrence sur |I|, en utilisant (A.64), (A.66), et le fait que chaque ωji est un multiple

de 2π/T . Par consequent, d’apres (A.67) et puisque les βJI,k sont des entiers, on a

∀t, ∀ε, Σε−1(t) =

∑J :αJ

I <1

ε−1+αJI hJ

I (x0)ε∑

k:βJI,k=0

aJI,k sin(ωJ

I,kt/ε+ ϕJI,k)

+∑

J :αJI <1

ε−1+αJI hJ

I (x0)ε∑

k:βJI,k≥1

aJI,k(t/ε)

βJI,k sin(ωJ

I,kt/ε+ ϕJI,k)

(A.71)

Puisque Σε−1 converge lorsque ε tend vers zero (pour tout x0 et tout t), et que le terme de droite

de la premiere ligne de (A.71) est lui aussi clairement convergent (car αJI > 0), le terme de la

deuxieme ligne est lui aussi convergent. Nous pretendons qu’il est identiquement nulle. En effet,ce terme peut se factoriser en

ε−γN gN (x0, t, t/ε) + · · ·+ ε−γ1g1(x0, t, t/ε) avec γN > · · · > γ1 > 0 (A.72)

ou chaque gq est periodique de periode T par rapport a t/ε car les ωJI,k sont des multiples de

2π/T . Considerons le terme gN . Puisque toutes les fonctions gq sont bornees par rapport a ε(car periodiques par rapport a t/ε), il est necessaire pour que la somme (A.72) converge lorsqueε −→ 0 que gN converge vers zero. Puisque cette fonction est periodique par rapport a t/ε, ellene peut converger vers zero que si elle est identiquement nulle (notons egalement que pour t = 0,gN est nulle puisque chaque terme dans la deuxieme ligne de (A.71) est nul). D’ou gN = 0 et parrecurrence, on peut montrer successivement que gN = · · · = g1 = 0. Ainsi,

∀t, ∀ε, Σε−1(t) =

∑J :αJ

I <1

ε−1+αJI hJ

I (x0)ε∑

k:βJI,k=0

aJI,k sin(ωJ

I,kt/ε+ ϕJI,k) (A.73)

Page 149: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

Resultats de la Partie II 135

et∀t, lim

ε−→0Σε−1(t) = 0 (A.74)

Considerons enfin le terme Σε1. On deduit de (A.67) et (A.70) que

Σε1 =

∑J :αJ

I =1

hJI (x0)ε

∑k:βJ

I,k=0

aJI,k sin(ωJ

I,kt/ε+ ϕJI,k)

+∑

J :αJI =1

hJI (x0)

∑k:βJ

I,k=1

aJI,kt sin(ωJ

I,kt/ε+ ϕJI,k)

+∑

J :αJI =1

hJI (x0)ε

∑k:βJ

I,k>1

aJI,k(t/ε)

βJI,k sin(ωJ

I,kt/ε+ ϕJI,k)

(A.75)

En utilisant le meme argument que celui utilise pour Σε−1, on montre que le terme de la troisieme

ligne de (A.75), qui s’exprime comme une somme du type (A.72), est identiquement nul, i.e.

∀t, ∀ε > 0, Σε1(t) =

∑J :αJ

I =1

hJI (x0)ε

∑k:βJ

I,k=0

aJI,k sin(ωJ

I,kt/ε+ ϕJI,k)

+∑

J :αJI =1

hJI (x0)

∑k:βJ

I,k=1

aJI,kt sin(ωJ

I,kt/ε+ ϕJI,k)

(A.76)

Puisque Σε1 converge lorsque ε tend vers zero et que le terme de droite de la premiere ligne est

clairement convergent vers zero, le terme de la deuxieme ligne doit egalement converger. Etantdonne que chaque ωJ

I,k est un multiple de 2π/T , pour chaque ε de la forme ε = t/kT (k ∈ N) ona ∑

J :αJI =1

hJI (x0)

∑k:βJ

I,k=1

aJI,kt sin(ωJ

I,kt/ε+ ϕJI,k) =

∑J :αJ

I =1

hJI (x0)

∑k:βJ

I,k=1

aJI,kt sin(ϕJ

I,k)

qui correspond necessairement a la valeur limite de Σε1, i.e.

∀t, limε−→0

Σε1(t) =

∑J :αJ

I =1

hJI (x0)

∑k:βJ

I,k=1

aJI,kt sin(ϕJ

I,k) (A.77)

Il decoule de (A.67), (A.69), (A.74), et (A.77), que

limε−→0

∫ T

0uε

I dτI =∑

J :αJI =1

hJI (x0)

∑k:βJ

I,k=1

aJI,kT sin(ϕJ

I,k) + o(x0) (A.78)

On deduit egalement de (A.67), (A.68), (A.73), (A.76), et du fait que chaque ωJI,k est un multiple

de 2π/T , que ∫ T

0u1

I dτI =∑

J :αJI =1

hJI (x0)

∑k:βJ

I,k=1

aJI,kT sin(ϕJ

I,k) + o(x0)

+∑

J :αJI≤1

hJI (x0)

∑k:βJ

I,k=0

aJI,k sin(ϕJ

I,k)(A.79)

Page 150: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

136 Preuves et complements

La proposition decoule de (A.78) et (A.79), en utilisant le fait que le terme de la deuxieme lignede (A.79) est nul puisque (A.70) avec t = 0 implique que pour tout J ,∑

k:βJI,k=0

aJI,k sin(ϕJ

I,k) = 0

Page 151: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

References

Aeyels, D. & Szafranski, M. (1988). Comments on the stabilizability of the angular velocity of arigid body. Systems & Control Letters, 10, 35–39.

Arnold, V. (1980). Chapitres supplementaires de la theorie des equations differentielles ordinaires.MIR-Libraire du Globe.

Artus, G., Morin, P., & Samson, C. (2003). Tracking of an omnidirectional target with a nonho-lonomic mobile robot. In IEEE Conf. on Advanced Robotics (ICAR) (pp. 1468–1473).

Artus, G., Morin, P., & Samson, C. (2004). Control of a maneuvering mobile robot by transversefunctions. In Symp. on Advances in Robot Kinematics (ARK).

Bacciotti, A. (1991). Local stabilizability of nonlinear control systems. World Scientific.

Bacciotti, A. & Rosier, L. (2001). Liapunov functions and stability in control theory. Springer.

Bennani, M. K. & Rouchon, P. (1995). Robust stabilization of flat and chained systems. InEuropean Control Conference (ECC) (pp. 2642–2646).

Bianchini, R. & Stefani, G. (1986). Sufficient conditions of local controllability. In IEEE Conf.on Decision and Control (CDC) (pp. 967–970).

Bloch, A., Krishnaprasad, P., Marsden, J., & Murray, R. (1996). Nonholonomic mechanicalsystems with symmetry. Archive for Rational Mechanics and Analysis, 136, 21–99.

Brockett, R. (1983). Asymptotic stability and feedback stabilization. In R. M. R.W. Brockett &H. Sussmann (Eds.), Differential Geometric Control Theory. Birkauser.

Brunovsky, P. (1974). Local controllability of odd systems. Banach Center Publications, 1, 39–45.

Bullo, F., Leonard, N., & Lewis, A. (2000). Controllability and motion algorithms for underactua-ted lagrangian systems on Lie groups. IEEE Trans. on Automatic Control, 45, 1437–1454.

Bullo, F. & Murray, R. (1999). Tracking for fully actuated mechanical systems : a geometricframework. Automatica, 35, 17–34.

Byrnes, C. (2000). Toward a nonequilibrium theory for nonlinear control systems. In A. Isidori,F. Lamnabhi-Lagarrigue, & W. Respondek (Eds.), Nonlinear control in the year 2000 (pp.253–275). Springer Verlag.

Campion, G., d’Andrea Novel, B., & Bastin, G. (1991). Modelling and state feedback controlof nonholonomic mechanical systems. In IEEE Conf. on Decision and Control (CDC) (pp.1184–1189).

Carr, J. (1981). Application of center manifold theory. Springer Verlag.

Charlet, B., Levine, J., & Marino, R. (1991). Sufficient conditions for dynamic state feedbacklinearization. SIAM Journal on Control and Optimization, 29, 38–57.

137

Page 152: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

138 References

Chen, C.-T. (1984). Linear system theory and design. Oxford University Press.

Chen, K.-T. (1957). Integration of paths, geometric invariants and a generalized baker-hausdorffformula. Ann. of Math., 65, 163–178.

Chow, W. (1939). Uber systeme von linearen partiellen differential-gleichungen erster ordnung.Math. Ann., 117, 98–105.

Coron, J.-M. (1992a). Global asymptotic stabilization for controllable systems without drift.Mathematics of Control, Signals, and Systems, 5, 295–312.

Coron, J.-M. (1992b). Links between local controllability and local continuous stabilization. InIFAC Nonlinear Control Systems Design Symp. (NOLCOS) (pp. 165–171).

Coron, J.-M. (1994). Linearized control systems and applications to smooth stabilization. SIAMJournal on Control and Optimization, 32, 358–386.

Coron, J.-M. (1995). Stabilization in finite time of locally controllable systems by means ofcontinuous time-varying feedback laws. SIAM Journal on Control and Optimization, 33,804–833.

Coron, J.-M. & d’Andrea Novel, B. (1992). Smooth stabilizing time-varying control laws for aclass of nonlinear systems. In IFAC Nonlinear Control Systems Design Symp. (NOLCOS)(pp. 649–654).

Coron, J.-M. & Kerai, E.-Y. (1996). Explicit feedbacks stabilizing the attitude of a rigid spacecraftwith two control torques. Automatica, 32, 669–677.

Coron, J.-M. & Praly, L. (1991). Adding an integrator for the stabilization problem. Systems &Control Letters, 17, 89–104.

Coron, J.-M. & Rosier, L. (1994). A relation between continuous time-varying and discontinuousfeedback stabilization. J. of Math. Syst. Estim. and Control, 4, 67–84.

Crouch, P. & Byrnes, C. (1986). Symmetries and local controllability. In M. Fliess & M. Ha-zewinkel (Eds.), Algebraic and geometric methods in nonlinear control theory (pp. 55–75).Reidel.

Crouch, P. E. (1984). Spacecraft attitude control and stabilization : applications of geometriccontrol theory to rigid body models. IEEE Trans. on Automatic Control, 29, 321–331.

Dayawansa, W., Martin, C., & Knowles, G. (1990). Asymptotic stabilization of a class of smoothtwo dimensionnal systems. SIAM Journal on Control and Optimization, 28, 1321–1349.

Dixon, W., Dawson, D., Zergeroglu, E., & Zhang, F. (2000). Robust tracking and regulationcontrol for mobile robots. International Journal of Robust and Nonlinear Control, 10, 199–216.

Filippov, A. (1964). Differential equations with discontinuous right-hand side. Amer. Math. Soc.Trans. Series 2, 42, 199–231.

Fliess, M. (1975). Series de volterra et series formelles non commutatives. C.R. Aca. Sciences,Paris, France, A-280, 965–967.

Fliess, M. (1981). Fonctionnelles causales non-lineaires et indeterminees, non commutatives. Bull.Soc. Math. de France, 109, 3–40.

Fliess, M., Levine, J., Martin, P., & Rouchon, P. (1995a). Design of trajectory stabilizing feedbackfor driftless flat systems. In European Control Conference (ECC) (pp. 1882–1887).

Page 153: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

References 139

Fliess, M., Levine, J., Martin, P., & Rouchon, P. (1995b). Flatness and defect of non-linearsystems : introductory theory and examples. International Journal of Control, 61, 1327–1361.

Folland, G. (1977). On the Rothschild-Stein lifting theorem. Comm. in PDE’s, 2, 165–191.

Fossen, T. (1994). Guidance and control of ocean vehicles. Wiley.

Grizzle, J. & Marcus, S. (1985). The structure of nonlinear control systems possessing symmetries.IEEE Trans. on Automatic Control, 30, 248–258.

Gurvits, L. & Li, Z. (1992). Nonholonomic motion planning, chapter Smooth time-periodicfeedback solutions for nonholonomic motion planning. Kluwer.

Hahn, W. (1967). Stability of motion. Springer Verlag.

Hale, J. (1969). Ordinary differential equations. Wiley.

Haynes, G. & Hermes, H. (1970). Nonlinear controllability via Lie theory. SIAM Journal onControl, 8, 450–460.

Helgason, S. (1978). Differential geometry, Lie groups, and symmetric spaces. Academic Press.

Hermann, R. (1963). On the accessibility problem in control theory. In International Symposiumon Nonlinear Differential Equations and Nonlinear Mechanics (pp. 325–332). : AcademicPress.

Hermes, H. (1980). On the synthesis of a stabilizing feedback control via Lie algebraic methods.SIAM Journal on Control and Optimization, 18, 352–361.

Hermes, H. (1982). On local controllability. SIAM Journal on Control and Optimization, 33,211–220.

Hermes, H. (1991). Nilpotent and high-order approximations of vector field systems. SIAMReview, 33, 238–264.

Isidori, A. (1995). Nonlinear Control Systems. Springer Verlag, third edition.

Jacobson, N. (1962). Lie algebras. Dover.

Jurdjevic, V. & Queen, J. (1978). Controllability and stability. Journal of Differential Equations,28, 381–389.

Kanayama, Y., Kimura, Y., Miyazaki, F., & Noguchi, T. (1990). A stable tracking control methodfor an autonomous mobile robot. In IEEE Conf. on Robotics and Automation (ICRA) (pp.384–389).

Kawski, M. (1988). Control variations with an increasing number of switchings. Bulletin of theAmerican Mathematical Society, 18, 149–152.

Kawski, M. (1989a). Asymptotic feedback stabilization in dimension three. In IEEE Conf. onDecision and Control (CDC) (pp. 1370–1375).

Kawski, M. (1989b). Stabilization of nonlinear systems in the plane. Systems & Control Letters,12, 169–175.

Kawski, M. (1990). High-order small-time local controllability. In H. Sussmann (Ed.), Control-lability and Optimal Control (pp. 431–467). Dekker.

Kawski, M. (1992). Combinatorics of realizations of nilpotent control systems. In IFAC NonlinearControl Systems Design Symp. (NOLCOS) (pp. 251–256).

Page 154: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

140 References

Kawski, M. (1995). Geometric homogeneity and stabilization. In IFAC Nonlinear Control SystemsDesign Symp. (NOLCOS) (pp. 164–169).

Kawski, M. (1998). Nonlinear control and combinatorics of words. In B. Jakubczyk & W.Respondek (Eds.), Nonlinear Feedback and Optimal Control. Dekker.

Kawski, M. (2003). Bases for Lie algebras and a continuous cbh formula. In V. Blondel &A. Megretski (Eds.), Open problems in mathematical systems and control theory. PrincetonUniversity Press.

Keraı, E. (1995). Analysis of small time local controllability of the rigid body model. In IFACConf. on System Structure and Control (pp. 645–650).

Krishnaprasad, P. & Tsakiris, D. (1995). Oscillations, se(2)-snakes and motion control. In IEEEConf. on Decision and Control (CDC) (pp. 13–15).

Kurzweil, J. & Jarnik, J. (1988). Iterated Lie brackets in limit processes in ordinary differentialequations. Results in Mathematics, 14, 125–137.

LaSalle, J. (1968). Stability theory for ordinary differential equations. Journal of DifferentialEquations, 4, 57–65.

Laumond, J.-P. (1991). Controllability of a multibody mobile robot. In ICAR (pp. 1033–1038).

Laumond, J.-P., Ed. (2001). La robotique mobile. Hermes.

Lewis, A. (2000). Simple mechanical control systems with constraints. IEEE Trans. on AutomaticControl, 45, 1420–1436.

Lewis, A. & Murray, R. (1997). Configuration controllability of simple mechanical control systems.SIAM Journal on Control and Optimization, 35, 766–790.

Lewis, A., Ostrowski, J., Murray, R., & Burdick, J. (1994). Nonholonomic mechanics and loco-motion : the snakeboard example. In IEEE Conf. on Robotics and Automation (ICRA) (pp.2391–2397).

Liu, W. (1997a). An approximation algorithm for nonholonomic systems. SIAM Journal onControl and Optimization, 35, 1328–1365.

Liu, W. (1997b). Averaging theorems for highly oscillatory differential equations and iterated Liebrackets. SIAM Journal on Control and Optimization, 35, 1989–2020.

Lizarraga, D. (2004). Obstructions to the existence of universal stabilizers for smooth controlsystems. Mathematics of Control, Signals, and Systems, 16, 255–277.

Lizarraga, D., Morin, P., & Samson, C. (1999). Non-robustness of continuous homogeneousstabilizers for affine control systems. In IEEE Conf. on Decision and Control (CDC) (pp.855–860).

Lobry, C. (1970). Controlabilite des systemes non lineaires. SIAM Journal on Control andOptimization, 8, 573–605.

Luca, A. D. & Benedetto, M. D. (1993). Control of nonholonomic systems via dynamic compen-sation. Kybernetica, 29, 593–608.

Lucibello, P. & Oriolo, G. (1996). Stabilization via iterative state feedback with application tochained-form systems. In IEEE Conf. on Decision and Control (CDC) (pp. 2614–2619).

Page 155: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

References 141

Maini, M., Morin, P., Pomet, J.-B., & Samson, C. (1999). On the robust stabilization of chainedsystems by continuous feedback. In IEEE Conf. on Decision and Control (CDC) (pp. 3472–3477).

Martin, P. & Rouchon, P. (1998). Symmetry and field-oriented control of induction motors.Technical Report 493, CAS-Ecole des Mines.

M’Closkey, R. (1997). An averaging theorem for time-periodic degree zero homogeneous differen-tial equations. Systems & Control Letters, 32, 179–183.

M’Closkey, R. T. (1995). Exponential stabilization of driftless nonlinear control systems. PhDthesis, California Institute of Technology.

M’Closkey, R. T. & Morin, P. (1998). Time-varying homogeneous feedback : design tools for theexponential stabilization of systems with drift. International Journal of Control, 71, 837–869.

M’Closkey, R. T. & Murray, R. M. (1993). Nonholonomic systems and exponential convergence :some analysis tools. In IEEE Conf. on Decision and Control (CDC) (pp. 943–948).

Morin, P. (1996a). Robust stabilisation of the angular velocity of a rigid body with two controls.European Journal of Control, 2, 51–56.

Morin, P. (1996b). Sur la stabilisation par retour d’etat instationnaire. PhD thesis, Ecole desMines de Paris.

Morin, P., Murray, R., & Praly, L. (1998). Nonlinear rescaling of control laws with application tostabilization in the presence of magnitude saturation. In IFAC Nonlinear Control SystemsDesign Symp. (NOLCOS) (pp. 690–695).

Morin, P., Pomet, J.-B., & Samson, C. (1999). Design of homogeneous time-varying stabilizingcontrol laws for driftless controllable systems via oscillatory approximation of Lie bracketsin closed-loop. SIAM Journal on Control and Optimization, 38, 22–49.

Morin, P. & Samson, C. (1997). Time-varying exponential stabilization of a rigid spacecraft withtwo control torques. IEEE Trans. on Automatic Control, 42, 528–534.

Morin, P. & Samson, C. (1999). Exponential stabilization of nonlinear driftless systems withrobustness to unmodeled dynamics. Control, Optimization & Calculus of Variations, 4, 1–36.

Morin, P. & Samson, C. (2000). Control of non-linear chained systems. from the Routh-Hurwitzstability criterion to time-varying exponential stabilizers. IEEE Trans. on Automatic Control,45, 141–146.

Morin, P. & Samson, C. (2001a). A characterization of the Lie algebra rank condition by transverseperiodic functions. SIAM Journal on Control and Optimization, 40(4), 1227–1249.

Morin, P. & Samson, C. (2001b). Commande. In J.-P. Laumond (Ed.), La robotique mobile.Hermes.

Morin, P. & Samson, C. (2003). Practical stabilization of driftless systems on Lie groups : thetransverse function approach. IEEE Trans. on Automatic Control, 48, 1496–1508.

Morin, P. & Samson, C. (2004). Practical and asymptotic stabilization of chained systems bythe transverse function control approach. SIAM Journal on Control and Optimization. Aparaitre.

Page 156: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

142 References

Morin, P., Samson, C., Pomet, J.-B., & Jiang, Z.-P. (1995). Time-varying feedback stabilization ofthe attitude of a rigid spacecraft with two controls. Systems & Control Letters, 25, 375–385.

Murray, R., Li, Z., & Sastry, S. (1994). A mathematical introduction to robotic manipulation.CRC Press.

Murray, R. & Sastry, S. (1991). Steering nonholonomic systems in chained form. In IEEE Conf.on Decision and Control (CDC) (pp. 1121–1126).

Murray, R. & Sastry, S. (1993). Nonholonomic motion planning : Steering using sinusoids. IEEETrans. on Automatic Control, 38, 700–716.

Murray, R. M. (1994). Nilpotent bases for a class of nonintegrable distributions with applicationsto trajectory generation for nonholonomic systems. Mathematics of Control, Signals, andSystems, 1, 58–75.

Nijmeijer, H. & Van der Schaft, A. (1991). Nonlinear Dynamical Control Systems. SpringerVerlag.

Ostrowski, J. & Burdick, J. (1995). Control of mechanical systems with symmetries and nonho-lonomic constraints. In IEEE Conf. on Decision and Control (CDC) (pp. 4317–4320).

Ostrowski, J. & Burdick, J. (1997). Controllability tests for mechanical systems with symmetriesand constraints. J. of Applied Mathematics and Computer Science, 7, 305–331.

Pomet, J.-B. (1992). Explicit design of time-varying stabilizing control laws for a class of control-lable systems without drift. Systems & Control Letters, 18, 467–473.

Pomet, J.-B. & Samson, C. (1994). Exponential stabilization of nonholonomic systems in powerform. In IFAC Symp. on Robust Control Design (pp. 447–452).

Praly, L. (1997). Generalized weighted homogeneity and state dependent time scale for linearcontrollable systems. In IEEE Conf. on Decision and Control (CDC) (pp. 4342–4347).

Praly, L., d’Andrea Novel, B., & Coron, J.-M. (1991). Lyapunov design of stabilizing controllersfor cascaded systems. IEEE Trans. on Automatic Control, 36, 1177–1181.

Rosier, L. (1992). Homogeneous lyapunov function for homogeneous continuous vector field.Systems & Control Letters, 19, 467–473.

Rothschild, L. & Stein, E. M. (1976). Hypoelliptic differential operators and nilpotent groups.Acta Math., 137, 247–320.

Rouche, N., Habets, P., & Laloy, M. (1977). Stability theory by Lyapunov’s direct method.Springer-Verlag.

Ryan, E. (1994). On brockett’s condition for smooth stabilizability and its necessity in a contextof nonsmooth feedback. SIAM Journal on Control and Optimization, 32, 1597–1604.

Samson, C. (1990). Velocity and torque feedback control of a nonholonomic cart. Int. Workshopin Adaptative and Nonlinear Control : Issues in Robotics. Also in LNCIS, Vol. 162, SpringerVerlag, 1991.

Samson, C. (1995). Control of chained systems. application to path following and time-varyingpoint-stabilization. IEEE Trans. on Automatic Control, 40, 64–77.

Samson, C. & Ait-Abderrahim, K. (1991). Feedback control of a nonholonomic wheeled cart incartesian space. In IEEE Conf. on Robotics and Automation (ICRA) (pp. 1136–1141).

Page 157: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

References 143

Samson, C., Leborgne, M., & Espiau, B. (1991). Robot Control : The Task-function Approach.Number 22 in Oxford Engineering. Oxford University Press.

Sepulchre, R., Campion, G., & Wertz, V. (1992). Some remarks about periodic feedback stabili-zation. In IFAC Nonlinear Control Systems Design Symp. (NOLCOS) (pp. 418–423).

Sontag, E. D. (1987). Controllability and linearized regulation. In IEEE Trans. on AutomaticControl, volume 32 (pp. 877–888).

Sontag, E. D. (1988). Finite-dimensionnal open-loop control generators for non-linear systems.In International Journal of Control, volume 47 (pp. 537–556).

Sontag, E. D. (1992). Universal nonsingular controls. In Systems & Control Letters, volume 19(pp. 221–224).

Sontag, E. D. (1995). Control of systems without drift via generic loops. In IEEE Trans. onAutomatic Control, volume 40 (pp. 1210–1219).

Sontag, E. D. & Sussmann, H. (1988). Further comments on the stabilizability of the angularvelocity of a rigid body. Systems & Control Letters, 12, 213–217.

Sørdalen, O. J. (1993). Conversion of the kinematics of a car with n trailers into a chained form.In IEEE Conf. on Robotics and Automation (ICRA) (pp. 382–387).

Sørdalen, O. J. & Egeland, O. (1995). Exponential stabilization of nonholonomic chained systems.IEEE Trans. on Automatic Control, 40, 35–49.

Soueres, P. & Boissonnat, J.-D. (1998). Optimal trajectories for nonholonomic mobile robots. InJ.-P. Laumond (Ed.), Robot motion planning and control. Springer.

Stefani, G. (1985). Polynomial approximations to control systems and local controllability. InIEEE Conf. on Decision and Control (CDC) (pp. 33–38).

Stefani, G. (1986). On the local controllability of scalar-input control systems. In C. I. Byrnes & A.Linsquist (Eds.), Theory and Applications of Nonlinear Control Systems, Proc. of MTNS’84(pp. 167–179). North-Holland.

Struemper, H. & Krishnaprasad, P. (1997). Tracking and stabilization for control systems onmatrix Lie groups. Technical Report 97-34, Institute for Systems Research (ISR).

Sussmann, H. (1983). Lie brackets and local controllability : a sufficient condition for scalar-inputsystems. SIAM Journal on Control and Optimization, 21, 686–713.

Sussmann, H. (1986). A product expansion for the chen series. In C. Byrnes & A. Lindquist(Eds.), Theory and Applications of Nonlinear Control Systems (pp. 323–335). : Elsevier.

Sussmann, H. (1987). A general theorem on local controllability. SIAM Journal on Control andOptimization, 25, 158–194.

Sussmann, H. & Liu, W. (1991). Limits of highly oscillatory controls and approximation ofgeneral paths by admissible trajectories. In IEEE Conf. on Decision and Control (CDC)(pp. 437–442).

Sussmann, H. J. & Jurdjevic, V. (1972). Controllability of nonlinear systems. Journal of Diffe-rential Equations, 12, 95–116.

Teel, A., Murray, R., & Walsh, G. (1995). Nonholonomic control systems : from steering tostabilization with sinusoids. International Journal of Control, 62, 849–870. Also in Proc. ofthe IEEE CDC, pp. 1603–1609, 1992.

Page 158: HABILITATION A DIRIGER DES RECHERCHES` l’Universit´e de Nice … · 2004-11-09 · HABILITATION A DIRIGER DES RECHERCHES` Pr´esent´ee a l’Universit´e de Nice-Sophia Antipolis

144 References

Teel, A. R., Murray, R., & Walsh, G. (1992). Nonholonomic control systems : from steering tostabilization with sinusoids. In IEEE Conf. on Decision and Control (CDC) (pp. 1603–1609).

Varadarajan, V. (1983). Lie groups, Lie algebras, and their representations. Springer Verlag.

Warner, F. (1983). Foundations of differential manifolds and Lie groups. Springer Verlag.

Zabczyk, J. (1989). Some comments on stabilizability. Applied Mathematics & Optimization, 19,1–9.