l3 mass — calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres...

72
L3 MASS — Calcul diff´ erentiel (cours et exercices) John BOXALL (Ann´ ee universitaire 2009–2010 ) Introduction (0.1) Ce cours s’articule autour du calcul diff´ erentiel et, en particulier, son application au calcul des extremums d’une fonction, assujettie ou non ` a des contraintes. Voici quelques exemples typiques : (0.1.1) D´ eterminer si oui ou non la fonction la fonction (x, y) x 1+x 2 +y 2 a un maximum ou un minimum sur R 2 et, le cas ´ ech´ eant, les trouver. (0.1.2) Quelles sont les valeurs maximales et minimales de la fonction (x, y, z ) x +2y +3z sur la sph` ere x 2 + y 2 + z 2 = 1 et pour quelles valeurs de (x, y, z ) sont-elles atteintes ? (0.1.3) Parmi les triangles de p´ erim` etre donn´ ee, lesquels ont la plus grande aire ? (0.1.4) Soient a, b, α, β quatre r´ eels tels que a<b. Pour toute fonction f :[a, b] R de classe C (1) telle que f (a)= α et f (b)= β on pose L(f )= b a 1+ f (t) 2 dt. Quelle est la valeur minimale de L(f ) et pour quelles fonctions f est-elle atteinte ? Notons que L(f ) est la longueur de la courbe joignant les points (a, α) et (b, β ) et d´ efinie par y = f (x). Le probl` eme peut alors ˆ etre reformul´ e ainsi : quelle est la courbe la plus courte joignant (a, α) et (b, β ) ? Bien que ce probl` eme soit classiquement pos´ e pour les fonctions de classe C (1) , nous nous limiterons par souci de simplicit´ e aux fonctions de classe C (2) . (0.2) Nous ´ etudierons ensuite quelques ´ equations diff´ erentielles, et notamment les notions d’ ´ equilibre et de stabilit´ e des solutions. En g´ en´ eral, on s’int´ eresse ` a une solution particuli` ere d’une ´ equation diff´ erentielle (par exemple une solution constante), dite solution d’´ equilibre. L’´ equation est alors dite stable si toutes les autres solutions s’approchent (dans un sens qui doit ˆ etre pr´ ecis´ e selon le contexte) ` a la solution d’´ equilibre lorsque t +. Voici quelques exemples, x , x esignant les d´ eriv´ ees successives de x par rapport ` a t : (0.2.1) Soient a, b, c trois r´ eels tels que b = 0. L’´ equation x (t)+ ax (t)+ bx(t)= c a alors comme solution d’´ equilibre la solution constante x 0 (t)= c b . Pour quelle valeurs de a, b, c l’´ equation est-elle stable, c’est-` a-dire on a lim t+x(t)= c b pour toute solution x ? (0.2.2) On consid` ere le syst` eme x (t)=1 - x(t)y(t) y (t)= x(t). Quelles sont les solutions constantes de ce syst` eme ? Y-a-t-il stabilit´ e locale autour de ces solutions d’´ equilibre ? Notons que chaque solution (x(t),y(t)) param` etre une courbe dans le plan : il y a stabilit´ e locale lorsque toute solution qui se trouve suffisamment proche ` a une solution d’´ equilibre lorsque t est assez grand converge vers l’´ equilibre lorsque t +. (0.2.3) Le dernier th` eme est consacr´ e` a la d´ emonstration de l’existence locale et l’unicit´ e de solutions de syst` emes d’´ equations diff´ erentielles sous des hypoth` eses convenables. Nous verrons sur un exemple commment la m´ ethode de d´ emonstration, dans l’absence de solution exprimable en 1

Upload: phunghanh

Post on 13-Sep-2018

263 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

L3 MASS — Calcul differentiel (cours et exercices)

John BOXALL

(Annee universitaire 2009–2010 )

Introduction

(0.1) Ce cours s’articule autour du calcul differentiel et, en particulier, son application aucalcul des extremums d’une fonction, assujettie ou non a des contraintes. Voici quelques exemplestypiques :

(0.1.1) Determiner si oui ou non la fonction la fonction (x, y) 7→ x1+x2+y2 a un maximum ou

un minimum sur R2 et, le cas echeant, les trouver.

(0.1.2) Quelles sont les valeurs maximales et minimales de la fonction (x, y, z) 7→ x+ 2y + 3zsur la sphere x2 + y2 + z2 = 1 et pour quelles valeurs de (x, y, z) sont-elles atteintes ?

(0.1.3) Parmi les triangles de perimetre donnee, lesquels ont la plus grande aire ?

(0.1.4) Soient a, b, α, β quatre reels tels que a < b. Pour toute fonction f : [a, b] → R de

classe C(1) telle que f(a) = α et f(b) = β on pose L(f) =∫ b

a

√1 + f ′(t)2 dt. Quelle est la valeur

minimale de L(f) et pour quelles fonctions f est-elle atteinte ? Notons que L(f) est la longueurde la courbe joignant les points (a, α) et (b, β) et definie par y = f(x). Le probleme peut alorsetre reformule ainsi : quelle est la courbe la plus courte joignant (a, α) et (b, β) ? Bien que ceprobleme soit classiquement pose pour les fonctions de classe C(1), nous nous limiterons par soucide simplicite aux fonctions de classe C(2).

(0.2) Nous etudierons ensuite quelques equations differentielles, et notamment les notionsd’equilibre et de stabilite des solutions. En general, on s’interesse a une solution particuliered’une equation differentielle (par exemple une solution constante), dite solution d’equilibre.L’equation est alors dite stable si toutes les autres solutions s’approchent (dans un sens qui doitetre precise selon le contexte) a la solution d’equilibre lorsque t→ +∞. Voici quelques exemples,x′, x′′ designant les derivees successives de x par rapport a t :

(0.2.1) Soient a, b, c trois reels tels que b 6= 0. L’equation x′′(t) + ax′(t) + bx(t) = c a alorscomme solution d’equilibre la solution constante x0(t) = c

b. Pour quelle valeurs de a, b, c l’equation

est-elle stable, c’est-a-dire on a limt→+∞ x(t) = cb

pour toute solution x ?

(0.2.2) On considere le systeme

x′(t) = 1− x(t)y(t)

y′(t) = x(t).

Quelles sont les solutions constantes de ce systeme ? Y-a-t-il stabilite locale autour de cessolutions d’equilibre ? Notons que chaque solution (x(t), y(t)) parametre une courbe dans le plan :il y a stabilite locale lorsque toute solution qui se trouve suffisamment proche a une solutiond’equilibre lorsque t est assez grand converge vers l’equilibre lorsque t→ +∞.

(0.2.3) Le dernier theme est consacre a la demonstration de l’existence locale et l’unicite desolutions de systemes d’equations differentielles sous des hypotheses convenables. Nous verrons surun exemple commment la methode de demonstration, dans l’absence de solution exprimable en

1

Page 2: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

termes des fonctions familieres (puissances, exponentielles, logarithmes, trigonometriques) permetde construire une suite de solution approchees.

(0.3) Voici donc le contenu du cours.— Theme 1. Ouverts et fermes de Rp, fonctions continues Rp → R ;— Theme 2. Compacts, connexes par arcs et connexes de Rp ;— Theme 3. Derivees partielles, formule de Taylor ;— Theme 4. Formes quadratiques, extremums libres ;— Theme 5. Extremums lies d’une fonction Rp → R, methode des multiplicateurs de Lagrange ;— Theme 6. Equations differentielles, equilibre, stabilite ;— Theme 7. Systemes d’equations differentielles ;— Theme 8. Solutions periodiques, cycles limites ;— Theme 9. Calcul des variations ;— Theme 10. Applications aux equations differentielles.Le texte conclut avec un appendice contenant quelques rappels.Chaque theme est suivi par une collection d’exercices. Le numero de chaque exercice est precede

par une lettre e minuscule ; ainsi (e4.5) designe l’exercice 5 qui se trouve a la fin du theme 4.

Theme 1. Ouverts, fermes, fonctions continues

(1.1) On note K l’un des corps R et C. Soit E un K-espace vectoriel. On rappelle qu’unenorme sur E est une application ||.|| : E → R qui verifie les proprietes

(i) On a ||x|| ≥ 0 pour tout x ∈ E,(ii) L’element x de E verifie ||x|| = 0 si et seulement si 0,(iii) On a ||x+ y|| ≤ ||x||+ ||y|| pour tout x, y ∈ E,(iv) On a ||λx|| = |λ| ||x|| pour tout λ ∈ K et pour tout x ∈ E.Un espace vectoriel norme est un espace vectoriel muni d’une norme.

(1.1.1) Lorsque K = R, un produit scalaire sur E est une forme bilineaire symetrique (voirle paragraphe (A.4) de l’appendice pour plus de rappels) notee 〈., .〉 et verifiant

(i) On a 〈x, x〉 >≥ 0 pour tout x ∈ E,(ii) L’element x de E verifie 〈x, x〉 = 0 si et seulement si 0.Lorsque c’est le cas, la fonction x 7→ 〈x, x〉1/2 est une norme, appelee norme associee.

(1.1.2) De meme, lorsque K = C, un produit hermitien sur E est une forme R-bilineairetelle que 〈y, x〉 = 〈x, y〉 pour tout (x, y) ∈ E2 et verifiant

(i) 〈ix, y〉 = i〈x, y〉 pour tout (x, y) ∈ E2,(ii) On a 〈x, x〉 ≥ 0 pour tout x ∈ E,(iii) L’element x de E verifie 〈x, x〉 = 0 si et seulement si 0.Un K-espace prehilbertien est un K-espace vectoriel muni d’un produit scalaire (lorsque

K = R) ou un produit hermitien (lorsque K = C). Lorsque E est de dimension finie, on parle d’unespace euclidien (lorsque K = R) ou d’un espace hermitien (lorsque K = C).

(1.1.3) On dit que x et y sont orthogonaux (ou perpendiculaires) si 〈x, y〉 = 0. L’inegalitede Cauchy-Schwarz est alors l’inegalite |〈x, y〉| ≤ ||x|| ||y|| qui est valable quelque soit (x, y) ∈

2

Page 3: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

E2. Elle a pour consequence l’inegalite triangulaire ||x+y|| ≤ ||x||+ ||y||, qui est encore valablequelque soit (x, y) ∈ E2.

On trouvera au (e1.12) une etude des cas d’egalite dans l’inegalite de Cauchy-Schwarz etl’inegalite triangulaire.

(1.2) Dans ce cours, et au moins jusqu’au theme 8, l’exemple au centre de nos preoccupationsest celui du R-espace vectoriel Rp, p ≥ 1 etant un entier. Si x = (x1, x2, . . . , xp) ∈ Rp et sia ∈ R, on note ax = (ax1, ax2, . . . , axp). Si encore y = (y1, y2, . . . , yp) ∈ Rp, on a x + y =(x1 + y1, x2 + y2, . . . , xp + yp). Trois normes interviennent particulierement souvent : si x ∈ Rp, onpose

||x||1 = |x1|+ |x2|+ · · ·+ |xp|,||x||2 = (x2

1 + x22 + · · ·+ x2

p)1/2,

||x||∞ = max|x|1, |x|2, . . . , |x|p.

Parmi ces trois normes, seule ||.||2 est associee a un produit scalaire, a savoir

〈x, y〉 = x1y1 + x2y2 + · · ·+ xpyp.

(1.3) Soient E un espace vectoriel norme et soient x, y ∈ E. Intuitivement, au moins lorsqueE = Rp et ||.|| est la norme ||.||2, ||y − x|| est la distance entre les points d’un espace euclidiendont les affixes sont x et y. Ainsi, si r ∈ R∗

+ et si x ∈ E, on appelle sphere de centre x et derayon r et on note S(x; r) l’ensemble des y ∈ E verifiant ||y−x|| = r. De meme, on appelle boulefermee de centre x et de rayon r l’ensemble des y ∈ E tels que ||y − x|| ≤ r : elle est noteeK(x; r). Enfin, la boule ouverte de centre x et de rayon r, notee B(x; r), est l’ensemble desy ∈ E verifiant ||y − x|| < r.

Notons que, contrairement a l’usage generale, l’usage mathematique des mots sphere et bouleen donnent un sens precis : une sphere est creuse alors qu’une boule est solide. Lorsque p = 2, onparle respectivement d’un cercle et d’un disque.

(1.3.1) Soit x ∈ E. Un voisinage de x est une partie V de E contenant une boule ouverteB(x; r) avec r > 0 convenable.

(1.4) Soit U une partie de E. On dit que U est ouverte (ou : un ouvert), si, quelque soity ∈ U , il existe r > 0 telle que B(y; r) ⊆ U .

(1.4.1) Pour tout x ∈ E et pour tout r ∈ R∗+, la boule ouverte B(x; r) est un ouvert..

Demonstration. Soit y ∈ B(x; r). Posons r′ = ||y − x||. Par hypothese, r′ < r. Soit z ∈ Rp telque ||z − y|| < r − r′. Or, on a ||z − x|| = ||(z − y) + (y − x)|| ≤ ||z − y||+ r′ ≤

(r − r′

)+ r′ = r,

d’ou z ∈ B(x; r). On en tire que la boule B(y, r − r′) est contenue dans B(x; r).

(1.4.2) La partie F de E est dite fermee (ou un ferme) si son complementaire F c est unouvert. (On consultera l’appendice pour la notation concernant les ensembles.)

(1.4.3) Pour tout x ∈ E et pour tout r ∈ R+, la boule fermee K(x; r) est un ferme.On verifie que K(x; r)c est un ouvert par un argument semblable a la demonstration de (1.4.1).

(1.4.4) Proposition. (i) Toute reunion d’ouverts de E est ouverte. Toute intersection d’unnombre fini d’ouverts de E est ouverte.

(ii) Toute intersection de fermes de E est fermee. Toute reunion d’un nombre fini de fermesde E est fermee.

3

Page 4: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

La demonstration a ete vue en deuxieme annee.

(1.5) Notons encore E un K-espace vectoriel norme. SoitX une partie de E. Rappelons qu’unesuite (un) a valeurs dans X est convergente s’il existe ` ∈ E avec la propriete suivante :

quelque soit ε > 0, on peut trouver Nε tel que pour tout n ≥ Nε on ait ||un − `|| ≤ ε.On rappelle que ` est alors unique, et est appele la limite de (un). On dit alors que (un)

converge vers `, et on ecrit un → λ lorsque n→ +∞ ou encore limn→+∞

un = `.

On dit que la suite (un) converge dans X si elle converge et sa limite appartient encore aX.

Exemple. Prenons p = 1, X =]0, 1]. La suite ( 1n) converge vers 0 mais, puisque 0 /∈ X, elle ne

converge pas dans X.

(1.5.1) Theoreme. Soit X une partie de E. Pour que X soit fermee, il faut et il suffit que lalimite de toute suite convergente et a valeurs dans X appartienne a E.

A nouveau, ce resultat a ete vu en deuxieme annee.

(1.6) Soit X ⊆ E et soit x ∈ X. On dit que x est un point interieur de X s’il existe r ∈ R∗+

tel que B(x; r) ⊆ X. L’ensemble des points interieurs de X est un ouvert de E contenu dans X,

appele l’interieur de X et noteX. Si U ⊆ X est ouvert, alors tout point de U est un point

interieur de X et donc U ⊆X. On a

X ⊆ X et

X = X si et seulement si X est ouvert.

Exemples. (i) Soit X = [0, 1[. AlorsX =]0, 1[.

(ii) Soit X = Q. Si x ∈ X et si r > 0, l’intervalle ]x−r, x+r[ contient toujours un irrationnel.

On en tire que ]x− r, x+ r[ n’est pas contenu dans Q quelque soit la valeur de r. Donc x /∈Q et

Q = ∅.

(1.6.1) Soit X ⊆ E et soit x ∈ E. On dit que x est un point adherent de X si tout voisinagede x rencontre X. L’ensemble des points adherents de X est appele l’adherence de X et est noteX. Alors X est un ferme, comme on peut voir en remarquant que tout x /∈ X possede un voisinagequi ne rencontre pas X. De meme, si F est un ferme contenant X, alors F ⊇ X. On a X ⊆ X etX = X si et seulement si X est ferme.

Le point x est un point adherent de X si et seulement s’il existe une suite d’elements de Xconvergeant vers x.

Demonstration. En effet, si x ∈ E et si n ∈ N∗, la boule B(x; 1n) rencontre E en un point

un. La suite (un) converge alors vers x. Reciproquement, si (un) est une suite a valeurs dans Econvergeant vers x et si r > 0, la definition de convergence d’une suite implique que un ∈ B(x; r)pour tout n assez grand.

Exemples. (i) Si X = [0, 1[, alors X = [0, 1].(ii) Soit X = Q. Si x ∈ R, il existe une suite de rationnels convergeant vers x. On en tire que

x ∈ Q. Donc Q = R.

(1.6.2) Soient X, Y deux parties de E telles que X ⊆ Y . On dit que X est dense dans Y siX ⊇ Y . On dit que X est dense si X = E. D’apres l’exemple precedent, Q est dense dans R.

(1.6.3) Soit X ⊆ E. La frontiere de X est l’ensemble X −X, note Fr(X). Si par exemple X

est une boule (ouverte ou fermee) de centre x et de rayon r, alors X = K(x; r),X = B(x; r) et

Fr(X) est alors la sphere S(x; r).

(1.7) Soient E, F deux K-espaces vectoriels normes, soit X une partie de E et soit f : X → F

4

Page 5: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

une fonction. Soit x0 ∈ X. On dit que f est continue en x0 si, quelque soit ε > 0, on peut trouverδ (dependant de ε), tel que pour tout x ∈ X verifiant ||x − x0|| ≤ δ, on ait ||f(x) − f(x0)|| ≤ ε.On dit que f est continue (ou continue sur X) si f est continue en tout point x0 de X.

(1.7.1) Soient X, Y deux parties de E telles que Y ⊆ X et soit x0 ∈ Y . Si la fonctionf : X → R est continue en x0, alors la restriction de f a Y est continue en x0. Rappelons que lareciproque de cet enonce est fausse : si la restriction de f a Y est continue en x0, on ne peut pasconclure que f y est continue. Prenons comme exemple le cas ou E = R, E ′ = [0,+∞[, x0 = 0 etf(x) = 1 si x ∈ E ′, f(x) = 0 si x /∈ E ′ (faire un croquis).

Soient f , g deux fonctions de X dans R et soit a ∈ R. On note respectivement f + g, f − g,af , |f |, max(f, g), min(f, g) les fonctions definies par (f + g)(x) = f(x) + g(x), (f − g)(x) =f(x)− g(x), (af)(x) = a f(x), |f |(x) = |f(x)|, max(f, g)(x) = max

(f(x), g(x)

)et min(f, g)(x) =

min(f(x), g(x)

)quelque soit x ∈ X. Si f(x) 6= 0 pour tout x ∈ X, on definit 1

fpar 1

f(x) = 1

f(x).

(1.7.2) Proposition. Soit x0 ∈ X et soient f , g : X → R deux fonctions.

(i) Si f et g sont continues en x0, il en est de meme pour f + g, pour f − g, pour af , pourfg, pour |f |, pour max(f, g), pour min(f, g) et, le cas echeant, pour 1

f.

(ii) Si f et g sont continues sur E, il en est de meme pour f + g, pour f − g, pour af , pourfg, pour |f |, pour max(f, g), pour min(f, g) et, le cas echeant, pour 1

f.

Resume de la demonstration. (i) Les cas de f+g, de f−g, de af , de fg et de 1f

sont familiers.En ce qui concerne |f |, on utilise l’inegalite ||u| − |v|| ≤ |u− v| valable quelque soit les reels u etv. Si ε > 0, et x ∈ E sont tels que |f(x)− f(x0)| ≤ ε, on a certainement ||f(x)| − |f(x0)|| ≤ ε. Ence qui concerne les cas de max(f, g) et de min(f, g), on les deduit des cas precedents en utilisantles formules

max(u, v) =u+ v + |u− v|

2, min(u, v) =

u+ v − |u− v|2

,

valables quelque soit les reels u et v. La partie (ii) decoule de la partie (i) en faisant varier x0.

(1.7.3) Proposition. Soient E, F , G trois K-espaces vectoriels normes. Soit X ⊆ E, soitY ⊆ F et soient f : X → Y , g : Y → G deux fonctions.

(i) Soit x0 ∈ X. Si f est continue en x0 et si g est continue en f(x0), alors la fonctioncomposee g f est continue en x0.

(ii) Si f est continue sur X et si g est continue sur Y , alors g f est continue sur X.

On sait que les fonctions usuelles (fonctions puissance, exponentielle, polynome, logarithmique,trigonometrique et trigonometrique reciproque) sont continues sur leur domaine de definition. Enoutre, les projections πk : Rp → R definies par πk(x1, x2, . . . , xp) = xk pour 1 ≤ k ≤ p sontcontinues. Cela permet d’etablir la continuite de fonctions numeriques E → R.

Exemples. (i) Les fonctions x 7→ ||x|| et x 7→ sin(||x||) sont continues sur Rp. (Ici, si x =

(x1, x2, . . . , xp), alors ||x|| designe la norme ||x||2 =√x2

1 + x22 + · · ·+ x2

p.) Puisque chacune des

fonctions x 7→ xk est continue, et t 7→ t2 est continue, les fonctions composees x 7→ x2k sont

continues. La somme de fonctions continues etant continue, x 7→ x21 + x2

2 + · · · + x2p est continue.

Enfin, la fonction t 7→√t est continue, et x 7→ ||x|| est la composee de t 7→

√t avec x 7→

x21 + x2

2 + · · ·+ x2p. D’ou la continuite de x 7→ ||x||. Enfin, la fonction x 7→ sin(||x||) est le compose

de la fonction sinus avec la fonction x 7→ ||x||. La fonction t 7→ sin t etant continue, il en de memepour la fonction x 7→ sin(||x||).

(ii) La fonction (u, v) 7→ min(emax(u,v), 1v) est continue sur (u, v) | R2 | v 6= 0. En effet,

puisque la fonction (u, v) 7→ min(u, v) est continue, il suffit de verifier la continuite de chacunedes deux fonctions (u, v) 7→ emax(u,v) et de (u, v) 7→ 1

v. La continuite de la premiere decoule de

5

Page 6: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

la continuite de (u, v) 7→ max(u, v) est de la fonction exponentielle et celle de la seconde de lacontinuite de (u, v) 7→ v ainsi que de t 7→ 1

tsur R∗.

(1.8) Theoreme. Soient E, F deux K-espaces vectoriels normes, soit X une partie de E,soit f : X → F une fonction et soit x0 ∈ E. Pour que f soit continue en x0, il faut et il suffit quepour toute suite (un) a valeurs dans X telle que un → x0, on ait f(un) → f(x0).

La demonstration se trouve dans les cours de premiere ou de deuxieme annee.

(1.8.1) Theoreme. Soient E, F deux K-espaces vectoriels normes, soit X une partie de E etsoit f : X → F une fonction.

(i) On suppose que X soit un ouvert. Pour que f soit continue sur X, il faut et il suffit que,quelque soit l’ouvert V de F , f−1(V ) soit un ouvert de E.

(ii) On suppose que X soit un ferme. Pour que f soit continue sur X, il faut et il suffit que,quelque soit, le ferme W de F , f−1(W ) soit un ferme de E.

A nouveau, ce resultat a ete vu en deuxieme annee. Son utilite est qu’il permet de construirefacilement des exemples d’ensembles ouverts et fermes.

(1.8.2) Exemples. (i) Verifions a nouveau qu’une boule fermee est effectivement un ferme. Eneffet, si x ∈ E et si r ∈ R∗

+, alors K(x; r) = f−1([0, r]), ou f est la fonction continue y 7→ ||y−x||.Notons que [0, r] est bien un ferme de R, car son complementaire est ]−∞, 0[∪]r,+∞[ ce qui estla reunion des intervalles ouverts ]−∞, 0[ et ]r,+∞[, donc un ouvert selon (1.4.4) (i).

(ii) On voit de meme facon que les spheres S(x; r) sont fermes, car S(x; r) = f−1(r) et lesingleton r est ferme.

(iii) Posons X = (A,B,C) ∈ R3 | B2 > 4AC. Alors X est ouvert, car si f designe lafonction f(A,B,C) = B2− 4AC, alors f est continue et X = f−1(]0,+∞[). De meme, l’ensemble(A,B,C) ∈ R3 | B2 < 4AC est ouvert et l’ensemble (A,B,C) ∈ R3 | B2 = 4AC est ferme.

(iv) Soit X = (x, y, z) ∈ R3 | x + y + z ≤ 1 et x2 + y2 + z2 = 1. Alors X = Y ∩ Z, ouY = (x, y, z) ∈ R3 | x+ y+ z ≤ 1 et Z = (x, y, z) ∈ R3 | x2 + y2 + z2 = 1. Puisque la fonctionf : (x, y, z) 7→ x+ y+ z est continue et ]−∞, 1] est ferme Y = f−1(]−∞, 1]) est ferme. De meme,Z est ferme. En appliquant (1.4.4) (ii), on conclut que X est ferme.

(1.9) Avertissement. Sauf indication contraire, l’espace vectoriel Rp est toujours considerecomme muni de la norme ||.||2. Ainsi, dans ce contexte, ||.|| designe ||.||2, 〈x, y〉 designe le produitscalaire introduit dans le (1.2) et B(x; r), K(x; r) et S(x; r) designent respectivement la bouleouverte B2(x; r), la boule fermee K2(x; r) et la sphere S2(x; r).

EXERCICES

(e1.1) Verifier que la fonction (x, y) 7→ 〈x, y〉 introduite dans (1.2) est bien un produit scalaire surRp.

(e1.2) Soit E un R-espace norme.(i) Montrer que | ||x|| − ||y|| | ≤ ||x− y|| quelque soit x, y ∈ E. (D’abord remplacer x par x− y dans

l’inegalite triangulaire.)(ii) Soient x, y ∈ E et soit r ≥ 0. Montrer que si ||y − x|| ≤ r, alors ||y|| ≤ ||x||+ r.

(e1.3) Soit E un R-espace prehilbertien.(i) Montrer que si x, y ∈ E sont orthogonaux, alors ||x + y||2 = ||x||2 + ||y||2.(ii) Montrer que pour tout x, y ∈ E, on a 〈x, y〉 = 1

2

(||x + y||2 − ||x||2 − ||y||2

).

(e1.4) (i) Montrer que l’ensemble Z des entiers relatifs est un ferme de R.

6

Page 7: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

(ii) Montrer qu’une suite a valeurs dans Z est convergente si et seulement si elle est stationnaire(c’est-a-dire constante a partir d’un certain rang).

(e1.5) Reprenons l’exemple (1.8.2) (iii). Que dire de (A,B, C) ∈ R3 | B2 ≥ 4AC et de (A,B, C) ∈R3 | B2 ≤ 4AC ?

(e1.6) On note respectivement U et F les parties⋃

n∈Z B(ne1; 12) et

⋃n∈Z K(ne1; 1

2) de Rp, ou e1

designe le point (1, 0, . . . , 0) de Rp. (Ici, comme explique dans le (1.9), B designe B2 et K designe K2.)(i) Faire un croquis de U et de F lorsque p = 1 et lorsque p = 2.(ii) Montrer que U est ouvert et F est ferme, quelque soit la valeur de p.

(e1.7) Soit E un espace vectoriel norme et soit X une partie de E. Montrer que E −X = E −X et

que l’interieur de E −X est egale a E −X.

(e1.8) Soit encore E un espace vectoriel norme et soient X, Y ⊆ E.(i) Montrer que X ∪ Y = X ∪ Y et que X ∩ Y ⊆ X ∩ Y .(ii) Trouver un exemple ou X ∩ Y 6= X ∩ Y .

(e1.9) Soit x = (x1, x2, . . . , xp) ∈ Rp. On note respectivement B1(x; r), B2(x; r), B∞(x; r) les boulesouvertes de Rp pour les normes ||.||1, ||.||2 et ||.||∞ (voir (1.2)).

(i) On prend p = 2. Tracer sur le meme croquis les ensembles B1((0, 0); 1), B2((0, 0); 1), B∞((0, 0); 1)et B1((0, 0); 2).

(ii) Montrer que pour tout pour tout z ∈ Rp, on a ||z||∞ ≤ ||z||2 ≤ ||z||1 ≤ p||z||∞.(iii) En deduire que pour tout x ∈ Rp et pour tout r > 0, on a B1(x; r) ⊆ B2(x; r) ⊆ B∞(x; r) ⊆

B1(x; pr).(iv) En deduire que la propriete d’une partie de Rp d’etre ouverte (ou fermee) ne depend pas de la

norme choisie (||.||1, ||.||2 ou ||.||∞).(v) Soit (un) une suite a valeurs dans Rp et soit λ ∈ Rp. Montrer que la propriete que (un) converge

vers λ ne depend pas de la norme choisie (||.||1, ||.||2 ou ||.||∞).

(e1.10) (i) Notons (un) =((un)1, (un)2, . . . , (un)p

)une suite a valeurs dans Rp et λ = (λ1, λ2, . . . , λp)

un element de Rp. Montrer que un → λ si et seulement si pour tout k ∈ 1, 2, . . . , p on a (un)k → λk.(Utiliser (e1.9).)

(ii) Etudier la convergence dans R2 de la suite de terme general(1+ 1

n , sin n2n

)ainsi que celle de terme

general (1, (−1)n).

(e1.11) Soit (un) une suite a valeurs dans E. Montrer que si (un) converge vers λ, alors (||un||)converge vers ||λ||. (Utiliser (e1.2) (ii).) Donner des exemples ou (un) n’est pas convergente mais (||un||)converge.

(e1.12) Le but de cet exercice est d’etudier les cas d’egalite dans l’inegalite de Cauchy-Schwarz etl’inegalite triangulaire. Pour simplicite, on suppose que le corps K soit egal a R. Soit donc E un R-espaceprehilbertien et soient x, y ∈ E. Il est clair que lorsque x = 0, les deux inegalites deviennent des egalites.On suppose donc que x 6= 0.

(i) Verifier qu’il existe (A,B, C) ∈ R3 avec A > 0 tel que ||tx + y||2 = At2 + 2Bt + C quelque soitt ∈ R. Preciser les valeurs de A, B et de C en termes de x et de y.

(ii) En utilisant le fait que ||tx + y||2 ≥ 0 pour tout t ∈ R, montrer que B2 ≤ AC avec egalite si etseulement s’il existe t ∈ R tel que tx + y = 0.

(iii) En deduire que |〈x, y〉| ≤ ||x|| ||y|| avec egalite si et seulement si y est un multiple scalaire de x,et que 〈x, y〉 = ||x|| ||y|| si et seulement si y est un multiple de x par un scalaire positif.

(iv) En developpant ||x + y||2, retrouver l’inegalite triangulaire et demontrer qu’elle devient uneegalite si et seulement si y est un multiple de x par un scalaire positif.

(v) On munit R2 de la norme ||.||1. Verifier que si x = (1, 0) et si y = (0, 1) alors ||x + y||1 =||x||1 + ||y||1. Qu’en conclure ?

7

Page 8: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

Theme 2. Compacite, connexite par arcs

(2.1) Notons encore K l’un des corps R ou C et E un K-espace vectoriel norme. On dit quela partie X de E est bornee si ||x|| | x ∈ X est une partie bornee de R. La suite (un) a valeursdans X est dite bornee si l’ensemble de ses valeurs un | n ∈ N est une partie bornee de R.Rappelons le resultat suivant.

(2.1.1) Proposition. Toute suite convergente est bornee.

(2.2) On dit que la suite (un) a valeurs dans E verifie la propriete de Cauchy (ou est deCauchy) si, etant donnee ε > 0, il existe Nε tel que ||um − un|| ≤ ε quelque soient m, n ≥ Nε.

(2.2.1) Theoreme. (i) Toute suite convergente est de Cauchy.

(ii) Si E est de dimension finie, alors toute suite de Cauchy est convergente.

A nouveau, ce resultat fondamental a ete vu en deuxieme annee.

(2.3) La partie X de E est dite compacte (ou un compact) si toute suite a valeurs dans Xpossede une suite extraite convergente dans X.

(2.3.1) Theoreme de Bolzano-Weierstrass. (i) Une partie compacte de E est ferme etborne.

(ii) Si E est de dimension finie, alors toute partie fermee et bornee de E est compacte.

Exemple. Lorsque E est de dimension finie, les boules fermees et les spheres sont compactes.C’est le cas notamment lorsque E = Rp.

(2.4) Il est important de souligner que l’hypothese que E soit de dimension finie est indispen-sable dans les parties (ii) des theoremes (2.2.1) et (2.3.1). Nous revenons sur ce point brievementdans le theme 9. En general, on appelle espace de Banach (respectivement espace de Hilbert)un espace vectoriel norme (respectivement un espace prehilbertien) ou toute suite de Cauchy estconvergente. Il existe des espaces de Hilbert et de Banach de dimension infinie. Par contre, dansun espace vectoriel norme de dimension infinie, on peut montrer qu’une boule fermee n’est jamaiscompacte.

(2.4.1) Mentionnons brievement un exemple simple d’un espace vectoriel norme (E, ||.||) quin’est pas un espace de Banach. On prend pour E l’espace vectoriel des suites (un)n≥1 telles queun = 0 pour tout indice n a un nombre fini d’exceptions pres. La loi d’addition est donnee par :si (un) et (vn) sont deux elements de E, (un) + (vn) est la suite (un + vn). L’element 0 est la suitedont tous les termes sont nuls et l’oppose de la suite (un) est la suite (−un). Enfin, si λ ∈ K et si(un) ∈ E, on pose λ(un) = (λun).

Munissons E de la norme ||(un)|| = supn |un|. Nous cherchons une suite d’elements de E qui

verifie la propriete de Cauchy mais qui n’est pas convergente. Considerons pour cela la suite (u(1)n ),

8

Page 9: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

(u(2)n ), . . ., (u

(k)n ), . . ., (indexee par k), ou u

(k)n = 1

nsi n ≤ k et u

(k)n = 0 pour tout n > k. Ainsi,

(u(1)n ) = (1, 0, 0, 0, . . . , 0, 0, 0, . . . , )

(u(2)n ) = (1, 1

2, 0, 0, . . . , 0, 0, 0, . . . , )

(u(3)n ) = (1, 1

2, 1

3, 0, . . . , 0, 0, 0, . . . , )...

(u(k)n ) = (1, 1

2, 1

3, 1

4, . . . , 1

k, 0, 0, . . . , )

(u(k+1)n ) = (1, 1

2, 1

3, 1

4, . . . , 1

k, 1

k+1, 0, . . . , )

...

On remarque que si ` < k, alors

(u(k)n )− (u(`)

n ) = (u(k)n − u(`)

n ) = (0, 0, 0, 0, . . . , 1`+1

, 1`+2

, . . . , 1k, 0, 0, . . . , ),

(autrement dit, u(k)n − u

(`)n = 0 si n ≤ ` ou si n > k et u

(k)n − u

(`)n = 1

nsi ` < n ≤ k). On a alors

||(u(k)n )− (u(`)

n )|| = 1`+1

,

ce qui tend vers 0 lorsque ` tend vers +∞. On voit donc que (u(k)n ) est bien une suite de Cauchy.

Si on fixe l’indice n, on voit que u(k)n = 0 si k < n et u

(k)n = 1

nsi k ≥ n et donc la suite de reels

u(k)n converge vers 1

n. Ca suggere que, lorsque k → +∞, la suite (u

(k)n ) devrait converger vers la

suite

(∗) (un) = (1, 12, 1

3, . . . , 1

n, . . . , ).

Le probleme est que la suite (∗) n’appartient pas a E, car elle contient une infinite de termes

non-nuls. (En fait, tous les termes sont non-nuls). Afin de justifier rigoureusement que (u(k)n ) ne

converge vers aucun element de E, on raisonne par l’absurde. Supposons donc que (u(k)n ) converge

vers une suite (vn) appartenant a E. Choisissons un indice m tel que vm = 0. Pour tout k > m,

on a u(k)m = 1

m. Mais |u(k)

m − vm| ≤ maxn |u(k)n − vn| = ||(u(k)

n ) − (vn)|| ce qui tend vers 0 lorsque

k → +∞. Puisque u(k)m = 1

mlorsque k ≥ m et vm = 0, on en tire que 1

m= |u(k)

m − vm| → 0 lorsquek → +∞, ce qui est absurde.

(2.4.2) Remarquons egalement que, avec les notations qui viennent d’etre introduites, on a

||(u(k)n )|| = 1 quelque soit k et, par consequent, tous les membres de la suite (u

(k)n ) appartiennent

a la boule unite fermee unite de E. Mais (u(k)n ) ne contient aucune suite extraite convergente.

La demonstration est essentiellement la meme que celle du fait que la suite elle-meme n’est pasconvergente. Par consequent, la boule fermee unite de E n’est pas compacte, ce qui montre que laconclusion du point (ii) du theoreme de Bolzano-Weierstrass n’est pas forcement vraie si on ometl’hypothese que E soit de dimension finie.

(2.5) Theoreme. Soit X une partie compacte non-vide de R. Alors X possede un plus grandelement et un plus petit element.

Demonstration. Considerons le cas du plus grand element : un raisonnement semblable permetalors de traiter le cas du plus petit element. D’apres le theoreme de Bolzano-Weierstrass, X estbornee, et possede donc une borne superieure supX. Il s’agit de montrer que supX ∈ X (voir(A.2.2)). Soit alors n ∈ N∗. Il existe un ∈ X tel que (supX) − 1

n≤ un ≤ supX. La suite (un)

9

Page 10: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

converge alors vers supX. Puisque X est fermee, sa limite appartient a X, et on a donc biensupX ∈ X.

(2.6) Theoreme. Soient E, F , deux espaces vectoriels normes et soit X une partie de E. Sif : X → R une fonction continue et si Y ⊆ X est compact alors f(Y ) est compact.

Demonstration. Soit (αn) une suite a valeurs dans f(Y ). Pour tout n, il existe un ∈ Y tel quef(un) = αn. Puisque Y est compact, on peut extraire de (un) une suite convergente (unk

). Notonsλ sa limite : puisque Y est ferme on sait que λ ∈ X. Il s’ensuit que f(λ) ∈ f(Y ). Enfin, f etantcontinue, (αnk

) =(f(unk

))

converge vers f(λ).

(2.6.1) Corollaire. Soit X une partie de E, soit Y ⊆ X un compact et soit f : X → R unefonction continue. Alors f possede un maximum et un minimum sur Y .

Demonstration. Dire que f possede un maximum sur Y signifie qu’il existe x ∈ Y tel quef(y) ≤ f(x) quelque soit y ∈ Y . Autrement dit, qu’il existe x ∈ Y tel que f(x) = sup f(Y ).D’apres le theoreme, on sait que f(Y ) est compact. Il suffit alors d’appliquer le theoreme (2.5).De meme pour le minimum.

Exemple. Reprenons l’exemple (0.1.2) de l’Introduction. La sphere S = (x, y, z) ∈ R3 |x2 + y2 + z2 = 1 etant compacte et la fonction f : (x, y, z) 7→ x + 2y + 3z etant continue, lecorollaire montre que f a un maximum et un minimum sur S. Par contre, il ne fournit pas demethode convenable pour trouver les valeurs de (x, y, z) qui realisent le maximum ou le minimum.Nous decriverons une telle methode dans le theme 5.

Le corollaire montre encore que toute fonction continue sur S a un maximum et un minimumsur S.

(2.7) Soit E un K-espace vectoriel et soit ||.|| et ||.||′ deux normes sur E. On dit que la norme||.||′ domine la norme ||.|| s’il existe une constante A > 0 telle que ||x|| ≤ A||x||′ pour tout x ∈ E.Deux normes sur le meme espace vectoriel sont dites equivalentes si chacune domine l’autre.L’equivalence des normes est une relation d’equivalence sur l’ensemble des normes sur un espacevectoriel donne.

(2.7.1) Proposition. Si la norme ||.||′ domine la norme ||.||, alors la fonction x 7→ ||x|| estune fonction continue de l’espace norme (E, ||.||′) vers R.

En effet, par hypothese il existe A > 0 tel que ||x|| ≤ A||x||′ pour tout x ∈ E. Fixons x0 ∈ E etmontrons la continuite en x0. Soit ε > 0. On pose δ = ε

A. Alors ||x−x0|| ≤ ε des que ||x−x0||′ ≤ δ.

L’exercice (e1.9) montre que, sur Rp, les normes ||.||1, ||.||2 et ||.||∞ sont equivalentes. C’estun cas particulier du resultat suivant.

(2.7.2) Theoreme. Soit E un K-espace vectoriel de dimension finie. Alors toutes les normessur E sont equivalentes.

Demonstration. La demonstration peut se faire par recurrence sur la dimension de E. Maisle theoreme peut egalement etre vu comme une application des resultats precedentes. Puisquel’equivalence de normes est une relation d’equivalence, il suffit de montrer que toute norme sur Eest equivalente a une norme fixee. Soit (x1, x2, . . . , xn) une base de E. On note ||.||1,E la normedefinie par ||x||1,E =

∑ni=1 |λi|, ou les λi sont les coefficients dans l’ecriture x =

∑i λixi de x dans

la base (x1, x2, . . . , xn). Nous allons montrer que toute norme ||.|| sur E est equivalente a la norme||.||1,E.

Soit donc ||.|| une norme sur E. Montrons d’abord que ||.||1,E domine ||.||. Posons pour cela

10

Page 11: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

A = maxi ||xi||1,E. Si x =∑n

i=1 λixi, alors

||x|| = ||n∑

i=1

λixi|| ≤n∑

i=1

|λi| ||xi|| ≤ A

n∑i=1

|λi| = A||x||1,∞,

ce qui montre bien que ||.||1,∞ domine ||.||.Il s’ensuit que x 7→ ||x|| est une fonction continue de l’espace norme (E, ||.||1,E). Puisque E

est de dimension finie, la sphere unite S de cet espace est compact et, par consequent, la fonctionx 7→ ||x|| a un minimum sur cette sphere. Il existe donc B et z ∈ S tel que ||y|| ≥ ||z|| = B pourtout y ∈ S. Puisque z ∈ S, on a z 6= 0 et donc B > 0. Soit enfin x ∈ E, x 6= 0. Alors x/||x||1,E ∈ Set donc ||x/||x||1,E|| ≥ B. Par consequent, ||x|| ≥ B||x||1,E et donc ||x||1,E ≤ 1

B||x||, ce qui veut

dire que ||.|| domine ||.||1,∞.

(2.7.3) L’interet des normes equivalentes reside dans le fait que les notions de convergence,continuite, ouvert, ferme, compacte, . . ., ne dependent pas de la norme a equivalence pres. Au-trement dit, si ||.|| et ||.||′ sont deux normes equivalentes sur E, la suite (un) d’elements de Econverge dans (E, ||.||) si et seulement si elle converge dans (E, ||.||′) (et alors les deux limites sontles memes), elle verifie la propriete de Cauchy dans (E, ||.||) si et seulement si elle la verifie dans(E, ||.||′), un ensemble de E est un ouvert de (E, ||.||) si et seulement s’il est un ouvert de (E, ||.||′),. . .. En particulier, lorsque E est de dimension finie, on peut parler de convergence, propriete deCauchy, . . ., sans avoir besoin de preciser la norme.

(2.8) Soit X une partie de E. On dit que X est connexe par arcs si, etant donne x, y ∈ X,il existe une fonction continue φ : [0, 1] → X telle que φ(0) = x et φ(1) = y. Une telle fonction fs’appelle un arc joignant x a y.

Intuitivement, X est connexe par arcs si on peut bouger de facon continue entre deux pointsde X sans le quitter.

Par exemple, E est connexe par arcs. En effet, si x, y ∈ E l’arc le plus simple joignant x a yest sans doute le segment droit, ou φ(t) = (1− t)x+ ty.

(2.8.1) Soit X ⊆ E et soient x, y et z ∈ E. S’il existe un arc dans X joignant x a y et unarc dans X joignant y a z, alors il existe un arc dans X joignant x a z. Intuitivement, il suffitde suivre le premier arc puis le second. Mathematiquement, on peut exprimer ce fait ainsi : siφ : [0, 1] → X, θ : [0, 1] → X sont continues et si φ(0) = x, si φ(1) = y, si θ(0) = y et si θ(1) = z,alors la fonction ψ : [0, 1] → X definie par ψ(x) = φ(2x) si x ∈ [0, 1

2] et par ψ(x) = θ(2x − 1) si

x ∈ [12, 1] est continue et verifie ψ(0) = x et ψ(1) = y.

Exemples. (i) On dit que X est etoile s’il existe x ∈ X tel que, pour tout y ∈ X, le segmentdroit joignant x a y appartienne a X. D’apres ce qui precede, toute partie etoilee est connexe pararcs. En particulier, toute boule (ouverte ou fermee) est etoilee, donc connese par arcs.

(ii) Si X et Y sont connexes par arcs et si X ∩ Y 6= ∅, alors X ∪ Y est connexe par arcs. Eneffet, si par exemple y1 ∈ X et y2 ∈ Y , on construit un arc passant de y1 a y2 en passant d’abordde y1 a un point x ∈ X ∩ Y puis de x a y2.

(iii) Si X est connexe par arcs, alors tout translate x+a | x ∈ X (ou a ∈ A) est connexe pararcs. Si F est un second K-espace vectoriel norme, si f : E → F est continu et si X ⊆ E connexepar arcs, alors f(X) est connexe par arcs. Les demonstrations de ces resultats sont faciles.

(iv) Une notion voisine a celle de connexite par arcs et celle de connexite. Tout connexe pararcs est connexe mais il existe des connexes qui ne sont pas connexes par arcs. Toutefois, pourdes ouverts d’un espace vectoriel norme, les deux notions sont equivalentes. Elles sont egalementequivalentes pour les parties de R ; dans ce cas, les connexes par arcs sont les intervalles. Ontrouvera des plus amples details dans les cours de topologie destines aux etudiants en licence demathematiques.

11

Page 12: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

(2.9) Un arc polygonal joignant x a y est un arc γ de la forme suivante : il existe un entiern ≥ 1 et des points xr (0 ≤ r ≤ n) tels que x = x0 et xn = y et γ est obtenu en prenantsuccessivement les segments droits joignant xr−1 a xr pour r = 1, 2, . . ., n.

(2.9.1) Proposition Soit U ⊆ E un ouvert et soient x, y ∈ U . S’il existe un arc parametredans U joignant x a y, alors il existe un arc polygonal dans U joignant x a y.

Pour la demonstration, on se reporte a nouveau au cours de licence de mathematiques.

(2.10) La partie X de E est dite convexe si, quelque soit x, y ∈ E, le segment droit joignantx a y est contenu dans X. Il est clair que tout convexe est connexe par arcs, mais la reciproqueest inexacte. L’intersection d’une famille de parties convexes de E est convexe. Si X est convexe,alors tout translate de X, x + a | x ∈ X (ou a ∈ A) est convexe. Si F est un second K-espacevectoriel norme, si φ : E → F est lineaire et si X est un convexe de E, alors φ(X) est convexe. Anouveau, les demonstrations de ces resultats sont faciles.

(2.10.1) Toute boule (ouverte ou fermee) est convexe, donc connexe par arcs.Demonstration. Quitte a effectuer une translation, il suffit de considerer le cas d’une boule

centree a l’origine. Soient x, y ∈ E et soit r > 0 tel que ||x|| < r, ||y|| < r. Si t ∈ [0, 1], alors1− t ∈ [0, 1] et ||(1− t)x+ ty|| ≤ ||(1− t)x||+ ||ty|| ≤ (1− t)||x||+ t||y|| ≤ (1− t)r + tr = r. Leresultat en decoule aussitot.

On remarquera que la definition de partie convexe de E ne fait pas intervenir la norme de E,mais seulement la structure d’espace vectoriel. Le fait qu’une boule soit necessairement convexe estdonc tout a fait remarquable. Reciproquement, on peut utiliser des ensembles convexes convenablessur un espace vectoriel pour construire des normes (voir (e2.11)).

(2.10.2) Soit X ⊆ E un convexe et soit f : X → R une application. On dit que f estconvexe (respectivement concave) si, quelque soient x, y ∈ X et quelque soit t ∈ [0, 1], on af((1− t)x+ ty) ≤ (1− t)f(x) + tf(y) (respectivement f((1− t)x+ ty) ≥ (1− t)f(x) + tf(y)).

EXERCICES

(e2.1) Soit (un) =((un)1, (un)2, . . . , (un)p

)une suite a valeurs dans Rp. Montrer que (un) est de

Cauchy si et seulement si chacune des suites reelles (un)k, 1 ≤ k ≤ p est de Cauchy. (S’inspirer de(e1.10).) En deduire le theoreme (2.2.1) a partir du cas p = 1.

(e2.2) Soit X = (x, y) ∈ R2 | x ≤ y ≤ 2x. Faire un croquis de X. Montrer que X est ferme. Xest-il compact ? connexe par arcs ?

(e2.3) Posons X = (x, y) ∈ R2 | |x| + 2|y| < 1. Faire un croquis de X. Montrer que X est borne.X est-il compact ? connexe par arcs ?

(e2.4) Soit X l’ensemble⋃

n∈Z K2((n, 0), 12) dans R2. Croquis !

(i) Montrer que X est connexe par arcs.(ii) X est-il compact ?

(e2.5) Soit X une partie finie de E. Montrer que X est compacte. Donner une condition necessaireet suffisante pour que X soit convexe.

(e2.6) Quels sont les intervalles compacts dans R ?

(e2.7) Soit I ⊆ R un intervalle et soit f : I → R une fonction continue. Utiliser les resultats sur laconnexite de ce theme ainsi que l’exercice precedent pour demontrer les deux resulats suivants, vus en1ere annee :

12

Page 13: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

(i) (Theoreme des valeurs intermediaires). f(I) est un intervalle.(ii) Si I est un intervalle ferme et borne, alors f(I) est un intervalle ferme est borne.

(e2.8) Soit f : R2 → R3 la fonction definie par f(x, y) = (cos x, sinx cos y, sinx sin y).(i) Expliquer pourquoi f est continue.(ii) Montrer que f(R2) = S((0, 0, 0), 1), la sphere de centre l’origine et de rayon 1.(iii) En deduire que S((0, 0, 0), 1) est connexe par arcs.

(e2.9) Soit X une partie non-vide de E. Pour tout x ∈ E, on pose d(x,X) = inf||y − x|| | y ∈ X.Ainsi, x 7→ d(x, X) est une fonction E → R, appelee souvent la distance de x a X.

(i) Montrer que d(x,X) = 0 si et seulement si x ∈ X.(ii) Montrer que pour tout x, x′ ∈ E, on a |d(x,X)− d(x′, X)| ≤ ||x− x′||. (Montrer d’abord que si

y ∈ X, alors d(x, X) ≤ ||x− y|| ≤ ||x− x′||+ ||x′ − y||.) En deduire que x 7→ d(x, X) est continue.(iii) Soit K un compact de E. Montrer que x 7→ d(x,X) a un minimum et un maximum sur K.(iv) On suppose X compact. Montrer que x ∈ E | d(x, X) ≤ r est ferme et borne quelque soit

r ≥ 0. En deduire que, lorsque E est de dimension finie, x ∈ E | d(x,X) ≤ r est compact.Si Y est une seconde partie de E, on pose d(X, Y ) = inf||y − x|| | x ∈ X, y ∈ Y .(v) Montrer que si K est compact, si Y est ferme et si K ∩ Y = ∅, alors d(K, Y ) > 0.(vi) Donner un exemple de deux fermes A et B de R2 tels que A ∩B = ∅ et d(A,B) = 0.

(e2.10) (i) Soit (Kn) une suite de compacts non-vides dans E telle que Kn ⊇ Kn+1 pour tout n.Montrer que

⋂n∈N Kn est non-vide. (Considerer une suite (un) avec un ∈ Kn pour tout n.)

(ii) Donner un exemple d’une suite (Fn) de fermes non-vides de R telle que Fn ⊇ Fn+1 pour tout nmais

⋂n∈N Fn = ∅.

(e2.11) Soit E un R-espace vectoriel et soit X une partie de E verifiant les proprietes suivantes.(a) X est convexe,(b) si x ∈ X, alors −x ∈ X,(c) si x ∈ E, alors il existe λ > 0 tel que λx ∈ X,(d) si x ∈ E − 0, alors il existe µ > 0 tel que µx /∈ X.(i) Montrer que 0 ∈ X et que, si x 6= 0, l’ensemble λ ∈ R+ | λx ∈ X est un intervalle qui est de

l’une des formes [0, t] ou [0, t[, ou t > 0.On pose ||x|| = 0 lorsque x = 0 et ||x|| = 1/t lorsque x 6= 0, t etant comme dans la question (i).(ii) Montrer que ||.|| est une norme sur E.(iii) Montrer que B(0; 1) ⊆ X ⊆ K(0; 1).

(e2.12) On reprend l’espace E introduit au (2.4.1). On note encore ||.|| la norme sur E definie au(2.4.1) et ||.||′ la norme definie par ||(un)||′ =

∑n≥1 |un|.

(i) Justifier en detail que ||.||′ est bien une norme.(ii) Montrer que ||.||′ domine ||.|| mais que ||.|| ne domine pas ||.||′. (On pourra considerer les elements

(v(k)n ) (ou k = 1, 2, . . .) de E definis par v

(k)n = 1 si n ≤ k et v

(k)n = 0 si n > k.)

La question (ii) montre que, sur un espace vectoriel de dimension infinie, il peut exister des normesqui ne sont pas equivalentes.

Theme 3. Derivees partielles, formule de Taylor

(3.1) Soit E un R-espace vectoriel norme. On appelle domaine de E toute partie ouverteconnexe par arcs de E.

(3.1.1) Fixons un entier p ≥ 1. On note (e1, e2, . . . , ep) la base standard de Rp : par definition,ek est l’element (0, 0, . . . , 0, 1, 0, . . . , 0) de Rp, la k-ieme coordonnee etant egale a 1 et toutes lesautres coordonnees etant nulles.

13

Page 14: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

Soit Ω un domaine dans Rp et soit f : Ω → R une fonction. Soit a ∈ Ω et soit k ∈ 1, 2, . . . , p.La k-ieme derivee partielle de f en a est, par definition, la limite

(*) limt→0

f(a+ tek)− f(a)

t,

si cette limite existe. Lorsque c’est le cas, on la note f ′k(a) ou ∂f∂xk

(a), si la variable est designeepar x = (x1, x2, . . . , xp).

Notons que, puisque Ω est ouvert, a+tek appartient bien a Ω lorsque |t| est suffisamment petit.Si E ⊆ Ω et si f ′k(a) existe pour tout a ∈ E, on obtient ainsi une fonction E → R qui est encorenotee f ′k ou ∂f

∂xk. Si toutes les derivees partielles f ′1, f

′2, . . ., f ′p existent sur E, on appelle gradient

de f et on note grad(f) ou f ′ la fonction E → Rp definie par f ′(x) =(f ′1(x), f

′2(x), . . . , f

′p(x)

).

Si a = (a1, a2, . . . , ap), l’existence de la limite (∗) equivaut a la derivabilite en ak de la fonctiond’une seule variable t definie par t 7→ f(a0, a1, . . . , ak−1, t, ak+1, . . . , ap). Si par exemple p = 2,Ω = R2 et f(x, y) = ex sin y, on trouve

f ′1(x, y) =∂f

∂x= (sin y) ex sin y, f ′2(x, y) =

∂f

∂y= x(cos y) ex sin y.

Il s’ensuit que f ′(x, y) =((sin y) ex sin y, x(cos y) ex sin y

).

(3.1.2) Notons que si la k-ieme derivee partielle de f existe en a, alors

f(a+ tkek) = f(a) + tkf′k(a) + |tk|ε(tk),

ou ε(tk) → 0 lorsque tk → 0.

(3.1.3) Soit v ∈ Rp − 0. La derivee directionnelle de f en a dans la direction v est, pardefinition, la limite

limt→0

f(a+ tv)− f(a)

t,

si cette limite existe. En particulier, la k-ieme derivee partielle est egale a la derivee directionnelledans la direction ek.

(3.2) On dit que f est de classe C(1) sur Ω si, pour tout k ∈ 1, 2, . . . , p, f ′k existe et estcontinue sur Ω.

(3.2.1) Theoreme. Soit f de classe C(1) sur Ω. Alors pour tout h = (h1, h2, . . . , hp) ∈ Rp avec||h|| suffisamment petit, on a

f(a+ h1e1 + h2e2 + · · ·+ hpep

)= f(a) + 〈h, f ′(a)〉+ ε(h)||h||,

ou ε(h) → 0 lorsque h→ 0.Pour tout v ∈ Rp − 0, la derivee directionnelle de f en a dans la direction de v existe et

vaut 〈v, f ′(a)〉.Le produit scalaire 〈., .〉 est celui defini au (1.2).

(3.2.2) Demonstration de (3.2.1). Limitons-nous au cas p = 2, le cas general se traitant de lameme maniere. On ecrit alors

f(a+ h1e1 + h2e2)− f(a) =(f(a+ h1e1 + h2e2)− f(a+ h2e2)

)+(f(a+ h2e2)− f(a)

).

14

Page 15: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

Ici, f(a+h2e2)− f(a) = h2f′2(a)+h2ε2(h2) et f(a+h1e1 +h2e2)− f(a+h2e2) = h1f

′1(a+h2e2)+

h1ε1(h1) ou εk(hk) → 0 lorsque hk → 0 (k = 1, 2). On peut donc ecrire

f(a+h1e1 + h2e2) =

= f(a) + h1f′1(a) + h2f

′2(a) + h1

(f ′1(a+ h2e2)− f ′1(a)

)+ h1ε1(h1) + h2ε2(h2)

= f(a) + 〈h, f ′(a)〉+ 〈h, (f ′1(a+ h2e2)− f ′1(a) + ε1(h1), ε2(h2))〉.

Or,

|〈h, (f ′1(a+ h2e2)− f ′1(a) + ε1(h1), ε2(h2))〉| ≤ ||h|| ||(f ′1(a+ h2e2)− f ′1(a) + ε1(h1), ε2(h2))||

et f ′1(a+ h2e2)− f ′1(a) → 0 lorsque h2 → 0 car f est de classe C(1). On en tire que (f ′1(a+ h2e2)−f ′1(a) + ε1(h1), ε2(h2)) → (0, 0) lorsque h→ 0.

Si v ∈ Rp − 0 et si t ∈ R, alors d’apres ce qui precede, on a

f(a+ tv) = f(a) + 〈tv, f ′(a)〉+ ε(tv)||tv|| = f(a) + t〈v, f(a)〉+(ε(tv)||v||

)|t|

d’ouf(a+ tv)− f(a)

t= 〈v, f ′(a)〉+ ε(tv)||v||

ce qui tend vers 〈v, f ′(a)〉 lorsque t→ 0.

(3.3) Soit a ∈ Ω. On dit que la fonction f : Ω → R est differentiable en a, s’il existe uneapplication lineaire La : Rp → R telle que pour tout h ∈ Rp dont la norme est suffisament petite,on ait f(a+h) = f(a)+La(h)+ ε(h)||h||. Ici comme precedemment, on suppose ε(h) → 0 lorsqueh→ 0. On montre que si f est differentiable en a, alors l’application La est unique. On l’appellealors la differentielle de f en a et on la note dfa. La fonction f est dite differentiable sur Ωsi elle est differentiable en tout point de Ω.

(3.3.1) Proposition. Toute fonction f sur Ω de classe C(1) est differentiable. Si a ∈ Ω, alorsdfa(h) = 〈h, f ′(a)〉 quelque soit h ∈ Rp.

Demonstration. Il suffit d’appliquer (3.2.1).

(3.3.2) Proposition. Soit f : Ω → R de classe C(1). Pour tout a ∈ Ω, on a

dfa =

p∑k=1

f ′k(a)(dxk)a.

Demonstration. Soit h ∈ Rp. On a (dxk)a(h) = 〈h, ek〉 et f ′(a) =∑p

k=1 f′k(a)ek. Il suffit de

substituer ces formules dans la proposition precedente.

(3.3.3) Soit f de classe C(1) sur Ω. On note alors df l’application a 7→ dfa. Il s’agit d’uneapplication de Ω dans le R-espace vectoriel L(Rp,R) des application lineaires de Rp dans R. Aveccette notation, la proposition precedente implique que

df =

p∑k=1

f ′k dxk.

(3.4) Soit U un ouvert de R et soit γ : U → Rp une application. Alors γ = (γ1, γ2, . . . , γp) ouchacune des γk est une application de U dans R. Si a ∈ U , on dit que γ est derivable en a si

15

Page 16: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

chacune des γk l’est. De meme, γ est derivable sur U si chacune des γk l’est et de classe C(1) sichacune des γk est continument derivable.

Soit Ω un domaine de Rp. Supposons que γ prenne ses valeurs dans Ω. Si f : Ω → Rp estune application, on a l’application composee f γ : U → R. Si f et γ sont continues, il en estde meme pour f γ. Si f et γ sont de classe C(1), on a la formule pour la derivee d’une fonctioncomposee :

(3.4.1) Proposition. Soient f : Ω → R, γ : U → Ω de classe C(1). Alors pour tout t ∈ E, ona

(f γ)′(t) = 〈γ′(t), (f ′(γ(t)))〉.

Demonstration. Soit u ∈ R suffisament petit pour que t + u ∈ E. Posons alors a = γ(t),h = φ(t+ u)− φ(t), de sorte que φ(t+ u) = a+ h. On en tire que

f γ(t+ u) = f(a+ h) = f(a) + 〈h, f ′(a)〉+ ε(h)||h||= f(γ(t)) + 〈h, f ′(γ(t))〉+ ε(h)||h||.

Dans cette formule, on ecrit h = γ(t + u) − γ(t) = uγ′(t) + uη(u), ou η(u) → 0 lorsque u → 0.Etudions d’abord le terme 〈h, f ′(γ(t))〉. On trouve

〈h, f ′(γ(t))〉 = u〈γ′(t), f ′(γ(t))〉+ u〈η(u), f ′(γ(t))〉.

D’apres l’inegalite de Cauchy-Schwarz, |〈η(u), f ′(γ(t))〉| ≤ ||η(u)|| ||f ′(γ(t))||, ce qui tend vers 0lorsque u→ 0. En ce qui concerne le terme ε(h)||h||, on a d’abord ||h|| = |u| ||γ′(t) + η(u)|| puis

ε(h)||h|| = ε(u(γ′(t) + η(u))

)|u| ||γ′(t) + η(u)||.

Ici, ||γ′(t) + η(u)|| reste borne lorsque u → 0 et donc ε(u(γ′(t) + η(u))

)→ 0 lorsque u → 0. Au

total, donc, on af γ(t+ u) = f(γ(t)) + u〈γ′(t), f ′(γ(t))〉+ θ(u)|u|

ou θ(u) → 0 lorsque u→ 0, ce qui permet de conclure en utilisant (3.2.1).

(3.5) Theoreme des accroissements finis. Soit Ω un domaine de Rp et soit f : Ω → Rune fonction de classe C(1). Soit a, b ∈ Ω, soit [a, b] le segment droit joignant a a b et soit]a, b[= [a, b]− a, b. On suppose que [a, b] ⊆ Ω. Alors il existe c ∈]a, b[ tel que

f(b)− f(a) = 〈b− a, f ′(c)〉.

Pour la demonstration, on reduit au cas d’une fonction d’une seule variable, dont nous rappe-lons d’abord l’enonce :

(3.5.1) Theoreme. Soient u < v deux reels et soit φ : [u, v] → R une fonction continue,derivable sur ]u, v[. Alors il existe w ∈]u, v[ tel que φ(v)− φ(u) = (v − u)φ′(w).

Demonstration de (3.5). On applique ce resultat avec φ : [0, 1] → R definie par φ(t) =f((1− t)a+ tb

). Autrement dit, φ = f γ, ou γ : [0, 1] → Ω est donnee par γ(t) = (1− t)a+ tb.

En appliquant (3.4.1), on trouve

φ′(t) = 〈γ′(t), f ′(γ(t))〉 = 〈b− a, f ′(γ(t))〉.

D’apres (3.5.1), il existe w ∈]0, 1[ tel que φ(1)−φ(0) = φ′(w). Si l’on pose c = γ(w), alors c ∈]a, b[et f(b)− f(a) = 〈b− a, f ′(c)〉 comme voulu.

16

Page 17: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

(3.5.2) Corollaire. Soit Ω un domaine et soit f : Ω → R une application de classe C(1). Sif ′ = 0, alors f est constante.

Demonstration. Fixons a ∈ Ω. Il suffit de montrer que f(b) = f(a) quelque soit b ∈ Ω. Or,d’apres (2.9.1), il existe un arc polygonal joignant a a b. Un tel arc est reunion de segmentsdroits [a, x1], [x1, x2], . . ., [xn−1, b], chacun de ces segments etant contenu dans Ω. D’apres letheoreme (3.5), il existe c1 ∈]a, x1[ tel que f(x1) − f(a) = 〈x1 − a, f ′(c1)〉. Puisque f ′ = 0, onen tire que f(x1) = f(a). En appliquant le theoreme (3.5) de la meme maniere sur chacun dessegments [x1, x2], . . ., [xn−1, b], on trouve successivement f(x2) = f(x1), . . ., f(b) = f(xn−1). Doncf(b) = f(xn−1) = · · · = f(x2) = f(x1) = f(a).

(3.6) Soit Ω un domaine dans R2 et soit f : Ω → R une application de classe C(1). Letheoreme des fonctions implicites affirme que si (a, b) ∈ Ω verifie f(a, b) = 0 et f ′2(a, b) 6= 0,alors il existe un intervalle ouvert I contenant a et une application γ : I → R de classe C(1) telleque γ(a) = b et f

(u, γ(u)

)= 0 pour tout u ∈ I. Si en outre on suppose I suffisamment petit,

alors γ est uniquement determinee par ces conditions. Geometriquement parlant, cela veut direque sur un voisinage du point (a, b), l’ensemble des solutions (u, v) de f(u, v) = 0 est representepar la courbe v = γ(u).

En outre, en appliquant (3.4.1) a la fonction u 7→ f(u, γ(u)) = 0, on trouve f ′1(u, γ(u)) +γ′(u)f ′2(u, γ(u)) = 0. Par consequent, la pente de la tangente de la courbe au point (u, v), ou

v = γ(u), est γ′(u) = −f ′1(u,v)

f ′2(u,v)et le vecteur f ′(u, v) est normale a la courbe.

De la meme facon, si f ′1(a, b) 6= 0, il existe un voisinage de (a, b) sur lequel l’ensemble dessolutions (u, v) de f(u, v) = 0 est une courbe de la forme u = δ(v), δ etant une fonction de classeC(1) telle que δ(b) = a. A nouveau, le vecteur f ′(u, v) est normale a la courbe.

On en tire donc que si f : Ω → R est de classe C(1) et si f n’a pas de point critique dansΩ, alors l’ensemble des solutions (u, v) de f(u, v) = 0 est une courbe (ou reunion de courbes)contenue dans Ω (pourvu qu’il soit non-vide). Le vecteur f ′(u, v) est toujours normale a la courbeau point (u, v).

(3.7) Soit Ω ⊆ Rp un domaine. Rappelons que toute fonction f : Ω → Rq s’ecrit f =(f1, f2, . . . , fq), ou les fk sont des fonctions de Ω dans R. On dit que f est de classe C(1) sichacune des fonctions fk est de classe C(1). Lorsque c’est le cas, il existe pour tout a ∈ Ω uneunique application lineaire dfa : Rp → Rq telle que f(a+ h) = f(a) + dfa(h) + ε(h)||h|| pour touth ∈ Rp tel que a+ h ∈ Ω, et ε(h) → 0 lorsque h→ 0. A nouveau, dfa s’appelle la differentiellede f en a. On a alors dfa =

((df1)a, (df2)a, . . . , (dfq)a

).

Si Ω′ est un domaine de Rq, si f : Ω → Ω′ et g : Ω′ → Rr sont de classe C(1), alors gf : Ω → Rr

est de classe C(1) et pour tout a ∈ Ω on a d(g f)a = dgf(a) dfa.

(3.7.1) Soit f : Ω → Rq une fonction de classe C(1) et soit a ∈ Ω. La matrice jacobienne def en a est par definition la matrice a q lignes et p colonnes

Mf (a) =

∂f1

∂x1(a) ∂f1

∂x2(a) · · · ∂f1

∂xp(a)

∂f2

∂x1(a) ∂f2

∂x2(a) · · · ∂f2

∂xp(a)

......

. . ....

∂fq

∂x1(a) ∂fq

∂x2(a) · · · ∂fq

∂xp(a)

.

Il s’agit de la matrice de dfa par rapport aux bases standard de Rp et de Rq.

(3.7.2) Lorsque q = p, le jacobien de f en a est par definition le determinant de Mf (a) : ilest note Jf (a). Notons alors que a 7→ Jf (a) est une fonction de classe C(1) de Ω dans R.

17

Page 18: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

Exemple. Soit f : R2 → R2 definie par f(x, y) = (x2y, xy2). Alors Mf (x, y) =

(2xy x2

y2 2xy

). Il

s’ensuit que Jf (x, y) = 3x2y2.

(3.7.3) Proposition. Soit Ω′ ⊆ Rq un domaine. Soient f : Ω → Ω′ et g : Ω′ → Rr deuxapplications et soit a ∈ Ω.

(i) Si f est differentiable en a et si g est differentiable en f(a), alors g f est differentiableen f(a) et l’on a d(g f)a = dgf(a) dfa. Par consequent,

Mgf (a) = Mg(f(a))Mf (a).

(ii) Si f et de classe C(1) sur Ω et si g est de classe C(1) sur Ω′, alors g f est de classe C(1)

sur Ω.

(3.8) Nous allons conclure ce theme en enoncant sans demonstration deux resultats impor-tants, dont des cas particuliers ont deja ete evoques.

(3.8.1) Theoreme (de la fonction reciproque). Soit Ω ⊆ Rp un domaine et soit f : Ω → Rp estune fonction de classe C(1). Soit a ∈ Ω tel que Jf (a) 6= 0. Alors il existe un ouvert U ⊆ Ω contenanta tel que f restreinte a U est une bijection de U sur son image f(U). En outre l’applicationreciproque f−1 : f(U) → U est de classe C(1) et l’on a df−1

f(a) = (dfa)−1.

On remarque que la differentielle de l’application identique est l’application identique, dont lamatrice jacobienne est la matrice identite. En appliquant (3.7.3), on constate ainsi que

Mf−1(f(a)) = Mf (a)−1.

Exemple. Dans l’exemple de (3.7.2), on a Jf (a1, a2) 6= 0 si et seulement si soit a1 6= 0 soita2 6= 0. Ainsi, le theoreme s’applique au voisinage de tout point de R2 qui n’est pas situe sur l’undes axes.

(3.9) Soient p ≥ 1, q ≥ 1 deux entiers, soit Ω1 un domaine de Rp et soit Ω2 un domaine deRq. On identifie Rp+q avec Rp × Rq, de sorte qu’un point de Rp+q s’ecrit (x, y) avec x ∈ Rp ety ∈ Rq. On pose Ω = (x, y) | x ∈ Ω1, y ∈ Ω2, de sorte que Ω est un domaine de Rp+q. Soitf : Ω → Rq une fonction de classe C(1). Si (a, b) ∈ Ω, on note D1f(a,b) la differentielle en a dela fonction x 7→ f(x, b) et D2f(a,b) la differentielle en b de la fonction y 7→ f(a, y). Les matricesjacobiennes de D1f(a,b) et de D1f(a,b) sont alors respectivement

Mf,1(a, b) =

∂f1

∂x1(a, b) ∂f1

∂x2(a, b) · · · ∂f1

∂xp(a, b)

∂f2

∂x1(a, b) ∂f2

∂x2(a, b) · · · ∂f2

∂xp(a, b)

......

. . ....

∂fq

∂x1(a, b) ∂fq

∂x2(a, b) · · · ∂fq

∂xp(a, b)

.

et

Mf,2(a, b) =

∂f1

∂y1(a, b) ∂f1

∂y2(a, b) · · · ∂f1

∂yq(a, b)

∂f2

∂y1(a, b) ∂f2

∂y2(a, b) · · · ∂f2

∂yq(a, b)

......

. . ....

∂fq

∂y1(a, b) ∂fq

∂y2(a, b) · · · ∂fq

∂yq(a, b)

.

Le resultat suivant se reduit a (3.6) lorsque p = q = 1.

18

Page 19: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

(3.9.1) Theoreme (des fonctions implicites). Soient p ≥ 1, q ≥ 1 deux entiers. On identifieRp+q avec Rp×Rq. Soit Ω1 un domaine de Rp et soit Ω2 un domaine de Rq. On pose Ω = Ω1×Ω2 :c’est un domaine de Rp+q. Soit f : Ω → Rq une fonction de classe C(1). Soit alors (a, b) ∈ Ω telque f(a, b) = 0. On suppose que D2f(a,b) soit inversible. Alors il existe un voisinage U ⊆ Ω1 de aet une unique fonction φ : U → Ω2 de classe C(1) tels que b = φ(a) et f(u, φ(u)) = 0 quelque soitu ∈ U . En outre, on a dφu = −(D2f(u,φ(u)))

−1 D1f(u,φ(u)).Le lecteur reformulera la derniere alinea de l’enonce en termes des matricesMf,1 etMf,2. Elle se

demontre en remarquant que, puisque u 7→ f(u, φ(u)) est la fonction nulle, sa differentielle encoreest la fonction nulle. Mais la differentielle se calcule a l’aide de la formule pour la differentielled’une fonction composee (3.7.3). On trouve alors que 0 = D1f(u,φ(u)) +D2f(u,φ(u))dφu.

EXERCICES

(e3.1) Soit f : Rp → R la fonction definie par f(x) = 〈x, a〉, ou a ∈ Rp est une constante. Calculerf ′. Meme chose lorsque f est la fonction x 7→ ||x||22, la fonction x 7→ ||x||42, de la fonction x 7→ 〈x, a〉2, dela fonction x 7→ e〈x,a〉 et de la fonction x 7→ log(1 + ||x||22).

(e3.2) Calculer les derivees partielles de la fonction x 7→ ||x||∞, en precisant les points x ∈ Rp ouelles existent.

(e3.3) Soit f : (R∗+)3 → R la fonction (x, y, z) 7→ xyz

. Calculer ∂f∂x , ∂f

∂y et ∂f∂z .

(e3.4) (i) Determiner toutes les fonctions f : R2 → R de classe C(1) qui verifient f ′1(x, y) = xet f ′2(x, y) = y pour tout (x, y) ∈ R2. En deduire toutes les fonctions f de classe C(1) qui verifientdf = xdx + ydy.

(ii) Determiner toutes les fonctions g : R2 → R de classe C(1) qui verifient g′1(x, y) = 3y2− y3 + x2 etg′2(x, y) = 3xy(2− y). En deduire toutes les fonctions g de classe C(1) verifiant dg = (3y2 − y3 + x2)dx +3xy(2− y)dy.

(iii) Determiner toutes les fonctions f : R3 → R de classe C(1) verifiant f ′1(x, y, z) = y, f ′2(x, y, z) = zet f ′3(x, y, z) = y.

(e3.5) Soient p ≥ 1, r deux entiers. La fonction f : Rp − 0 → R est dite homogene de degre rlorsque f(λx) = λrf(x) quelque soit λ ∈ R∗ et quelque soit x ∈ Rp−0. Montrer que si f est homogenede degre r, alors 〈f ′(x), x〉 = rf(x) quelque soit x ∈ Rp − 0.

(e3.6) Soit f : R2 → R la fonction definie par f(x, y) = (x− 1)(x + 2)(x2 + 1) + y2. On considere lelieu X = (x, y) ∈ R2 | f(x, y) = 0.

(i) Montrer que X est compact. (Pour montrer que E est borne, montrer d’abord que si (a, b) ∈ X,alors a ∈ [−2, 1].)

(ii) Calculer f ′. Montrer que si (a, b) ∈ X, alors f ′(a, b) 6= 0.(iii) Soit (a, b) ∈ X avec f ′2(a, b) 6= 0. Quel resultat du cours vous permet d’affirmer qu’il existe un

intervalle ouvert I contenant a et une fonction γ : I → R verifiant γ(a) = b et f(t, γ(t)) = 0 pour toutt ∈ I ? On precisera γ. Calculer γ′(a).

(iv) Soit (a, b) ∈ X avec f ′1(a, b) 6= 0. Expliquer pourquoi il existe un intervalle ouvert J contenant bet une fonction γ : J → R verifiant δ(b) = a et f(δ(u), u) = 0 pour tout u ∈ I ? Existe-t-il une formuleexplicite pour δ analogue a celle de γ dans la question (iii) ? Calculer δ′(b).

(e3.7) Soit α ∈ R, α 6= 0, et soit f : R2 → R la fonction definie par f(x, y) = x3 + y3 − 3αxy, ou(x, y) ∈ R2. On note X le lieu (a, b) ∈ R2 | f(a, b) = 0.

(i) Calculer f ′. Montrer que le seul point (a, b) de X ou f ′(a, b) = (0, 0) est l’origine.(ii) Trouver les points (a, b) ∈ X tels que f ′(a, b) 6= 0 mais soit f ′1(a, b) = 0 soit f ′2(a, b) = 0 (tangente

verticale ou horizontale).(iii) Soit (a, b) ∈ X tel que f ′2(a, b) 6= 0. Quel resultat du cours vous permet d’affirmer qu’il existe

un intervalle ouvert I contenant a et une fonction γ : I → R verifiant γ(a) = b et f(u, γ(u)) = 0 pour

19

Page 20: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

tout u ∈ I ? Calculer γ′(a).

(e3.8) (i) Soient a, b, c trois reels. Montrer que si le polynome x3 +ax2 + bx+ c a trois racines reellesdeux-a-deux distinctes distinctes, alors il existe des intervalles ouverts Ia contenant a, Ib contenant b etIc contenant c tels que si a′ ∈ Ia, b′ ∈ Ib et c′ ∈ Ic, alors le polynome x3 + a′x2 + b′x + c′ a encore troisracines reelles.

(ii) Montrer que si α < β sont deux reels et si ε est suffisament petit, le polynome (x−α)(x−β)+εx3

a trois racines reelles.

(e3.9) Soit f : R2 → R2 l’application definie par f(u, v) = (eu cos v, eu sin v). Montrer que Jf (u, v) 6=0 quelque soit (u, v) ∈ R2 mais que f n’est pas une bijection de R2 sur lui-meme.

Theme 4. Formes quadratiques, matrices symetriques, derivees d’ordre 2,extremums locaux

(4.1) Notons encore Ω un domaine de Rp. Soit f : Ω → R une fonction et soient k, ` ∈1, . . . , , p. Supposons que f ′k existe. Si, a son tour f ′k possede une derivee partielle (f ′k)

′`, on la

note f ′′`,k (ou ∂2f∂x`∂xk

). Il s’agit alors de la derivee partielle seconde par rapport a xk, x`. Fortheureusement, il n’est pas en pratique necessaire de se souvenir de l’ordre des indices k et `, enraison du resultat suivant qui sera admis :

(4.1.1) Theoreme. Soit f : Ω → R une application et soient k, ` ∈ 1, 2, . . . , p. On supposeque f ′′`,k existe et est continue sur Ω. Alors f ′` et f ′′k,` existent et on a f ′′`,k = f ′′k,`.

(4.1.2) On dit que f est de classe C(2) si toutes les derivees partielles secondes f ′′k,` existent

et sont continues. Soit f = Ω → R de classe C(2) et soit a ∈ Ω. On appelle matrice hessiennede f en a la matrice carree d’ordre p definie par

Hf,a =

f ′′1,1(a) f ′′1,2(a) · · · f ′′1,p(a)f ′′2,1(a) f ′′2,2(a) · · · f ′′2,p(a)

......

. . ....

f ′′p,1(a) f ′′p,2(a) · · · f ′′p,p(a)

.

D’apres (4.1.1), il s’agit d’une matrice symetrique.Soit H = (Hi,j) une matrice carree symetrique d’ordre p. On note alors q(H, ·) sa forme

quadratique associee : celle-ci est definie par la formule q(H, x) =∑

i,j xixjHi,j quelque soitx = (x1, x2, . . . , xp) ∈ Rp. (Bien que la formula definissant q(H, x) ait un sens quelque soit lamatrice carree H d’ordre p, nous ne parlerons d’une forme quadratique associee que lorsque H estsymetrique.)

(4.2) Theoreme. Soit f : Ω → R une application de classe C(2) et soient a, b ∈ Ω tels que[a, b] ⊆ Ω. Alors il existe c ∈]a, b[ tel que

f(b)− f(a) = 〈b− a, f ′(a)〉+1

2q(Hf,c, b− a

).

Ce resultat se deduit de la formule de Taylor en une variable par un argument semblable acelui utilise dans la demonstration du theoreme (3.5).

20

Page 21: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

(4.3) Notons p ≥ 1 un entier. Une forme quadratique en p variables est une fonctionq : Rp → R de la forme x 7→

∑pi,j=1Aijxixj, ou Aij, 1 ≤ i, j ≤ p sont des reels et x =

(x1, x2, . . . , xp). Notons que si l’on pose A′ij =

Aij+Aji

2pour tout i, j, alors A′

ij = A′ji pour tout i,

j et∑p

i,j=1Aijxixj =∑p

i,j=1A′ijxixj quelque soit x ∈ Rp. On peut donc supposer que Aij = Aji

pour tout i, j, ce que nous allons faire par la suite.La matrice A = (Aij) est alors symetrique : on l’appelle la matrice associee a q. Si

reciproquement A = (Aij) est une matrice carree symetrique d’ordre p, alors la forme quadra-tique q(A, ·) definie par x 7→

∑pi,j=1Aijxixj s’appelle la forme quadratique associee a A.

(4.3.1) La forme quadratique q (ou la matrice symetrique associee) est dite definie positive(respectivement definie negative) si q(x) > 0 (resp. si q(x) < 0) quelque soit x ∈ Rp − 0. Elleest dite positive (respectivement negative) si q(x) ≥ 0 (resp. si q(x) ≤ 0) quelque soit x ∈ Rp.

(4.3.2) S’agissant d’une fonction polynome, une forme quadratique q : Rp → R est continue.Si x ∈ Rp et si λ ∈ R, alors q(λx) = λ2q(x). Choisissons une norme sur Rp et rappelons alors queS(0; 1) designe la sphere de centre 0 = (0, 0, . . . , 0) et de rayon 1 dans Rp.

(4.3.3) Exemple. Prenons p = 3 et q(x1, x2, x3) = x21 + x2

2 − 2x2x3. La matrice associee est1 0 00 1 −10 −1 0

. On a q(1, 0, 0) > 0 et q(0, 1, 1) < 0. Par consequent, q n’est ni positive ni negative.

(4.4) Proposition. Soit q une forme quadratique. Alors(i) q possede un minimum m(q) et un maximum M(q) sur S(0; 1).(ii) Pour que q soit definie positive (respectivement definie negative), il faut et il suffit que

m(q) > 0 (resp. M(q) < 0).(iii) Pour que q soit positive (respectivement negative), il faut et il suffit que m(q) ≥ 0 (resp.

M(q) ≤ 0).Demonstration. (i) Puisque q est continue et S(0; 1) compacte, c’est une consequence de (2.6.1).(ii) Supposons q definie positive. Alors q(x) > 0 quelque soit x ∈ S(0; 1). En particulier

m(q) > 0 d’apres (i). Si reciproquement m(q) > 0 et si x ∈ Rp − 0, alors x||x|| ∈ S(0; 1) et

q(

x||x||

)≥ m(q) > 0 d’ou q(x) ≥ ||x||2m(q) > 0 et donc q est definie positive. Le cas ou q est definie

negative ainsi que le (iii) se demontrent d’une facon analogue.

(4.5) Soit Ω un domaine de Rp, soit a ∈ Ω et soit f : Ω → R une fonction. On dit que fadmet un maximum relatif strict (respectivement un minimum relatif strict) en a s’il existeun voisinage U de a tel que pour tout x ∈ U − a on ait f(x) < f(a) (resp. f(x) > f(a)). Ondit que f admet un maximum relatif (respectivement un minimum relatif) en a s’il existe unvoisinage U de a tel que pour tout x ∈ U on ait f(x) ≤ f(a) (resp. f(x) ≥ f(a)).

Si f : Ω → R est de classe C(1), on appelle point critique tout a ∈ Ω tel que f ′(a) = 0. Unevaleur critique de f est une valeur f(a), a etant un point critique.

(4.5.1) Proposition. Soit f : Ω → R de classe C(1) et soit a ∈ Ω. Si f a un maximum relatifou un minimum relatif en a, alors a est un point critique.

Demonstration. Considerons le cas d’un maximum relatif, le cas d’un minimum relatif etantsemblable. Supposons pour une contradiction que f ′(a) 6= 0. Alors il existe un indice k tel quef ′k(a) 6= 0. Supposons par exemple que f ′k(a) > 0. Puisque f ′k est continue, il existe une bouleouverte B(a; r), ou r > 0, telle que f ′k(u) > 0 quelque soit u ∈ B(a; r). Soit alors t ∈ R tel quef(a + tek) ∈ B(a; r). D’apres le theoreme des accroissements finis (3.5), il existe c ∈ [a, a + tek]tel que f(a+ tek) = f(a) + 〈tek, f

′(c)〉. Or, 〈tek, f′(c)〉 = tf ′k(c), d’ou, en prenant t > 0, on trouve

21

Page 22: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

〈tek, f′(c)〉 > 0 puis f(a+ tek) > f(a), ce qui est le contradiction desiree.

Rappelons que la reciproque de cette proposition n’est pas vraie, meme si p = 1. Par exemple,la fonction f : t 7→ t3 sur R verifie f ′(0) = 0 mais f n’a ni maximum ni minimum relatif en 0.

(4.6) Soit Ω un domaine de Rp, soit a ∈ Ω et soit f : Ω → R de classe C(2). Rappelons queHf,a designe alors la matrice hessienne de f en a (4.1.2)

(4.6.1) Theoreme. Soit f : Ω → R de classe C(2) et soit a ∈ Ω un point critique.(i) Si q(Hf,a, ·) est definie positive, alors f a un minumum relatif strict en a.(ii) Si q(Hf,a, ·) est definie negative, alors f a un maximum relatif strict en a.A nouveau, il n’y a pas de resultat analague lorsque q(Hh,a, ·) est seulement suppose negative

ou positive, comme le montre encore l’exemple de la fonction f(t) = t3 en 0. Ici, on a f ′(0) = 0 etHf,0 = 0, mais f n’a ni maximum ni minimum relatif en 0.

En ce qui concerne la demonstration, on choisit a nouveau une boule ouverte B(a; r), r > 0,contenue dans Ω. La formule de Taylor (4.2) montre que si x ∈ B(a; r)−a, alors il existe c ∈]a, x[tel que

f(x) = f(a) +1

2q(Hf,c, x− a).

Placons-nous dans le cadre du cas (i). Si l’on peut etablir que Hf,c est definie positive sur unvoisinage U de a, on aura gagne car alors q(Hf,c, x − a) < 0 et donc f(x) < f(a) pour toutx ∈ U ∩ B(a; r) avec x 6= a. Avant de justifier l’existence de U , une courte digression sur latopologie des ensembles de matrices sera utile.

(4.7) Si m, n dont deux entiers positifs, on note Mm,n le R-espace vectoriel des matrices acoefficients dans R et a m lignes et a n colonnes. On pose Mn = Mn,n.

L’espace Mm,n est de dimension mn. En effet, les matrices Eij, 1 ≤ i ≤ m, 1 ≤ j ≤ n, dontle coefficient a l’intersection de la i-ieme ligne et la j-ieme colonne vaut 1 et les autres coefficientsforment une base. Par consequent, Mm,n est isomorphe a Rmn : pour donner un isomorphismeexplicite, il suffit d’envoyer la matrice A = (Aij) sur l’element

(A11, A12, . . . , A1n, A21, . . . , A2n, . . . , Am1, . . . , Amn)

de Rmn. Ainsi, Mm,n devient un espace vectoriel norme (en choisissant par exemple l’une desnormes ||.||1, ||.||2 et ||.||∞ de (1.2)). De toute facon, Mm,n etant de dimension finie, toutes lesnormes sont equivalentes et les considerations qui suivent ne dependeront pas de la norme choisie.

(4.8) Limitons-nous a present au cas des matrices carrees Mn. Etudions les proprietes topo-logiques de quelques ensembles remarquables de matrices.

(4.8.1) L’ensemble Sn des matrices symetriques est un ferme de Mn.Demonstration. En effet, il est defini comme A ∈Mn | Aij − Aji = 0 pour tout i, j.

(4.8.2) L’ensemble GLn des matrices inversibles de Mn est un ouvert.Demonstration. Le determinant d’une matrice etant un polynomes en ces coefficients, la fonc-

tion det : Mn → R qui associe a toute matrice son determinant est continue. Donc GLn = A ∈Mn | det(A) 6= 0 est ouvert.

(4.9) Revenons a la demonstration du theoreme (4.6.1) et notamment a l’existence d’un voi-sinage U de a tel que Hf,c soit definie positive pour tout c ∈ U . Puisque f est de classe C(2),l’application c 7→ Hf,c est continue. Il suffit donc de voir que l’ensemble des matrices symetriquesdefinies positives est un ouvert relatif de Sn. Soit donc A ∈ Sn definie positive et soit T ∈ Sn. Il

22

Page 23: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

s’agit de verifier que si tous les coefficients Tij de T sont suffisament petits, alors A+T est definiepositive. Utilisons pour cela la proposition (4.4) (i). Utilisons la norme ||.||1. Soit m le minimumde q(A, ·) sur S1(0; 1), soit x ∈ S1(0; 1) et soit ε = maxi,j |Tij|. Alors

q(A+ T, x) = q(A, x) + q(T, x) ≥ m−∑i,j

|Tij| |xi| |xj| ≥ m− ε||x||21 = m− ε.

Il s’ensuit que q(A + T, x) ≥ m − ε pour tout x ∈ S1(0; 1) et par consequent A + T est definiepositive des que ε < m.

(4.10) Pour clore ce theme, nous allons passer en revue quelques proprietes generales desformes quadratiques et notamment ces criteres pour qu’une forme soit definie positive, positive,definie negative, ou negative. On note Mm,n(C) l’ensemble des matrices complexes a m lignes etn colonnes et l’on pose Mn(C) = Mn,n(C). Si A ∈ Mm,n(C), on note tA ∈ Mn,m(C) la matricetranposee : (tA)i,j = Aj,i pour tout i, j.

Il convient d’identifier Rn avec Mn,1 et Cn avec Mn,1(C) (matrices a une colonne).

(4.10.1) Soit A ∈Mn(C) et soit λ ∈ C. On appelle espace propre associe a λ le sous-espaceEλ(C) = x ∈ Cn | Ax = λx de Cn. On dit que λ est une valeur propre de A si Eλ(C) 6= 0.Les elements non-nuls de Eλ(C) sont alors appeles les vecteurs propres associes a λ. On poseEλ = Eλ(C) ∩ Rn.

Le polynome caracteristique de A est, par definition, le polynome χA(t) = det(tIn − A),In designant la matrice identite d’ordre n. Alors χA est unitaire et de degre n. (Certains auteursdefinissent le polynome caracteristique comme etant det(A− tIn) = (−1)nχA(t).) Si A est reelle,alors χA(t) ∈ R[t]. Si λ ∈ C, alors λ est valeur propre de A si et seulement si λIn − A n’est pasinversible, ou encore si et seulement si χA(λ) = 0.

(4.10.2) Proposition. Toutes les valeurs propres d’une matrice symetrique reelle sont reelles.Demonstration. Soit donc A une matrice symetrique reelle et soit λ une valeur propre de A.

On note x ∈ Cn un vecteur propre associe. Alors Ax = λx et donc Ax = λx, ou x est obtenude x en remplacant chaque coefficient de x par son conjugue complexe. En prenant la transposee,on trouve txtA = txA = λx car A est symetrique. Calculons donc txAx de deux manieres. D’unepart, txAx = tx(Ax) = txλx = λtxx ; de l’autre part, txAx = (txA)x = λtxx. Or, un vecteurpropre etant non-nul par definition, on a txx =

∑nk=1 |xk|2 6= 0. Par consequent, λ = λ et λ est

donc reel.

(4.10.3) La matrice U ∈ Mn est dite orthogonale si tUU = In. En particulier, une matriceorthogonale U est inversible, et alors U−1 = tU et U tU = In. La matrice A ∈Mn est orthogonalesi et seulement si ||Ax||2 = ||x||2 quelque soit x ∈Mn,1.

Exemples. (i) Toute matrice orthogonale d’ordre 2 est de l’une des formes(cos θ − sin θsin θ cos θ

),

(− cos θ sin θsin θ cos θ

), θ ∈ R.

(ii) Toute matrice de permuation est orthogonale. (Une matrice de permutation est unematrice dont chaque ligne et chaque colonne un et un seul coefficient egal a un, tous les autres

coefficients etant nuls. Exemple :(

0 1 00 0 11 0 0

).

On trouvera la demonstration du resultat suivant dans l’appendice (A.7.5).

(4.10.4) Theoreme. Soit A ∈ Mn symetrique. Soit Λ ∈ Mn une matrice diagonale dontles coefficients diagonaux sont les valeurs propres de A, comptees avec multiplicites en tant queracines de χA(t).

23

Page 24: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

Alors il existe une matrice orthogonale U ∈Mn telle que A = tUΛU .Notons que Λ depend de l’ordre dans lequel on choisit les racines λi. Or, permuter les λi revient

a multiplier U par une matrice de permutation.

(4.10.5) Corollaire. Soit A ∈ Mn symetrique. Pour que A soit definie positive (respective-ment definie negative, positive, negative), il faut et il suffit que toutes les valeurs propres de Asoient strictement positives (respectivement strictement negatives, positives, negatives).

Demonstration. Rappelons que Rn est identifie avec M1,n. On a donc q(A, x) = txAx pourtout x ∈ Rn. Soit Λ, U comme dans le theoreme (4.10.4). Alors A = tUΛU . Soit x ∈ Rn et soity = Ux. Alors

q(A, x) = txAx = txtUΛUx = tyΛy =n∑

k=1

λky2k,

ou les λk sont coefficients diagonaux de Λ et y = (y1, y2, . . . , yn). On sait alors que les λk sont lesvaleurs propres de A, comptees avec multiplicites. Il est alors clair que si λk > 0 quelque soit k,alors q(A, x) > 0 pour tout x ∈ Rn − 0. Si reciproquement q(A, x) > 0 pour tout x ∈ Rn − 0,on voit, en prenant x de telle maniere que y = ek, que q(A, x) = λk > 0. Pareil dans les autrescas.

(4.10.6) Corollaire. Pour que A soit definie positive (respectivement definie negative, posi-tive, negative), il faut et il suffit que toutes les racines du polynome caracteristique soient stricte-ment positives (respectivement strictement negatives, positives, negatives).

(4.10.7) Corollaire. Si detA = 0, alors A n’est ni definie positive ni definie negative.

(4.11) Ainsi, pour determiner la nature de la forme quadratique q, il suffit de connaıtre lesigne des racines du polynome caracteristique de la matrice symetrique associee. Notons A ∈Mn

une matrice symetrique et

χA(t) = tn + an−1tn−1 + an−2t

n−2 + · · ·+ a0 =n∏

k=1

(t− λk)

le polynome caracteristique de A, le coefficient de tk etant alors note ak et les racines λk etantreelles. La proposition suivante, appliquee avec p(t) = χA(t), permet de tester si A est definiepositive, definie negative, positive ou negative ou si encore A ne possede aucune de ses proprietes.

(4.11.1) Proposition. Soit p(t) = tn + an−1tn−1 + an−2t

n−2 + · · · + a0 un polynome unitairede degre n. On suppose que toutes les racines de p(t) sont reelles.

(i) Une condition necessaire et suffisante pour que toutes les racines de p(t) soit strictementpositives est que (−1)n−kak > 0 pour tout k.

(ii) Une condition necessaire et suffisante pour que toutes les racines de p(t) soit strictementnegatives est que ak > 0 pour tout k.

(iii) Une condition necessaire et suffisante pour que toutes les racines de p(t) soit positives ounulles est que (−1)n−kak ≥ 0 pour tout k.

(iv) Une condition necessaire et suffisante pour que toutes les racines de p(t) soit negativesou nulles est que ak ≥ 0 pour tout k.

Demonstration. (i) Notons λk, (1 ≤ k ≤ n) les racines de p(t). Supposons d’abord que λk > 0pour tout k. Alors −an−1 = λ1 + λ2 + · · · + λn > 0, an−2 =

∑i<j λiλj > 0 et, en general, si

k ∈ 0, 1, . . . , n, alors (−1)n−kak =∑

1≤i1<i2<···<ik≤n λi1λi2 · · ·λik > 0.Supposons reciproquement que (−1)n−kak > 0 quelque soit k. Il suffit de montrer que si t ≤ 0,

alors p(t) 6= 0. En effet, puisque les racines de p(t) sont toutes reelles, on en tirera qu’elles sonttoutes strictement positives.

24

Page 25: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

Soit donc t ≤ 0 et soit k ∈ 0, 1, . . . , n. Si n est pair, alors le signe de tk est (−1)k = (−1)n−k

et donc tk a le meme signe que ak et aktk ≥ 0. En prenant la somme sur tout k ∈ 0, 1, . . . , n

et en notant que a0 > 0, on en tire que p(t) > 0. Si n est impair, un argument semblable montreque akt

k ≤ 0 pour tout k et, en prenant la somme sur k et en notant que a0 < 0, on conclut quep(t) < 0.

Les enonces (ii), (iii), (iv) se demontrent de la meme maniere.

(4.12) En pratique, le calcul du polynome caracteristique d’une matrice carree d’ordre ndevient lourde si n est grand, sauf dans les cas particuliers. La proposition suivante remplace cecalcul par celui des determinants de certaines sous-matrices de A.

(4.12.1) Proposition. Soit A ∈ Mn, A = (Aij) une matrice symetrique. Pour tout r ∈1, 2, . . . , n, on note A(r) la matrice symetrique (Aij), 1 ≤ i, j ≤ r, de Mr.

(i) Pour que A soit definie positive, il faut et il suffit que det(A(r)) > 0 pour tout r ∈1, 2, . . . , n.

(ii) Pour que A soit definie negative, il faut et il suffit que (−1)r det(A(r)) > 0 pour toutr ∈ 1, 2, . . . , n.

La demonstration se fait par recurrence sur n ; les details sont omis. Remarquons qu’il n’y a

pas de critere analogue pour que A soit positive ou negative. Par exemple, la matrice A =

(0 00 1

)est positive, mais det(A(1)) = det(A) = 0. De meme, la matrice −A est negative, mais on a encoredet(−A(1)) = det(−A) = 0.

(4.13) Voici une seconde methode pour tester si une forme quadratique est definie positiveou negative, qui est en general moins lourde lorsque n est grand (au moins pour un ordinateur).L’idee de cette methode, dite la methode de Gauss, est d’ecrire la forme comme somme decarres de formes lineaires muliplies par des coefficients reels.

(4.13.1) Rappelons que toute forme lineaire Rn → R s’ecrit x 7→∑n

k=1 akxk = 〈a, x〉, oua = (a1, a2, . . . , an) ∈ Rn et x = (x1, x2, . . . , xn) ∈ Rn. Si E est un R-espace vectoriel, les formeslineaires sur E constituent egalement un R-espace vectoriel que l’on note L(E,R) (voir (A.3)).On peut ainsi parler de formes lineaires lineairement independantes. La famille (`1, `2, . . . , `n) deformes lineaires est lineairement independante (ou libre) si et seulement si la relation

n∑i=1

λi`i(x) = 0, (λ1, λ2, . . . , λn) ∈ Rn,

pour tout x ∈ E entraıne λ1 = λ2 = · · · = λn = 0.

(4.13.2) Notons donc q : Rn → R une forme quadratique. Si n = 1, alors il existe λ ∈ R telque q(x) = λx2 = λ`(x)2 quelque soit x ∈ R, ou ` est la forme lineaire `(x) = x.

Supposons donc n ≥ 2. Degageons les termes de q qui font intervenir xn, en ecrivant q(x) =q0(x) + (2A1nx1xn + 2A2nx2xn + · · · + 2An−1,nxn−1xn + Annx

2n), ou q0 ne fait intervenir que x1,

x2, . . ., xn−1. On veut proceder par recurrence sur n : sachant deja ecrire une forme quadratiqueen au plus n − 1 variables sous la forme

∑mi=1 λi`i(x)

2 avec λi ∈ R pour tout i et (`1, `2, . . . , `m)une famille libre de formes lineaires on souhaite le faire pour q. Si q = q0 (c’est-a-dire Akn = 0pour tout k ∈ 1, 2, . . . , n), il n’y a rien a faire. Dans le cas contraire, il y a deux possibilites aconsiderer selon que Ann 6= 0 ou Ann = 0.

Supposons d’abord que Ann 6= 0. Alors on peut completer le carre :

2A1nx1xn + · · ·+ 2An−1,nxn−1xn + Annx2n = Ann

(A1n

Ann

x1 + · · ·+ An−1,n

Ann

xn−1 + xn

)2+ q1(x),

25

Page 26: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

ou q1(x) ne depend que de xk, avec 1 ≤ k ≤ n− 1. Donc q(x) = q0(x) + q1(x) +Ann

(A1n

Annx1 + · · ·+

An−1,n

Annxn−1 + xn

)2, ou q0 + q1 ne depend que de xk avec 1 ≤ k ≤ n− 1.

Supposons ensuite que Ann = 0. On se ramene au cas precedent a l’aide de l’astuce suivante.Par hypothese, il existe un indice k < n tel que Akn 6= 0. Effectuons alors le changement devariable xk = x′k + xn. Avec les variables (x1, . . . , xk−1, x

′k, xk+1, . . . , xn), le coefficient de x2

n dansq devient Akn, et on peut donc proceder comme auparavant.

Cette procedure exprime q(x) sous la forme q′(x) + λn`n(x)2, ou la forme quadratique q′ nedepend que de x1, x2, . . ., xn−1, λn ∈ R et `n ∈ L(Rn,R) depend effectivement de xn. (Si q nedepend pas de xn, on pose λn = 0 et `n(x) = xn.) Par recurrence, on trouve une expression pourq(x) sous la forme

∑mk=1 λk`k(x)

2, ou λk ∈ R et `k ∈ L(Rn,R) est de la forme `k(x) = 〈a, x〉 aveca de la forme (a1, . . . , ak, 0, . . . , 0) et ak 6= 0. Par consequent, les formes (`k)1≤k≤n forment unefamille libre dans L(Rn,R). Cela implique que m ≤ n, car L(Rn,R) est de dimension n.

En pratique, on ne prend pas forcement les variables xk dans l’ordre : si par exemple Ann = 0mais il existe un indice m tel que Amm 6= 0, il y a clairement avantage de remplacer xn par xm

dans le raisonnement ci-dessus.

(4.13.3) Proposition. Soit q : Rn → R une forme quadratique.(i) Si q s’ecrit comme somme de n carres de formes lineaires lineairement independantes,

alors q est definie positive.(ii) Si q s’ecrit comme moins la somme de n carres de formes lineaires lineairement indepen-

dantes, alors q est definie negative.(iii) Si q s’ecrit comme somme de carres de formes lineaires, alors q est positive.(iv) Si q s’ecrit comme moins la somme de carres de formes lineaires, alors q est negative.Demonstration. (i) Supposons que q(x) =

∑nk=1 `k(x)

2, avec les formes lineaires `k, 1 ≤ k ≤ nlineairement independantes. Il est clair que q(x) ≥ 0 pour tout x ∈ Rn. Si q(x) = 0, alors `k(x) = 0pour tout k et, les formes lineaires `k etant lineairement independantes et en nombre n, on en tireque x = 0. Les parties (ii), (iii) et (iv) se traitent de la meme maniere.

Traitons quelques exemples.

(4.14) (i) q(x1, x2, x3) = x21 + 2x1x2 + 2x2x3. Ici, la forme contient le terme x2

1. Completonsdonc le carre en utilisant x1 a la place de xn :

q(x1, x2, x3) = (x1 + x2)2 − x2

2 + 2x2x3 = (x1 + x2)2 = q0(x2, x3),

ou q0(x2, x3) = −x22 + 2x2x3. Ensuite, q0(x2, x3) = −(x2 − x3)

2 + x23, et donc

q(x1, x2, x3) = (x1 − x2)2 − (x2 − x3)

2 + x23.

Ici, le forme prend a la fois des valeurs positives et des valeurs negatives.(ii) q(x1, x2, x3) = x1x3 +x2x3. Il n’y a pas de terme Akkx

2k. Ecrivons donc x1 = x′1 +x3. Alors

q(x1, x2, x3) = x′1x3 + x2x3 + x23. Ensuite,

q(x1, x2, x3) = (1

2x′1 +

1

2x2 + x3)

2 − 1

4x′1

2 − 1

4x2

2 −1

2x′1x2

= (1

2x′1 +

1

2x2 + x3)

2 −(12(x′1 + x2)

)2.

A nouveau, q prend a la fois des valeurs positives et des valeurs negatives.(iii) On suppose q : Rn → R definie positive. Si A = (Aij) est la matrice symetrique associee

a q, alors Aii > 0 pour tout i ∈ 1, 2, . . . , n. En effet, on a q(ek) = ekAek = Akk quelque soit

k ∈ 1, 2, . . . , n : si donc il existe un indice k tel que Akk ≤ 0, alors q(ek) ≤ 0.

26

Page 27: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

(iv) Soit q(x1, x2, x3) = (x1 − x2)2 + (x2 − x3)

2 + (x3 − x1)2. Alors q est positive mais pas

definie positive. En effet, q(x1, x2, x3) ≥ 0 pour tout (x1, x2, x3) ∈ R3 mais q(x, x, x) = 0 pourtout x ∈ R. Bien entendu, les formes lineaires `1(x1, x2, x3) = x1 − x2, `2(x1, x2, x3) = x2 − x3

et `3(x1, x2, x3) = x3 − x1 ne sont pas lineairement independantes ; elles sont liees par la relation`1 + `2 + `3 = 0.

EXERCICES

(e4.1) (i) Soit Ω un domaine dans Rp et soient g1, g2, . . ., gp, p fonctions de classe C(1) de Ω dans R.Montrer que s’il existe f : Ω → R de classe C(2) telle que df =

∑pk=1 gkdxk, alors (gk)′` = (g`)′k

quelque soit les entiers k, ` ∈ 1, 2, . . . , p.(ii) Existe-t-il une fonction f : R2 → R de classe C(2) verifiant df = ydx + dy ?

(e4.2) Soit Ω un domaine de Rp et soit f : Ω → R de classe C(2). Montrer que si q(Ha, ·) = 0 quelquesoit a ∈ Ω, alors il existe b ∈ Rp et α ∈ R tels que f(x) = α + 〈b, x〉 quelque soit x ∈ Ω. (Appliquer laformule de Taylor (4.2). On pourra se limiter au cas ou Ω est etoile.)

(e4.3) Soit f : R2 → R la fonction f(x, y) = x4 − 2xy + y2 − 2x.(i) Calculer f ′ puis montrer que f a un unique point critique que l’on precisera.(ii) Calculer la matrice hessienne Hf,(x,y) et verifier que le point critique est un minimum relatif

strict.(iii) En remarquant que f(x, y) = (y − x)2 + (x − 1)2(x2 + 2x + 2) − 2, montrer que ce minimum

relatif est, en fait, le minimum absolu strict de f sur R2.

(e4.4) Soit la fonction f : (R∗+)2 → R definie par f(x, y) = xy +

1x

+8y.

(i) Calculer f ′. Verifier que (1/2, 4) est l’unique point critique de f .(ii) Verifier que (1/2, 4) est un minimum local strict de f .(iii) Montrer que (1/2, 4) est, en fait, le minimum absolu strict de f sur (R∗

+)2. (C’est plus difficile. Onpourra chercher a montrer directement que f(x, y)− f(1/2, 4) ≥ 0 en s’inspirant de l’exercice precedent.Sinon, on pourra montrer d’abord que pour tout (x, y) ∈ (R∗

+)2, on a f(x, y) ≥ f(x, 1/x2) puis que, siφ(x) = f(x, 1/x2), alors φ atteint son minimum en x = 1/2.)

(e4.5) On note a, b et c trois nombre reels verifiant abc 6= 0 et f : R3 → R la fonction definie parf(x, y, z) = x4 + y4 + z4 − 4(a3x + b3y + c3z).

(i) Determiner les points critiques de f .(ii) Montrer que f possede un minimum local en (a, b, c).(iii) Verifier que si u, v ∈ R2, alors 2u2v2 ≤ u4 + v4. En deduire que si (x, y, z) ∈ R3, alors

(x2 + y2 + z2)2 ≤ 3(x4 + y4 + z4).(iv) Utiliser ce qui precede pour montrer que f(x, y, z) → +∞ lorsque x2 + y2 + z2 → +∞.(v) En conclure que f prend sa valeur minimale absolue sur R3 au point (a, b, c).

(e4.6) Soit f : R2 → R la fonction f(x, y) = x1+x2+y2 (voir (0.1.1)).

(i) Calculer f ′. En deduire l’ensemble des points critiques de f .(ii) Calculer la matrice hessienne Hf,(x,y) puis determiner si les points critiques sont des extremums

relatifs.(iii) Montrer que f(x, y) → 0 lorsque x2 + y2 → +∞. (Utiliser les coordonnees polaires x = r cos θ,

y = r sin θ.)(iv) Calculer M = supf(x, y) | (x, y) ∈ R2 et m = inff(x, y) | (x, y) ∈ R2. Existe-t-il (a, b) ∈ R2

tel que f(a, b) = M ; tel que f(a, b) = m ?

(e4.7) Determiner si les matrices suivantes sont definies positives, definies negatives, positives ounegatives :

27

Page 28: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

(i)

(3 0 00 2 00 0 −1

), (ii)

( 2 0 −10 2 −1−1 −1 2

), (iii)

2 1 1 11 1 1 11 1 1 11 1 1 2

.

(e4.8) Utiliser la methode de Gauss (4.13) pour ecrire la forme quadratique (x, y, z) 7→ xy + yz + xzcomme combinaison de membres d’une famille libre de formes lineaires.

(e4.9) Soient n, N deux entiers positifs et soient ar, 1 ≤ r ≤ N , N points de Rn. Soit f la fonctionRn → R definie par x 7→

∑Nr=1 ||x− ar||2.

Montrer que f a un unique point critique et que ce point critique est un minimum relatif puis qu’ils’agit du minimum absolu de f sur Rn.

(e4.10) Soit f : Rn → R un polynome de degre 2, c’est-a-dire une fonction de la forme f = q + ` + c,ou q : Rn → R est une forme quadratique, ` : Rn → R une forme lineaire et c ∈ R. On note A la matricesymetrique associee a q et b l’element de Rn tel que `(x) = 〈b, x〉 pour tout x ∈ Rn.

(i) Soit x ∈ Rn. Calculer f ′(x) ainsi que la matrice hessienne Hf,x de f en fonction de A et b.On suppose desormais que q est non-degeneree, c’est-a-dire que A est inversible.(ii) Montrer que si A est inversible, alors f a un unique point critique x0.(iii) Montrer que x0 est un minimum relatif si A est definie positive et un maximum relatif si A est

definie negative.

(e4.11) Soient r, n deux entiers tels que 0 ≤ r ≤ n. Montrer que l’ensemble des matrices dans Mn

de rang au plus r est ferme. (Rappel : si r < n, une matrice est de rang au plus r si et seulement si ledeterminant de tout mineur d’ordre r + 1 est nul.)

Theme 5. Extremums lies d’une fonction Rp → R, multiplicateurs de Lagrange

(5.1) Soit Ω un domaine dans Rp, soit f : Ω → R une fonction et soit X ⊆ Ω de classeC(1). Dans sa forme la plus generale, le probleme d’extremum lie est le probleme de determinerles valeurs maximales et minimales de f sur X (ou a defaut leurs bornes superieure et inferieure).Typiquement, X est decrit par des conditions de la forme g1 = g2 = · · · = gq = 0, les fonctions g`

(les contraintes) etant encore de classe C(1) et donc continues, de sorte que X est un ferme relatifde Ω. Nous allons d’abord traiter le cas d’une forme quadratique sur la sphere S(0; 1) de centre 0et de rayon 1. Apres, nous decrivons la methode des multiplicateurs de Lagrange qui permet,au moins en principe, de traiter une large classe de problemes.

(5.2) Soit donc A ∈Mp une matrice symetrique et soit q(A, ·) la forme quadratique associee.Notons S2(0; 1) la sphere de Rp pour la norme ||.||2. Rappelons que les valeurs propres de A sonttoutes reelles et notons respectivement λmax et λmin la plus grande et la plus petite parmi elles.Rappelons que nous identifions Rp avec l’espace des matrices a une ligne et p colonnes, de sorteque si x ∈ Rp, alors tx designe le vecteur colonne transpose de x.

(5.2.1) Theoreme. Pour tout x ∈ S2(0; 1), on a λmin ≤ q(A, x) ≤ λmax. L’egalite λmin =q(A, x) a lieu si et seulement si x est un vecteur propre associe a λmin et l’egalite λmax = q(A, x) alieu si et seulement si x est un vecteur propre associe a λmax. En particulier, les valeurs minimaleset maximales de q(A, ·) sur S2(0; 1) sont λmin et λmax.

Demonstration. Soit Λ une matrice diagonale dont les coefficients diagonaux sont les valeurspropres de A. On sait (4.10.4) qu’il existe une matrice orthogonale U ∈Mp telle que A = tUΛU .On sait que U laisse S2(0; 1) stable, c’est-a-dire Ux ∈ S2(0; 1) si x ∈ S2(0; 1). Soit donc x ∈ S1(0 : 1)

28

Page 29: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

et soit (y1, y2, . . . , yp) = y = Ux. Alors

q(A;x) = txAx = txtUΛUx = tyΛy =

p∑k=1

λky2k.

Ici,∑p

k=1 λky2k ≤ λmax

∑pk=1 y

2k = λmax car y ∈ S2(0; 1). Il s’ensuit que q(A;x) ≤ λmax quelque

soit x ∈ S2(0; 1). On voit de la meme maniere que q(A;x) ≥ λmin quelque soit x ∈ S2(0; 1). D’oul’encadrement λmin ≤ q(A;x) ≤ λmax.

L’egalite q(A, x) = λmax equivaut a∑p

k=1 λky2k = λmax ce qui a lieu si et seulement si yk = 0

lorsque λk < λmax. Mais si y ∈ Rp − 0, alors la condition yk = 0 lorsque λk < λmax equivauta Λy = λmaxy ce qui signifie que x = tUy est vecteur propre de A = tUΛU associe a λmax. Onraisonne de la meme maniere en ce qui concerne λmin.

(5.3) Passons donc a la methode des multiplicateurs de Lagrange, en commencant par le casle plus simple, celui ou Ω est un domaine dans R2 et la fonction f : Ω → R est assujettie a uneseule contrainte g = 0, g etant une seconde fonction Ω → R. On suppose f et g ce classe C1.Posons X = (x, y) ∈ Ω | g(x, y) = 0. Le probleme est de trouver les valeurs maximales et lesminimales de f restreinte a X. On cherche d’abord un critere pour qu’un point soit un extremumlocal.

(5.3.1) Soit (a, b) ∈ X. Supposons d’abord que g′2(x, y) 6= 0 pour tout (x, y) dans un voisinagede (a, b). D’apres le theoreme des fonctions implicites (voir (3.6)) qu’il existe un intervalle ouvertI contenant a et un intervalle ouvert J contenant b ainsi qu’une fonction φ : I → J verifiantφ(a) = b et g(x, φ(x)) = 0 pour tout x ∈ I.

Supposons donc que f restreinte a X ait un extremum local en (a, b). Alors le fonction x 7→f(x, φ(x)) a un extremum local en a. Par consequent, sa derivee s’annule en a. Il s’ensuit que

f ′1(a, b)+f ′2(a, b)φ′(a) = 0. Mais φ′(a) = −g′1(a,b)

g′2(a,b). On en tire que le gradient f ′(a, b) est un multiple

scalaire de g′(a, b).Lorsque on suppose que g′1(a, b) 6= 0, un argument semblable conduit a la meme conclusion.

Rappelons que g′(a, b) est un vecteur perpendiculaire a la tangente de la courbe g = 0 en (a, b).Geometriquement parlant, on conclut que si (a, b) n’est pas un point critique de g et si f a

un extremum local en (a, b) sous la contrainte g = 0, alors f ′ est un vecteur perpendiculaire atangente de la courbe g = 0 en (a, b).

Par consequent, il existe λ ∈ R tel que f ′(a, b) + λg′(a, b) = 0. Le reel λ est appele le multi-plicateur de Lagrange. On a ainsi trois equations

(*) f ′1(a, b) + λg′1(a, b) = 0, f ′2(a, b) + λg′2(a, b) = 0, g(a, b) = 0

pour les trois inconnus a, b, λ.La methode des multiplicateurs de Lagrange est tout simplement une reinterpretation

de ces equations. On introduit la fonction de trois variables x, y, z :

H(x, y, z) = f(x, y) + zg(x, y).

Cette fonction permet de reecrire les trois equations (∗) comme

H ′1(a, b, λ) = 0, H ′

2(a, b, λ) = 0, et H ′3(a, b, λ) = 0.

(5.4) En general, la methode des multiplicateurs de Lagrange etend les considerations prece-dentes au cas d’une fonction f : Ω → R definie sur le domaine Ω ⊆ Rp et soumise a q ≤ p

29

Page 30: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

contraintes g1 = g2 = · · · = gq = 0, ou les gk sont encore des fonctions de Ω dans R. A nouveau, onsuppose f et les fonctions gk de classe C(1). Posons X = x ∈ Ω | g1(x) = g2(x) = · · · = gq(x) = 0.Le point a ∈ Ω est dit regulier (pour les fonctions g1, g2, . . ., gq) si (g1)

′(a), (g2)′(a), . . ., (gq)

′(a)est une famille libre dans Rp. Dans le cas contraire, on dit que a est un point critique.

(5.4.1) Theoreme. Soit a un extremum relatif de f restreinte a X. Si a est un point regulierpour g1, g2, . . ., gq alors f ′(a) appartient au sous-espace de Rp engendre par (g1)

′(a), (g2)′(a), . . .,

(gq)′(a).L’interpretation geometrique est la meme que dans le cas p = 2, q = 1 traite precedemment.

Puisque a est regulier, (g1)′(a), (g2)

′(a), . . ., (gq)′(a) engendrent l’espace normal a X en a, c’est

a dire l’espace orthogonal a l’espace tangent de X en a. Le theoreme dit donc que si a est unextremum de f restreinte a X, alors f ′(a) est perpendiculaire a l’espace tangent de X en a. Lademonstration suit la meme demarche que celle du cas d’une fonction en deux variables a uneseule contrainte, en appliquant la forme generale du theoreme des fonctions implicites (3.9.1).Nous omettons les details.

(5.4.2) Dans sa formulation generale, la methode des multiplicateurs de Lagrange estune description concrete de ce theoreme. La conclusion que f ′(a) appartient au sous-espace deRp engendre par (g1)

′(a), (g2)′(a), . . ., (gq)

′(a) signifie qu’il existe q reels λk, 1 ≤ k ≤ q (appelesmultiplicateurs de Lagrange) tels que

(**) f ′(a) +

q∑k=1

λk(gk)′(a) = 0.

Il s’agit d’une egalite dans Rp, c’est-a-dire de p equations dans R. A celles-ci s’ajoutent les qequations

(***) g1(a) = g2(a) = · · · = gq(a) = 0,

ce qui fait p + q equations au total pour les p + q inconnus : les p coordonnees de a et lesmultiplicateurs de Lagrange λ1, λ2, . . ., λq.

A nouveau, on reinterprete ces equations en introduisant la fonction de p+ q variables

H(x1, x2, . . . , xp, z1, z2, . . . , zq) = f(x) +

q∑k=1

zkgk(x),

ou x = (x1, x2, . . . , xp). Les equations (∗∗) et (∗∗∗) se recrivent alors

H ′k(a1, a2, . . . , ap, λ1, λ2, . . . , λq) = 0 pour tout 1 ≤ k ≤ p+ q,

ou l’on a ecrit a = (a1, a2, . . . , ap). On appelle les points a ∈ X tels qu’il existe (λ1, λ2, . . . , λq)verifiant les equations de Lagrange les points critiques de f relatifs a X (ou relatifs auxcontraintes g1 = g2 = · · · = gq = 0).

(5.5) Ayant trouves les points critiques de f relatifs a l’ensemble X, la question se pose desavoir s’il s’agit d’un maximum ou un minimum local.

(5.5.1) Reprenons d’abord le cas deja etudie (5.3) d’une fonction f de deux variables assujettiea une seule contrainte g = 0. Reprenons les notations de (5.3) en supposant, de plus, que f et gsoient de classe C(2). Notons ψ la fonction x 7→ f(x, φ(x)). Il est clair que le point critique (a, b) def sous la contrainte g = 0 est un minimum strict local si et seulement si a est un minimum strict

30

Page 31: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

local de ψ. Or, une condition familiere pour que ψ ait un minimum strict local est que ψ′′(a) > 0,ce qui nous allons traduire en termes de fonctions f et g du probleme. On a

ψ′′(a) = (ψ′)′(a) = [d

dx(f ′1(x, φ(x)) + f ′2(x, φ(x))φ′(x))]x=a

= f ′′1,1(a, φ(a)) + 2f ′′1,2(a, φ(a))φ′(a) + f ′′2,2(a, φ(a))φ′(a)2 + f ′2(a, φ(a))φ′′(a)

et donc, puisque b = φ(a) :

(1) ψ′′(a) = f ′′1,1(a, b) + 2f ′′1,2(a, b)φ′(a) + f ′′2,2(a, b)φ

′(a)2 + f ′2(a, b)φ′′(a).

En outre, on sait que φ′(x) = −g′1(x,φ(x))

g′2(x,φ(x))et donc que 0 = g′1(x, φ(x))+φ′(x)g′2(x, φ(x)). En derivant

par rapport a x puis en substituant x = a on trouve

(2) 0 = g′′1,1(a, b) + 2g′′1,2(a, b)φ′(a) + g′′2,2(a, b)φ

′(a)2 + g′2(a, b)φ′′(a).

Or, le multiplicateur de Lagrange λ verifie f ′2(a, b) + λg′2(a, b) = 0. En prenant donc la sommede l’equation (1) et de λ fois l’equation (2) on obtient donc, en ecrivant a nouveau H(x, y, z) =f(x, y) + zg(x, y) :

ψ′′(a) = H ′′1,1(a, b, λ) + 2H ′′

1,2(a, b, λ)φ′(a) +H ′′2,2(a, b, λ)φ′(a)2

Or, on y reconnaıt la valeur en (1, φ(a)) de la forme quadratique associee a la matrice hessienne

de H par rapport aux deux premieres variables. Enfin la relation φ′(a) = −g′1(a,b)

g′2(a,b)permet d’ecrire :

ψ′′(a) =1

g′2(a, b)2

(H ′′

1,1(a, b, λ)g′2(a, b)2 − 2H ′′

1,2(a, b, λ)g′2(a, b)g′1(a, b) +H ′′

2,2(a, b, λ)g′1(a, b)2).

On en conclut que ψ′′(a) est du meme signe que H ′′1,1(a, b, λ)g′2(a, b)

2−2H ′′1,2(a, b, λ)g′2(a, b)g

′1(a, b)+

H ′′2,2(a, b, λ)g′1(a, b)

2. Dans ce qui precede, nous avons suppose que g′2(a, b) 6= 0. Un argumentsemblable en supposant que g′1(a, b) 6= 0 conduit a la meme conclusion. Nous avons ainsi demontrele resultat suivant.

(5.5.2) Proposition. Soit Ω ⊆ R2 un domaine et soient f et g deux fonctions de classe C(2)

sur Ω. Soit X = (x, y) ∈ Ω | g(x, y) = 0. Soit (a, b) ∈ X. On suppose que (a, b) soit unpoint regulier de g mais qu’il s’agit d’un point critique de f relatif a X. Soit λ le multiplicatuerde Lagrange associe et soit H(x, y, z) la fonction f(x, y) + zg(x, y). Soit q la forme quadratiqueassociee a la matrice hessienne de H par rapport aux deux premieres variables :(

H ′′1,1(a, b, λ) H ′′

1,2(a, b, λ)H ′′

1,2(a, b, λ) H ′′2,2(a, b, λ)

).

Si q(− g′2(a, b), g′1(a, b)

)> 0, alors la restriction de f a X a un minimum strict local en (a, b). De

meme, si q(− g′2(a, b), g

′1(a, b)

)< 0, elle a un maximium strict local en (a, b).

Rappelons que (−g′2(a, b), g′1(a, b) est un generateur de l’espace vectoriel tangent de X en(a, b). La condition q(−g′2(a, b), g′1(a, b) > 0 (ou q(−g′2(a, b), g′1(a, b) < 0) est donc equivalente a lacondition que la restriction de q a l’espace tangent soit definie positive (ou definie negative). Cetteinterpretation suggere la generalisation correcte de la proposition a une fonction de p variablesassujettie a q contraintes.

(5.6) Theoreme. Soit Ω ⊆ Rp un domaine et soient f , gk (1 ≤ k ≤ q) q + 1 fonctionsde classe C(2) sur Ω. Soit X = x = (x1, x2, . . . , xp) ∈ Ω | g1(x) = g2(x) = · · · = gq(x) = 0.

31

Page 32: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

Soit a = (a1, a2, . . . , ap) ∈ X. On suppose que a soit un point regulier de g = (g1, g2, . . . , gq)mais qu’il s’agit d’un point critique de f relatif a X. Soit λ = (λ1, λ2, . . . , λq) le multiplicateur deLagrange associe et soit H : Ω × Rq la fonction H(x1, x2, . . . , xp, z1, . . . , zq) = f(x1, x2, . . . , xp) +∑q

k=1 zkgk(x1, x2, . . . , xp). Soit q la forme quadratique associee a la matrice hessienne de H parrapport aux p premieres variables :

H ′′1,1(a, λ) H ′′

1,2(a, λ) · · · H ′′1,p(a, λ)

H ′′2,1(a, λ) H ′′

2,2(a, λ) · · · H ′′2,p(a, λ)

......

. . ....

H ′′p,1(a, λ) H ′′

p,2(a, λ) · · · H ′′p,p(a, λ)

.

Si la restriction de q a l’espace vectoriel tangent de X en a est definie positive, alors f restreintea X a un minimum strict local en a. De meme, si la restriction de q a l’espace vectoriel tangentde X en a est definie negative, alors f restreinte a X a un maximium strict local en a.

La demonstration suit le meme schema que celle de (5.5.2). Nous n’en donnerons pas lesdetails.

(5.7) Considerons a titre d’exemple le probleme de trouver, parmi tous les triangles dansle plan euclidien d’une aire A donnee, ceux qui ont le plus court perimetre. Dans un repereorthonorme convenable, on peut supposer que les affixes des trois sommets sont (−z, 0), (z, 0),(x, y), avec z > 0, y > 0 et x ∈ R (croquis !). Alors l’aire du triangle est A := yz et son perimetreest f(x, y, z) = 2z +

√(x− z)2 + y2 +

√(x+ z)2 + y2. Il s’agit donc de trouver le maximum de

la fonction f sous la contrainte g = 0, ou g(x, y, z) = A − yz. On travaille dans le domaineΩ = (x, y, z) ∈ R3 | y > 0, z > 0. Tous les points de Ω sont reguliers pour g. Soit alors (a, b, c)un extremum de f restreinte a X = (x, y, z) ∈ Ω | g(x, y, z) = 0. On a alors les 4 equationsf ′k(a, b, c) + λg′k(a, b, c) = 0, 1 ≤ k ≤ 3, et g(a, b, c) = 0. Explicitement :

a− c√(a− c)2 + b2

+a+ c√

(a+ c)2 + b2= 0

b√(a− c)2 + b2

+b√

(a+ c)2 + b2− λc = 0

2 +−a+ c√

(a− c)2 + b2+

a+ c√(a+ c)2 + b2

− λb = 0

ainsi que la relation A = bc.En utilisant la premiere et la troisieme equation, on constate que

λb = 2 + 2a+ c√

(a+ c)2 + b2= 2 + 2

−a+ c√(a− c)2 + b2

et donc que a+c√(a+c)2+b2

= −a+c√(a−c)2+b2

. Donc ((a − c)2 + b2)(a + c)2 = ((a + c)2 + b2)(a − c)2

ce qui conduit a a = 0 puisque (a, b, c) ∈ Ω. En substituant a = 0 dans la seconde equationpuis la multipliant par b, on trouve 2b2√

c2+b2= λA. De meme, 2c + 2c2√

c2+b2= λA. Il s’ensuit que

2b2 = 2c√c2 + b2 + 2c2, ce qui entraıne que b =

√3c, c’est-a-dire que le triangle est equilateral.

Enfin, comme bc = A, on conclut qu’il y a un unique point critique relatif dans Ω, a savoir celuiou a = 0, b = 31/4

√A et c =

√A/31/4.

On peut etablir qu’il s’agit d’un minimum strict local en utilisant le theoreme (5.6). La valeurde λ se calcule, par exemple, en substituant les valeurs de b et de c dans l’equation 2b2√

c2+b2= λA.

32

Page 33: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

On en tire que λ = 33/4/√A. Apres calcul, on trouve que la matrice hessienne de (5.6) est

H =

35/4

4√A

031/4

4√A

031/4

4√A

−5 · 33/4

4√A

31/4

4√A

−5 · 33/4

4√A

35/4

4√A

.

Le plan tangent de g(x, y, z) = 0 au point (0, 31/4√A,√A/31/4) est forme des vecteurs de la forme

(x, y,−√

3y) avec (x, y) ∈ R2. La restriction a ce plan de la forme quadratique associee a H est

(x, y,−√

3y) 7→ 31/4

4√

A(3x2 − 2

√3xy + 40y2), ce qui est bien definie positive.

On en conclut que (0, 31/4√A,√A/31/4) est bien un minimum strict local de f sur X. Pour

montrer qu’il s’agit bien du minimum absolu de f sur X (s’il en existe), on s’inspire de la methodesuggeree pour resoudre l’exercice (e4.4). Puisque y > 0 et z > 0, on voit aussitot que f(x, y, z) ≥2z + |x| + y ≥ ||(x, y, z)||1 pour tout (x, y, z) ∈ Ω. Soit r un reel avec r > f(0, 31/4

√A,A/31/4).

Lorsque (x, y, z) ∈ X mais (x, y, z) /∈ K1(0; r), f(x, y, z) > f(0, 31/4√A,A/31/4) et le minimum

absolu se situe forcement dans X ∩K1(0; r). Puisque f est continu et X ∩K1(0; r) est compact,f a un minimum sur X ∩ K1(0; r), qui sera alors le minimum absolu de f sur X. Le minimumabsolu est donc forcement un minimum relatif, donc un point critique relatif. Puisque nous n’avonstrouve qu’un seul point critique, celui-ci est bien le minimum absolu. Ceci acheve la preuve que,parmi tous les triangles d’aire donnee, les triangles equilateraux qui a le plus petit perimetre.

EXERCICES

(e5.1) Trouver les valeurs maximales et minimales sur le cercle unite de la forme quadratique associee

a la matrice(

2 11 2

).

(e5.2) Trouver les valeurs maximales et minimales sur la sphere unite de R3 de la forme quadratique

associee a la matrice

(1 4 24 1 22 2 −2

).

(e5.3) Determiner les valeurs maximales et minimales de la forme quadratique associee a la matricesymetrique A ∈ Mp sur la boule unite fermee K2(0; 1) de Rp. Quelles sont les valeurs maximales etminimales sur S2(0; r), sur K2(0; r) ? Ici, r > 0.

(e5.4) Calculer le maximum et le minimum de la fonction (x, y, z) 7→ x + 2y + 3z sur la sphereunite de R3, comme demande au (0.1.2). Generaliser : calculer le maximum et le minimum de (x, y, z) 7→ux + vy + wz (ou u, v, w sont des constantes) sur S2(0; 1). Generaliser encore : si u ∈ Rp calculer lemaximum et le minimum de x 7→ 〈u, x〉 sur la sphere S2(0; 1) de Rp.

(e5.5) Soit la fonction f : R3 → R definie par f(x, y, z) = xy.(i) Calculer les valeurs extremes de f sur la sphere S2(0; 1).(ii) Calculer les valeurs extremes de f sur l’ensemble des points (x, y, z) de S2(0; 1) qui verifient

x + y + z = 1.

(e5.6) Soit a ∈ Rp − 0, soit β ∈ R et soit X l’hyperplan x ∈ Rp | 〈a, x〉 = β. En utilisant lesmultiplicateurs de Lagrange, trouver la distance perpendiculaire d’un point b ∈ Rp a X. (Chercher leminimum de la fonction x 7→ ||x− b||2 sur X.)

33

Page 34: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

(e5.7) Reprenons les notations du theoreme (5.2.1), dont le present exercice propose une secondedemonstration utilisant les multiplicateurs de Lagrange. On a alors

f(x) = q(A, x) =∑i,j

Aijxixj

pour tout x = (x1, x2, . . . , xp).(i) Calculer f ′(x).(ii) Montrer que si x0 ∈ S2(0; 1) est un extremum de q sur S2(0; 1), alors x est un vecteur propre de

A. Determiner la valeur propre correspondant en fonction de la valeur du multiplicateur de Lagrange.(iii) Conclure.

(e5.8) On note p ≥ 2 un entier et (a1, a2, . . . , ap) un element de Rp verifiant ai > 0 pour touti ∈ 1, 2, . . . , p. On note X l’ensemble des points de la sphere S2(0; 1) dont toutes les coordonneesxi sont positives et X ′ l’ensemble des points de S2(0; 1) dont toutes les coordonnees sont strictementpositives.

(i) Montrer que X est compact.(ii) L’ensemble X ′ est-il compact ? Est-il ouvert ?On note f la fonction f(x1, x2, . . . , xp) = xa1

1 xa22 · · ·xap

p .(iii) Montrer que f atteint un maximum et un minimum sur X.(iv) Quelle est la valeur minimale de f sur X ? En quels points de X est-elle atteinte ?(v) En utilisant la methode des multiplicateurs de Lagrange, calculer la valeur maximale de f sur

X ′ puis sur X.

(e5.9) Quelles sont les triangles de perimetre donne qui ont la plus grande aire ? (Se calquer sur(5.7).) Cela repond a (0.1.3).

(e5.10) Parmi les triangles inscrits dans un cercle de rayon donne, les triangles equilateraux ont leplus grand perimetre.

Theme 6. Equations differentielles, equilibre, stabilite

(6.1) Rappelons qu’une equation differentielle est une equation de la forme

F (t, x, x′, x′′, . . . , x(n)) = 0,

ou n ≥ 1 est un entier, F est une fonction definie sur un domaine de Rn+2 et x est une fonctionn-fois derivable de t sur un intervalle I, a priori inconnue. Ici x′, x′′, . . ., x(n) designent les deriveessuccessives de x par rapport a t. L’equation est d’ordre n si F depend effectivement de la dernierevariable x(n). Les courbes

(t, x(t)

)| t ∈ I, x etant une solution de l’equation s’appellent les

courbes integrales de l’equation. L’objet de ce theme est de faire le tour d’un certain nombred’equation differentielles et des proprietes de leurs solutions.

Il est souvent impossible de trouver une solution en termes des fonctions elementaires (puis-sance, exponentielle, logarithme, fonctios trigonometriques). On se contentera alors d’une solutionimplicite, de la forme f(x, t) = 0, la fonction f ayant pour domaine de definition un rectangleI × J , J etant un second intervalle.

(6.1.1) On s’interesse souvent a des solutions verifiant quelques conditions initiales. Lesconditions initiales les plus souvent rencontrees imposent les valeurs d’une solution ainsi que deses derivees en un point de I. Si t0 ∈ I et si (α0, α1, . . . , αn−1) ∈ Rn, on cherche la ou les solutionsx verifiant x(t0) = α0, x

′(t0) = α1, . . ., x(n−1)(t0) = αn−1. L’interet des conditions initiales de cetteforme reside dans resultat general suivant.

34

Page 35: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

(6.1.2) Theoreme. Soit I un intervalle ouvert et soit Ω un domaine de Rn. Soit t0 ∈ I,soit (α0, α1, . . . , αn−1) ∈ Ω et soit f : I × Ω → R une fonction de classe C(1). Alors il existeun intervalle ouvert J ⊆ I contenant t0 et une unique fonction x : J → Ω verifiant x(n)(t) =f(t, x(t), x′(t), . . . , x(n−1)(t)

)pour tout t ∈ J et x(t0) = α0, x

′(t0) = α1, . . ., x(n−1)(t0) = αn−1.Nous verrons au (7.1.3) que ce resultat est une consequence du theoreme (7.1.2) qui sera

lui-meme demontre dans le theme 10. Dans cet enonce, nous avons suppose que x(n) s’exprimeexplicitement en fonction des derivees d’ordre inferieur. Une version plus generale du theoremeconcerne les equations de la forme F

(t, x(t), x′(t), . . . x(n)(t)

)= 0. Selon le theoreme des fonctions

implicites (3.9.1), il existe un intervalle ouvert I contenant t0 ainsi qu’une fonction f de classe C(1)

tels que x(n)(t) = f(t, x(t), . . . , x(n−1)(t) lorsque F est de classe C(1) et sa derivee par rapport a la

derniere variable ne s’annule pas en t0. Sous ces conditions, on peut appliquer le resultat enonce.Par contre, il est facile de donner des contrexemples a l’existence de solutions lorsque la deriveede F par rapport a la derniere variable s’annule (voir l’exercice (e6.1)).

(6.1.3) Exemple. Prenons l’equation x′′+x = 0. On remarque que x1(t) = cos t et x2(t) = sin tsont des solutions. Prenons t0 = 0. Si (α0, α1) ∈ R2, l’unique solution x(t) verifiant x(0) = α0,x′(0) = α1 est x(t) = α0 cos t+ α1 sin t.

(6.1.4) Bien qu’en principe on s’interesse aux solutions reelles, il est commode dans certainscas de faire intervenir des solutions complexes. Rappelons alors la formule d’Euler

eiθ = cos θ + i sin θ

ainsi que les relations

cos θ =eiθ + e−iθ

2, sin θ =

eiθ − e−iθ

2i,

valables quelque soit θ ∈ C. On a ez+w = ezew quelque soit z, w ∈ C et donc

eβ+iγ = eβ(cos γ + i sin γ)

quelque soit β, γ ∈ C.

(6.2) Une equation differentielle est dite lineaire si elle peut s’ecrire sous la forme

(∗) an(t)x(n)(t) + an−1(t)x(n−1)(t) + · · ·+ a1(t)x

′(t) + a0(t)x(t) = b(t),

ou les ak et b sont des fonctions de t definies sur un intervalle I. L’equation lineaire est ditehomogene si b = 0, inhomogene dans le cas contraire.

(6.2.1) Proposition. (i) Soient x1, x2 deux solutions d’une equation lineaire homogene etsoient λ1, λ2 ∈ R. Alors λ1x1 + λ2x2 est solution de (∗). Par consequent, les solutions d’uneequation lineaire homogene forment un R-espace vectoriel.

(ii) Soit y0 une solution de (∗). Alors toute autre solution de (∗) est de la forme y0 + x, ou xparcourt l’espace des solutions de l’ equation homogene associee

an(t)x(n)(t) + an−1(t)x(n−1)(t) + · · ·+ a1(t)x

′(t) + a0(t)x(t) = 0.

La demonstration est immediate. La proposition montrer que pour resoudre (∗), il suffit deconnaıtre une solution y0 (appelee solution particuliere) et toutes les solutions de l’equationhomogene associee.

35

Page 36: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

(6.2.2) Theoreme. On suppose que les fonctions ak : I → R soient de classe C(1). Soit t0 ∈ I.On suppose que an(t0) 6= 0.

(i) Soit (α0, α1, . . . , αn−1) ∈ Rn. Alors il existe un intervalle ouvert J ⊆ I contenant t0 et uneunique solution x de (∗) verifiant x(t0) = α0, x

′(t0) = α1, . . ., x(n−1)(t0) = αn−1.(ii) Lorsque (∗) est homogene, il existe un intervalle ouvert J ⊆ I contenant t0 tel que l’espace

vectoriel des solutions des fonctions x : J → R verifiant (∗) soit de dimension n.Demonstration. (i) est un cas particulier de (6.1.2). En ce qui concerne le (ii), on sait d’apres

le (i) que, pour tout k ∈ 0, 1, . . . , n − 1, il existe une unique solution xk verifiant x(`)k (t0) = 1

lorsque ` = k et x(`)k (t0) = 0 lorsque ` 6= k (ou ` ∈ 0, 1, . . . , n − 1). On verifie alors que les

fonctions (xk)0≤k≤n−1 forment une famille libre : en effet, si k ∈ 0, 1, . . . , n− 1 alors, en derivantk fois une relation de dependance lineaire

∑n−1r=0 λrxr(t) = 0 puis en posant t = t0, on trouve que

λk = 0. Par consequent, l’espace des solutions est de dimension au moins n. Si x est une solutionet si l’on pose αk = x(k)(t0) (0 ≤ k ≤ n− 1), alors les solutions x et α0x0 + α1x1 + · · ·+ αn−1xn−1

verifient les memes conditions initiales en t0. Par consequent, elles coıncident et (x0, x1, . . . , xn−1)est une base de l’espace des solutions.

(6.3) Commencons par le cas des equations lineaires homogenes de premier ordre. L’equations’ecrit alors

a1(t)x′(t) + a0(t)x(t) = 0.

On dit que l’equation est exacte si a0(t) = a′1(t) pour tout t ∈ I. Si c’est le cas, l’equation peuts’ecrire (a1x)

′(t) = 0. On en tire que (a1x)(t) est une constante C et que x(t) = Ca1(t)

pourvu quea1 ne s’annule pas sur I.

(6.3.1) La methode suivante permet de resoudre l’equation meme lorsque elle n’est pas exacte.Il faut encore supposer que a1 ne s’annule pas sur I. Si x est une solution qui ne s’annule pas surI alors

x′(t)

x(t)= −a0(t)

a1(t).

Il s’ensuit que log |x(t)| = −∫ a0(t)

a1(t)dt puis que |x(t)| = e

−R a0(t)

a1(t)dt

. Ici,∫ a0(t)

a1(t)dt est une primitive

de a0

a1. Puisque x ne s’annule pas sur I et x est continue, on a soit x(t) > 0 pour tout t ∈ I soit

x(t) < 0 pour tout t ∈ I. On en tire que x(t) = ±e−R a0(t)

a1(t)dt

selon le signe de x(t).Cette presentation a le desavantage de supposer que la solution x ne s’annule pas sur I. En

fait, on peut montrer que toute solution x sauf la solution identiquement nulle ne s’annule pas surI. Voir l’exercice (e6.5).

(6.3.2) L’equation x′(t)− ax(t) = 0, ou a est une constante, a pour solution toute fonction dela forme x(t) = Ceat, C etant une constante. Cet exemple sera generalise au (6.7). Dans ce casprecis, il est facile de montrer que toute solution est de cette forme (voir l’exercice (e6.15)). Engeneral, les questions d’existence et d’unicite de solutions d’une equation differentielle sont assezcomplexes (voir le theme 10 pour une introduction a ce sujet).

(6.4) Considerons a present les equations lineaires arbitraires de premier ordre. Une telleequation s’ecrit

a1(t)x′(t) + a0(t)x(t) = b(t).

A nouveau, l’equation est dite exacte si a0(t) = a′1(t) pour tout t ∈ I. Si c’est le cas, alorsl’equation s’ecrit (a1x)

′(t) = b(t), d’ou (a1x)(t) = B(t), ou B est une primitive de b. Si a1 nes’annule pas sur I, alors la solution est donnee par x(t) = B(t)

a1(t)pour tout t ∈ I.

36

Page 37: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

Le cas ou l’equation n’est pas exacte est traite en cherchant une fonction γ : I → R telle quel’equation multipliee par γ :

(†) a1(t)γ(t)x′(t) + a0(t)γ(t)x(t) = γ(t)b(t)

soit exacte. Ce sera le cas s’il existe une fonction δ : I → R telle que (a1γ)(t) = δ(t) et (a0γ)(t) =δ′(t) ou encore si (a1γ)

′(t) = (a0γ)(t) pour tout t ∈ I. Il faut alors que γ soit solution de l’equationhomogene

a1(t)γ′(t) + (a′1(t)− a0(t))γ(t) = 0.

Ainsi, on peut trouver γ par la methode de (6.3).

(6.4.1) Exemple. Soit a resoudre l’equation x′(t)− x(t) = t sur R. On cherche une fonction γtelle que γ(t)x′(t)−γ(t)x(t) = γ(t)t soit exacte. Il faut alors que −γ(t) = γ′(t) ce qui est satisfaitepar γ(t) = e−t. L’equation devient alors e−tx′(t)− e−tx(t) = e−tt ou encore (e−tx(t))′ = e−tt. D’oue−tx(t) =

∫e−tt dt = −(1+ t)e−t +C puis x(t) = −(1+ t)+Cet, C etant une constante arbitraire.

Si t0 ∈ R et si α0 ∈ R, et si l’on cherche la solution verifiant x(t0) = α0, alors α0 = −(1+t0)+Cet0

et il y a un unique choix de C qui donne la solution desiree.

(6.5) Des manipulations des deux derniers paragraphes, il faut bien entendu retenir la methodesuivie plutot que les formules precises. Il convient egalement de retenir les deux points suivants :

(a) la solution fait intervenir une constante arbitraire, qui apparaıt par exemple dans le choixde la primitive B de b (ou de γb lorsque l’equation initiale n’est pas exacte comme dans la formule(†)). Ainsi, il convient de parler de la famille des solutions, parametree par une constante C.Etant donne t0 et α, il y aura un unique choix de C pour que la solution x verifie x(t0) = α0.

(b) la condition que a1 ne s’annule pas sur I interveint des le cas d’une equation homogeneexacte. En fait, si a1 s’annule sur I, l’equation n’admet pas de solution sur I en general. Voir parexemple l’exercice (e6.1)

(6.6) Considerons a present quelques proprietes des solutions d’une equation differentielled’ordre un, pas forcement lineaire. Une telle equation s’ecrit donc F (t, x, x′) = 0, mais nous nouslimitons au cas ou l’equation peut s’ecrire sous la forme x′ = f(t, x), f etant une fonction dedeux variables. Notons que l’equation lineaire d’ordre un s’ecrit sous cette forme si a1 ne s’annulepas sur I, car quitte a diviser l’equation par a1, on peut supposer a1 = 1 puis le rearranger sousla forme x′ = b − a0x. Nous admettons qu’une telle equation possede une famille de solutionsparametree par une constante C.

Dans la famille de solutions, certains membres peuvent etre distingues par des proprietesspeciales. Par exemple, il se peut que l’equation ait une unique solution constante, appelee alorssolution d’equilibre. On note souvent xe une solution d’equilibre. Une solution d’equilibre xetant par definition une solution constante, c’est-a dire une solution telle que x′(t) = 0 pour toutt, les solutions d’equilibres sont les reels xe verifiant f(t, xe) = 0 pour tout t.

On s’interesse alors au comportement asymptotique de certains solutions : s’il y a une solutiond’equilibre, certaines d’autres solutions peuvent converger vers cette solution (lorsque t → +∞par exemple). La courbe integrale approche alors la droite horizontale d’equation x = xe lorsquet 7→ +∞. Lorsque c’est le cas, on dit que la solution est stable. L’equation elle-meme est ditestable lorsque toutes ses solutions sont stables.

(6.6.1) Etudions quelques exemples.(i) Prenons l’equation x′−ax = 0, ou a est une constante. L’equation a pour solution generale

x(t) = Ce−at, C etant une constante. Si a 6= 0, la seule solution d’equilibre est xe(t) = 0. Lorsquet→ +∞, la solution x(t) tend vers 0 si et seulement si a > 0. Par consequent, l’equation est stablesi et seulement si a > 0. Si a = 0, la solution generale devient x(t) = C, et il n’y a pas de stabilite.

37

Page 38: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

(ii) Soit l’equation x′ = tx2 sur ]0,+∞[. Une solution d’equilibre verifie tx(t)2 = 0 pour tout tet, par consequent, la seule solution d’equilibre est la solution xe(t) = 0. Soit t0 > 0 et soit α0 ∈ R.Si α0 = 0, la solution a condition initiale x(t0) = α0 est la solution identiquement nulle. Si α0 6= 0,et si x est la solution a condition initiale x(t0) = α0, il existe un intervalle ouvert J ⊆]0,+∞[contenant t0 et tel que x(t) 6= 0 pour tout t ∈ J . L’equation devient alors x′(t)/x(t)2 = t d’ou, enintegrant par rapport a t, 1/x(t) = C − t2/2 avec C ∈ R, d’ou x(t) = 1/(C − t2/2). On remarqueque x(t) est negative pour t assez grand, quelque soit la valeur de C. Puisque x(t0) = α0, on aC = t20/2 + 1/α0. La fonction x(t) a donc une singularite lorsque t =

√t20 + 2/α0. Le plus grand

intervalle ouvert J ⊆]0,+∞[ contenant t0 et sur lequel x(t) est defini est donc ]0,√t20 + 2/α0[

lorsque α0 > 0 et ]√t20 + 2/α0,+∞[ lorsque α0 < 0. Lorsque α0 < 0, x(t) → 0 lorsque t→∞ ; il

y a donc stabilite lorsque t→ +∞.

(6.7) Considerons desormais les equations lineaires d’ordre quelconque et a coefficients con-stants. Expliquons d’abord la methode generale de solution de l’equation

(E) anx(n)(t) + an−1x

(n−1)(t) + · · ·+ a0x(t) = 0,

les ak etant des constantes reelles et an 6= 0. Soit λ un nombre (reel ou complexe) tel que lafonction x(t) = eλt soit une solution. Puisque x(k)(t) = λkx(t), on constate que λ est racine dupolynome caracteristique

χE(λ) = anλn + an−1λ

n−1 + · · ·+ a0 = 0.

Reciproquement, si λ est racine du polynome caracteristique χE, la fonction t 7→ eλt est solutionde l’equation differentielle (E).

Si λ = β + iγ est une racine complexe de χE, alors le conjugue complexe λ = β − iγ en estegalement une, et les fonctions

t 7→ 1

2

(eλt + eλt

)= eβt cos γt, t 7→ 1

2i

(eλt − eλt

)= eβt sin γt

sont des solutions reelles de (E).Si χE a toutes ses racines distinctes on obtient ainsi une base de l’espace vectoriel des solutions,

elle est formee des fonctions t 7→ eλt avec λ parcourant les racines reelles de χE et des fonctionst 7→ eβt cos γt et t 7→ eβt sin γt pour chaque couple (λ, λ) de racines complexes.

(6.7.1) Lorsque λ est une racine de χE de multiplicite mλ, un calcul montre que toute fonctiont 7→ P (t)eλt avec P un polynome de degre au plus mλ − 1 est solution de (E). Si λ = β + iγ,λ = β − iγ est un couple de racines complexes conjuguees, on obtient les solutions

t 7→ P (t)1

2

(eλt + eλt

)= P (t)eβt cos γt, t 7→ P (t)

1

2i

(eλt − eλt

)= P (t)eβt sin γt

avec P un polynome de degre au plus mλ − 1.Toute solution est une combinaison lineaire reelle des solutions de cette forme. Plus exacte-

ment, on a le resultat suivant.

(6.7.2) Theoreme. On suppose que le polynome caracteristique χE de (E) ait p racines reellesdistinctes (λk)1≤k≤p et q couples de racines conjuguees non-reelles distinctes (β`±iγ`)1≤`≤q. Si l’onnote mk la multiplicite de λk et n` la multiplicite de β` + iγ`, alors toute solution x de l’equation(E) s’ecrit d’une maniere unique sous la forme

x(t) = P1(t)eλ1t + · · ·+ Pp(t)e

λpt+

+Q1(t)eβ1t cos γ1t+R1(t)e

β1t sin γ1t+ · · ·+Qq(t)eβqt cos γqt+Rq(t)e

βqt sin γqt,

38

Page 39: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

ou Pk, (1 ≤ k ≤ p), est un polynome de degre au plus mk − 1 et Q` et R`, (1 ≤ ` ≤ q), sont despolynomes de degre au plus n` − 1.

Demonstration (esquisse). Comme indique juste avant l’enonce, x est bien une solution de (E).On a m1+ · · ·+mp+2n1+ · · ·+2nq = n. Les fonctions de la forme indiquee constituent donc un R-espace vectoriel de dimension au plus n. Un calcul (que nous omettrons) montre que si une fonctionde la forme indiquee est identiquement nulle, alors P1 = · · · = Pp = Q1 = R1 = · · · = Qq = Rq = 0.Par consequent, les fonctions considerees constituent un R-espace vectoriel de dimension n. D’apres(6.2.2) (ii), les solutions forment un espace vectoriel de dimension n. On en tire qu’il n’y a pasd’autres solutions.

En pratique, nous n’aurons besoin de ce resultat que pour les petites valeurs de n (n ≤ 4disons).

(6.7.3) Exemples. (i) Soit ω un reel, ω > 0. L’equation x′′ + ω2x = 0 a pour polynomecaracteristique λ2 + ω2 et les deux racines sont iω et −iω. Cela conduit aux solutions t 7→ cosωt,t 7→ sinωt puis a la solution generale

x(t) = A cosωt+B sinωt,

A et B etant des constantes. Les solutions sont toutes periodiques, de periode 2πω

.(ii) Considerons l’equation x(iv)(t)− 2x′′(t) + x(t) = 0. Le polynome caracteristique est λ4 −

2λ2 + 1 = (λ2 − 1)2. Les racines 1 et −1 sont chacunes de multiplicite 2. Cela conduit aux 4solutions t 7→ et, t 7→ tet, t 7→ e−t et t 7→ te−t puis a la solution generale

x(t) = (A+Bt)et + (C +Dt)e−t,

A, B, C et D etant des constantes.

(6.8) Soit l’equation inhomogene

anx(n)(t) + an−1x

(n−1)(t) + · · ·+ a0x(t) = b(t),

ou les ak sont des constantes avec an 6= 0 et b est une fonction. Nous savons deja decrire toutes lessolutions de l’equation homogene associee. Cherchons donc des methodes de trouver une solutionparticuliere.

(6.8.1) Une methode tres utile est celle de dite de la variation de la constante, que nousallons decrire dans le cas d’une equation d’ordre 2. Elle peut etre utilisee meme pour les equationsdont les coefficients ne sont pas constants. Prenons donc l’equation

a2(t)x′′(t) + a1(t)x

′(t) + a0(t)x(t) = b(t)

et cherchons une solution x de la forme uy, y etant une solution connue de l’equation homogeneassociee. Puisque x = uy, on a x′ = u′y + uy′ puis x′′ = u′′y + 2u′y′ + uy′′ et donc

a2x′′ + a1x

′ + a0x = a2(u′′y + 2u′y′ + uy′′) + a1(u

′y + uy′) + a0uy

= (a2y′′ + a1y

′ + a0y)u+ (2a2y′′ + a1y

′)u′ + a2yu′′

d’ou(2a2y

′′ + a1y′)u′ + a2yu

′′ = b.

Si l’on pose v = u′, on obtient l’equation lineaire d’ordre un pour v : (2a2y′′ + a1y

′)v + a2yv′ = b

ce qui permet en principe de determiner v = u′ puis u.

39

Page 40: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

(6.8.2) Exemple. Soit l’equation x′′+ω2x = sinωt, ou ω > 0. On ecrit x = uy, ou y est solutionde y′′ + ω2y = 0. Alors u′′y + 2u′y′ = sinωt. A ce stade, il faut effectuer un choix de y. Prononsy(t) = cosωt. Alors cosωt u′′ − 2ω sinωt u′ = sinωt. L’equation devient exacte si on la multipliepar cosωt, car (cosωt)2 a pour derivee −2ω sinωt cosωt. Donc (u′(t) cos2 ωt)′ = cosωt sinωt etu′(t) cos2 ωt = − cos2 ωt

2ω+ C puis u′(t) = − 1

2ω+ C

cos2 ωt, C etant une constante. Ici, on ne cherche

qu’une seule solution particuliere u et on peut se permettre de choisir C d’une telle maniere quele calcul devient le plus simple possible. Alors le choix C = 0 s’impose. On trouve alors u = − 1

2ωt

et donc x = uy = − 12ωt cosωt. La solution generale est alors − 1

2ωt cosωt+ A cosωt+B sinωt.

Remarquons que la solution particuliere trouvee depend du choix fait de la solution y del’equation homogene associee. Le lecteur peut refaire le calcul en prenant y(t) = sinωt a la placede cosωt : il constatera alors que le choix de y n’est pas sans incidence sur la difficulte du calcul. . ..

(6.8.3) La meme methode s’adapte aux equations lineaires inhomogenes d’ordre n quelconque.On cherche une solution x de la forme uy, y etant une solution de l’equation homogene associee.On trouve que u′ verifie une equation lineaire d’ordre n− 1. En particulier, en prenant n = 1 ontrouve une seconde methode de solution d’une equation inhomogene d’ordre un.

(6.9) Les notions d’equilibre et de stabilite s’etend d’une maniere evidente aux equationsd’ordre superieure. Une solution constante est appelee solution d’equilibre et toute solution conver-geant vers une solution d’equilibre s’appelle une solution stable.

Exemples. Reprenons les exemples de (6.7.3). Dans l’exemple (i), la seule solution constanteest la fonction constante nulle. Si A 6= 0 ou si B 6= 0, la solution generale x(t) ne tend pas vers 0lorsque t→ +∞ et il n’y a donc pas de stabilite.

Dans l’exemple (ii), la seule solution constante est a nouveau la solution identiquement nulle.La solution generale est stable si et seulement si A = B = 0.

(6.10) Terminons ce theme en mentionnant quelques exemples d’equations differentielles dontles solutions se presentent sous forme de fonction implicite. Soit d’abord x une fonction de t definieimplicitement par une relation g(t, x) = C, g etant de classe C(1) sur un domaine de R2 et C uneconstante. Alors g′1(t, x) + g′2(t, x)x

′(t) = 0 et, reciproquement, cette relation entraıne g(t, x) = C,comme on le montre en appliquant (3.5.2). Ainsi, les courbes integrales de l’equation

(*) g′1(t, x) + g′2(t, x)x′(t) = 0

sont les courbes g(t, x) = C.Exemple. L’equation t+ xx′ = 0 a pour courbes integrales les cercles t2 + x2 = C.

(6.10.1) Considerons plus generalement une equation de la forme M(t, x) +N(t, x)x′(t) = 0,ou M et N sont de classe C(1) sur le domaine Ω ⊆ R2. L’equation est dite exacte si la formedifferentielle M(t, x)dt+N(t, x)dx est exacte, c’est-a-dire s’il existe une fonction g sur Ω telle queg′1 = M et g′2 = N . Dans ce cas, l’equation est de la forme (∗). Si c’est le cas, on sait que M ′

2 = N ′1,

car g′′1,2 = g′′2,1 d’apres (4.1.1).En general, on ne peut pas trouver une fonction γ : Ω → R telle que γ(t, x)M(t, x)dt +

γ(t, x)N(t, x)dx soit exacte. Cela sera la cas toutefois lorsque Ω est simplement connexe, c’est-a-dire tout arc dans Ω peut etre deformee de facon continue en tout autre arc dans Ω. Par exempleR2, un demi-plan ou un disque sont simplement connexes, mais R2 − (0, 0) ne l’est pas car uncercle contournant l’origine ne peut pas etre deformee en un cercle dont l’origine se trouve al’exterieur. Nous ne justifierons pas ces affirmations dans ce cours.

(6.10.2) Une equation de la forme g(t) + h(x)x′(t) = 0 est dite a variables separees. Lescourbes integrales sont de la forme G(t) +H(x) = C, G et H etant respectivement des primitivesde g et de h et C etant une constante.

40

Page 41: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

EXERCICES

(e6.1) Montrer qu’il n’y a aucune fonction derivable x : R → R telle que tx′(t) = 1 quelque soitt ∈ R. Resoudre l’equation differentielle tx′(t) = 1 sur un intervalle ouvert ne contenant pas 0.

(e6.2) Resoudre l’equation tx′ + x = 1 sur ]0,+∞[ et sur ] −∞, 0[ par la methode de (6.4). Pourquelles valeurs de α0 y-a-t-il une solution sur R qui satisfait x(0) = α0 ?

(e6.3) Resoudre par la methode de (6.4) l’equation x′ + 2tx = e−t2 sur R. Verifier que toutes lessolutions tendent vers 0 lorsque t → +∞.

(e6.4) L’equation de Bernoulli x′ + a0x = bxn est utilisee en economie. Ici, a0 et b sont desfonctions de t et n ∈ Z. Si n = 1, il s’agit d’une equation lineaire.

(i) On suppose n 6= 1. Montrer que si y est la fonction definie par x(t) = y(t)1

1−n , alors y verifie uneequation lineaire que l’on precisera.

(ii) Resoudre l’equation x′ + x = x2. Trouver les solutions d’equlibre. Y-a-t-il des solutions stables ?Tracer les courbes integrales.

(e6.5) Soit a1(t)x′(t) + a0(t)x(t) = 0 une equation differentielle lineaire homogene de degre un, oua1(t) 6= 0 pour tout t ∈ I. Soit A une primitive de a0

a1: A′(t) = a0(t)

a1(t)quelque soit t ∈ I. Montrer que si

l’on pose γ(t) = eA(t), alors γ(t)x′(t)+γ′(t)x(t) = 0 pour tout t ∈ I. En deduire que (γx)′(t) = 0 quelquesoit t ∈ I puis que x(t) = C

γ(t) quelque soit la t ∈ I, C etant une constante. En deduire que si x n’est pasidentiquement nulle, alors x ne s’annule pas sur I. Ce raisonnement justifie le calcul de (6.3.1).

(e6.6) Resoudre chacune des equations differentielles qui suivent. (Des nombres complexes de de-vraient pas figurer dans la reponse finale.)

(i) x′′(t) = 4x(t).(ii) x′′(t) = 4x′(t).(iii) x′′(t)− 2x′(t) + 5x(t) = 0.(iv) x′′′(t)− 3x′(t) + 2x(t) = 0.

(e6.7) (i) Decrire la solution generale sur R de l’equation x′′+2x′+2x = 0. (Des nombres complexesde devraient pas figurer dans la reponse finale.)

(ii) Trouve la solution generale de y′′ + 2y′ + 2y = 2.(iii) Resoudre l’equation z′′ + 2z′ + 2z = et.(iv) Dans chacun des cas (i), (ii) et (iii), trouver toutes les solutions qui tendent vers 0 lorsque

t → +∞.

(e6.8) Resoudre l’equation x′′ + 2x′ + x = e−t en utilisant la methode de variation de la constante.Verifier que toutes les solutions tendent vers 0 lorsque t → +∞.

(e6.9) Reprendre en utilisant la methode de variation de la constante l’equation de l’exercice (e6.3).

(e6.10) On considere l’equation lineaire homogene a coefficients constants (E) de (6.7) ainsi que sonpolynome caracteristique χE .

(i) Montrer que (E) a une solution constante non-nulle si et seulement si 0 est une racine de χE .(ii) On suppose que 0 ne soit pas racine de χE . Montrer que (E) est stable si et seulement si toutes

les racines de χE sont de partie reelle strictement negative.

(e6.11) On note I ⊆ R un intervalle ouvert. On considere l’equation differentielle

(E) t3x′′(t)− tx′(t) + x(t) = 0,

ou t ∈ I.(i) Verifier que la fonction x(t) = t est solution de l’equation (E), quelque soit le choix de l’intervalle

I.(ii) On suppose I ne contient pas 0. En cherchant une solution de la forme x(t) = u(t)t ou la fonction

u est a determiner, trouver la solution generale de (E) sur I.

41

Page 42: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

(iii) On suppose que 0 ∈ I. Verifier alors que si la fonction deux-fois derivable x verifie (E), alorsx(0) = 0. En deduire la solution generale de (E) sur I.

(e6.12) Trouver toutes les fonctions continues et bornees f : R → R verifiant f ′′(t) − f(t) = e−|t|

quelque soit t 6= 0.

(e6.13) On fixe a ∈ R. Resoudre l’equation differentielle

x′(t) = ex(t)

avec la condition initiale x(0) = a. Preciser en fonction de a le plus grand intervalle contenant 0 surlequel la solution x est definie.

(e6.14) Trouver les solutions d’equilibre de l’equation x′ = x3 − x. Resoudre l’equation, en faisantattention a l’intervalle d’etude. (Rappelons que 1/(x3−x) = x/(x2−1)−1/x pour tout x ∈ R−0,±1).

(e6.15) On considere l’equation differentielle x′(t) = ax(t), a etant une constante. Notons x : R → Rune solution.

(i) Montrer que x possede des derivees de tout ordre. (Raisonner par recurrence sur n et utilisant laformule x(n)(t) = limh→0

x(n−1)(t+h)−x(n−1)(t)h .)

(ii) Montrer que x(n)(t) = anx(t) pour tout n ∈ N et pour tout t ∈ R.Soit desormais α0 ∈ R et soit x une solution verifiant x(0) = α0.(iii) Soit n ∈ N. Montrer que pour tout t ∈ R on peut ecrire

x(t) = α0

n∑k=0

aktk

k!+ α0

an+1tn+1x(θt)(n + 1)!

,

ou θ ∈]0, 1[. (Utiliser la formule de Taylor-Lagrange.)(iv) En deduire que x(t) = α0e

at pour tout t ∈ R.

Theme 7. Systemes d’equations differentielles

(7.1) Un systeme d’equations differentielles est une famille d’equations differentielles

F1(t, x1, x2, . . . , xp, x′1, x

′2 . . . , x

(n)p ) = 0,

F2(t, x1, x2, . . . , xp, x′1, x

′2 . . . , x

(n)p ) = 0,

. . . . . . . . . . . . . . . . .

Fp(t, x1, x2, . . . , xp, x′1, x

′2 . . . , x

(n)p ) = 0.

Ici p ≥ 1 est un entier et il y a p equations dans les p fonctions x1, x2, . . ., xp de t ainsi que

leur derivees x′1, x′2, . . ., x

(n)p . Ce systeme est d’ordre n si les equations ne font intervenir que

les derivees d’ordre au plus n et la derivee d’ordre n d’au moins une des fonctions xk apparaıteffectivement dans au moins une des equations.

(7.1.1) Dans la suite, nous nous limiterons au cas des systemes d’ordre un de la forme

x′1 = f1(t, x1, . . . , xp),

x′2 = f2(t, x1, . . . , xp),

. . . . . . .

x′p = fp(t, x1, . . . , xp).

(∗)

42

Page 43: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

Afin de simplifier l’exposition, nous supposerons que toutes les fonctions fk : Rp+1 → R sont declasse C(1). Leur domaine de definition est alors de la forme I ×Ω, I etant un intervalle ouvert etΩ un domaine de Rp.

Nous allons enoncer un theoreme analogue a (6.1.2) concernant l’existence et d’unicite dessolutions d’un tel systeme.

(7.1.2) Theoreme. Soit I un intervalle ouvert et soit Ω un domaine dans Rp. Soit t0 ∈ I etsoit (a1, a2, . . . , ap) ∈ Ω. Soient fk (1 ≤ k ≤ p) p fonctions de classe C(1) de Ω dans R. Alors ilexiste un intervalle ouvert J ⊆ I contenant t0 et une unique fonction x = (x1, x2, . . . , xp) : Jp → Ωverifiant (∗) ainsi que les conditions initiales x1(t0) = a1, x2(t0) = a2, . . ., xp(t0) = ap.

Un resultat plus general sera demontre dans le theme 10 (theoreme de Cauchy-Lipschitz, letheoreme (10.4)).

(7.1.3) Le theoreme (6.1.2) se deduit de ce resultat de la maniere suivante. A l’equationx(n)(t) = f

(t, x(t), x′(t), . . . , x(n−1)(t)

)de (6.1.2) on associe le systeme

x′1(t) = x2(t),

x′2(t) = x3(t),

· · ·x′n−1(t) = xn(t)

x′n(t) = f(t, x1(t), x2(t), . . . , xn(t)

).

Le theoreme (7.1.2) prevoit alors l’existence d’un intervalle ouvert J ⊆ I contenant t0 ainsiqu’un unique systeme de solutions (x1, x2, . . . , xn) : Jn → Ω verifiant x1(t0) = α0, x2(t0) =α1, . . ., xn(t0) = αn−1. On verifie aussitot que la fonction x(t) = x1(t) verifie alors x(n)(t) =f(t, x(t), x′(t), . . . , x(n−1)(t)

)pour tout t ∈ J ainsi que x(t0) = α0, x

′(t0) = α1, . . ., x(n−1)(t0) =αn−1.

(7.2) Le systeme (∗) est dit lineaire si chacune des fonctions fk s’ecrit∑p

`=1 aklx` + bk, akl

et bk etant des fonctions connues de t sur un intervalle I. Ce systeme est homogene si bk = 0quelque soit k ∈ 1, 2, . . . , p. On utilise souvent la notation vectorielle

X ′(t) = A(t)X(t) +B(t) (ou X ′ = AX +B)

pour les systemes lineaires d’ordre un. Ici, A designe la matrice de fonctions (akl)1≤k,`,≤p, X levecteur t(x1, x2, . . . , xp), X

′ le vecteur t(x′1, x′2, . . . , x

′p) et B le vecteur t(b1, b2, . . . , bp).

(7.3) Proposition. Soit X ′ = AX +B un systeme lineaire.(i) Si B = 0 (c’est-a-dire si le systeme est homogene), alors les solutions forment un R-espace

vectoriel.(ii) Soit X0 une solution particuliere du systeme X ′ = AX +B. Alors toute solution est de la

forme X0 + Y avec Y une solution du systeme homogene associee Y ′ = AY .La demonstration est immediate.

(7.4) Soit x(n)+an−1x(n−1)+ · · ·+a0x = b une equation lineaire d’ordre n dont le coefficient de

x(n) est 1. Si l’on pose x0 = x, x1 = x′, . . ., xn = x(n), alors l’equation est equivalente au systeme

x′0 = x1

x′1 = x2

· · ·x′n−2 = xn−1

x′n−1 = −a0x0 −a1x1 −a2x2 − · · · −an−1xn−1 +b

43

Page 44: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

qui se resume en notation vectorielle X ′ = AX +B a l’aide de la matrice compagnon

A =

0 1 0 0 · · · 00 0 1 0 · · · 0...

......

.... . .

...0 0 0 0 · · · 1−a0 −a1 −a2 −a3 · · · −an−1

et B designe le vecteur t(0, 0, . . . , 0, b). Ainsi la notion de systeme differentielle d’ordre un generalisecelle d’equation lineaire d’ordre n.

(7.4.1) A toute solution X = t(x1, x2, . . . , xp) d’un systeme differentielle on peut associer lacourbe parametree t 7→

(x1(t), x2(t), . . . , xp(t)

)dans Rp, appelee courbe integrale. Les points

critiques du systeme, c’est-a-dire les solutions X avec X ′(t) = 0, sont les solutions constantesdu systeme et les courbes integrales correspondantes sont alors reduites a des points. Les solutionsX telles que X ′(t) = 0 sont appelees solutions d’equilibre. Une solution est dite stable si elleconverge vers une solution d’equilibre, et le systeme est dit stable si toutes les solutions convergentvers une solution d’equilibre (lorsque t→ +∞ par exemple).

(7.4.2) Proposition. Soit X ′ = AX +B un systeme lineaire dont la matrice A est constanteet inversible et B est constant. Alors il y a un unique equilibre, a savoir la solution X = −A−1B.

Demonstration. Il est clair que X = −A−1B est effectivement solution du systeme. Soitreciproquement X0 une solution constante. Alors Y0 = X0 + A−1B est solution du systeme ho-mogene associe Y ′ = AY . Alors Y ′

0 = 0 et donc AY0 = 0. Puisque A est inversible, on a bienY0 = 0 et donc X0 = −A−1B.

(7.5) Le cas d’un systeme lineaire d’ordre 2 est particulierement important. Notons alors lessolutions vectorielles par t(x, y) plutot que par t(x1, x2). Si par exemple on considere le systeme(

x′(t)y′(t)

)=

(0 −ωω 0

)(x(t)y(t)

),

ou ω 6= 0 est une constante, alors les solutions sont de la forme(x(t)y(t)

)= C

(cosωtsinωt

)+D

(sinωt− cosωt

),

C et D etant des constantes (voir l’exercice (e7.1)). Ainsi, x(t)2 + y(t)2 = C2 +D2 et les courbesintegrales sont les cercles centres a l’origine et de rayon quelconque. La seule solution d’equilibreest la solution x(t) = y(t) = 0 et les autres solutions ne convergent pas vers celle-ci lorsquet→ +∞. Il n’y a donc pas de stabilite.

(7.5.1) Considerons desormais le systeme(x′(t)y′(t)

)=

(0 −ωω 0

)(x(t)y(t)

)+

(11

),

ou encore ω 6= 0. Remarquons qu’il y a une solution d’equilibre(x(t)y(t)

)= −

(0 −ωω 0

)−1(11

)=

(0 − 1

ω1ω

0

)(11

)=

(− 1

ω1ω

).

44

Page 45: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

D’apres l’exemple precedent et la proposition (7.3), la solution generale est(x(t)y(t)

)= C

(cosωtsinωt

)+D

(sinωt− cosωt

)+

(− 1

ω1ω

).

Les courbes integrales sont encore des cercles, mais de centre(− 1

ω, 1

ω

).

(7.6) Un systeme d’equations de la forme

x′1 = f1(x1, x2, . . . , xp),

x′2 = f2(x1, x2, . . . , xp),

. . . . . . . . . .

x′p = f2(x1, x2, . . . , xp),

(ou la variable t n’apparaıt pas explicitement) est appele un systeme dynamique (ou systemeautonome). Les systemes lineaires a coefficients constants sont des systemes dynamiques. Anouveau, on note X = t(x1, x2, . . . , xp) un vecteur de solutions. Une solution d’equilibre(ou un equilibre) est une solution constante. Un equilibre verifie donc X ′(t) = 0, c’est-a-diref1(x1, x2, . . . , xp) = f2(x1, x2, . . . , xp) = · · · = fp(x1, x2, . . . , xp) = 0 et l’on determine les equilibresen resolvant ces equations.

Considerons par exemple un systeme dynamique a deux equations

x′ = f(x, y),

y′ = g(x, y).(†)

Si t0 est tel que x′(t0) 6= 0, on ay′(t0)

x′(t0)=g(x(t0), y(t0))

f(x(t0), y(t0)).

Sur un voisinage de x0 = x(t0), on peut alors ecrire y comme fonction de x et la fonction y estalors solution de l’equation differentielle

(1) f(x, y)dy

dx− g(x, y) = 0.

Ainsi, le systeme dynamique (†) permet d’obtenir une solution parametree de l’equation (1), cequi evite les problemes rencontres dans le theme precedent au points ou f(x, y) s’annule. Voir parexemple l’exercice (e7.8).

(7.7) Un systeme lineaireX ′ = AX+B a coefficients constants dont la matrice A est inversiblea un unique equilibre −A−1B d’apres la proposition (7.4.2).

Le comportement des solutions autour de l’equilibre peut alors alors etre determine en fonctiondes valeurs propres du polynome caracteristique de A. Dans ce qui suit, on se limite au cas dedeux equations en deux inconnus x, y. La matrice A est alors d’ordre 2.

(a) les racines du polynome caracteristique de A sont reelles.— (i) si elles sont strictement negatives, l’equation est stable et le point critique est un nœud

stable ;— (ii) si elles sont strictement positives, l’equation est instable car toutes les solutions non-

constantes sont non-bornees et le point critique est un nœud instable ;— (iii) si elles sont de signe contraire, l’equilibre est un point-selle ou col.

45

Page 46: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

nœud stable nœud instable point-selle

Ici, les croquis correspondent au cas ou les deux racines du polynome caracteristique sontdistinctes. Dans le cas d’une racine double, il n’y a qu’une seule droite passant par le pointcritique. Voir aussi l’exercice (e7.7).

(b) les racines du polynome caracteristique de A ne sont pas reelles. Il s’agit donc d’un couplede nombres complexes conjugues.

— (i) si leur partie reelle est strictement negative, les courbes integrales convergent vers lepoint d’equilibre en spiralant autour et l’equilibre est un foyer stable ;

— (ii) si leur partie reelle est strictement positive, les courbes integrales s’eloignent du pointd’equilibre en spiralant autour et l’equilibre est un foyer instable ;

— (iii) si elles sont imaginaires pures, les courbes integrales sont des cercles centres sur lepoint d’equilibre. Il s’agit alors d’un centre.

foyer stable foyer instable centre

(7.8) Considerons un systeme de deux equations en deux inconnus x′ = f(x, y), y′ = g(x, y).Nous supposons x, y definis sur un intervalle de la forme [t0,+∞[. Les equilibres sont donc lessolutions constantes xe, xe verifiant f(xe, ye) = 0 et g(xe, ye) = 0. On dit que l’equilibre (xe, ye)est stable si etant donne ε > 0, il existe δ > 0 tel que pour toute solution (x, y) verifiant||(x(t0), y(t0)

)− (xe, ye)|| ≤ δ, on ait ||

(x(t), y(t)

)− (xe, ye)|| ≤ ε pour tout t ≥ t0. On dit que

(xe, ye) est asymptotiquement stable s’il existe ε > 0 tel que pour toute solution (x, y) verifiant||(x(t0), y(t0)

)− (xe, ye)|| ≤ ε, on ait limt→+∞ (x(t), y(t)) = (xe, ye).

Un nœud stable et un foyer stables sont asymptotiquement stables. Un centre est stable maispas asymptotiquement stable. Dans tout autre cas, il y a instabilite. On pourrait penser qu’unequilibre asymptotiquement stable soit necessairement stable. En fait, ce n’est pas le cas, bienqu’il ne soit pas facile a en donner des exemples.

(7.8.1) Theoreme (de Hartman-Grobman). Soit x′ = f(x, y), y′ = g(x, y) un systeme dy-namique avec f , g de classe C(1) sur un domaine Ω de R2. Soit (xe, ye) ∈ Ω un equilibre. Onsuppose que les valeurs propres de la matrice jacobienne J(f,g)(xe, ye) ne soient pas imaginairespures ou nulles. Alors l’equilibre (xe, ye) du systeme de depart est de la meme nature (nœud stable,nœud instable, . . .) que celui du systeme linearise x′ = (x − xe)f

′1(xe, ye) + (y − ye)f

′2(xe, ye),

y′ = (x− xe)g′1(xe, ye) + (y − ye)g

′2(xe, ye).

Ce resultat sera admis. Remarquons le cas exclu ou les valeurs propres sont imaginaires puresou nulles. Ces cas sont exceptionnels ; si par exemple les valeurs propres sont imaginaires puresmais non-nulles, l’equilibre de l’equation de depart pourrait etre un centre ou un foyer stable ouinstable.

46

Page 47: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

(7.8.2) Exemple. Soit le systeme x′ = 2x+ y + xy, y′ = y + x2. Pour trouver les equilibres, ilfaut resoudre les equations 2x+y+xy = y+x2 = 0. Cela donne les trois equilibres (xe, ye) = (0, 0),(1,−1) et (−2,−4). La matrice jacobienne de (x, y) 7→ 2x+ y + xy, (x, y) 7→ y + x2 est

Jf,g(x, y) =

(2 + y 1 + x2x 1

).

On a donc Jf,g(0, 0) =

(2 10 1

)dont les racines du polynome caracteristique sont 1 et 2. L’equilibre

(0, 0) est donc un nœud instable. Ensuite, Jf,g(1,−1) =

(1 22 1

)et les racines du polynome ca-

racteristique t2−2t−3 sont reelles et de signes opposes. L’equilibre (1,−1) est donc un point-selle.

Enfin, Jf,g(−2,−4) =

(−2 −1−4 1

)et les racines du polynome caracteristique t2 + t− 6 sont a nou-

veau reelles et de signes opposes. D’ou un second point-selle.

EXERCICES

(e7.1) On reprend le systeme lineaire de (7.5). Verifier que x′′(t)+ω2x(t) = 0 et que y′′(t)+ω2y(t) = 0.En deduire que toute solution du systeme (∗) de (7.5) est de la forme indiquee (∗∗).

(e7.2) Resoudre le systeme (x′(t)y′(t)

)=(

1 10 1

)(x(t)y(t)

).

(Montrer d’abord que x′′ − 2x′ + x = 0.) Tracer les courbes integrales et discuter de la stabilite de lasolution x(t) = y(t) = 0.

(e7.3) Meme chose pour le systeme(x′(t)y′(t)

)=(

1 −11 1

)(x(t)y(t)

).

(Montrer d’abord que x′′ − 2x′ + 2x = 0.)

(e7.4) (i) Generaliser les trois exercices precedents en considerant le systeme

(*)(

x′(t)y′(t)

)=(

a bc d

)(x(t)y(t)

),

ou a, b, c et d sont des constantes. Montrer que x et y sont solutions de z′′ − (a + d)z′ + (ad− bc)z = 0.On note λ1, λ2 les deux racines du polynome caracterique λ2 − (a + d)λ + (ad − bc) de la matrice(

a bc d

).

(ii) On suppose λ1 6= λ2 sont reels. Montrer que si v1 et v2 designe des vecteurs propres de A

correspondant respectivement a λ1 et λ2. Montrer que(

x(t)y(t)

)= Aeλ1tv1 + Beλ2tv2 est solution, quelque

soit les constantes A et B.(iii) On suppose λ1 = β + iγ, λ2 = β − iγ avec γ 6= 0. Soit v un vecteur propre (complexe)

correspondant a λ1. On note v le vecteur dont les coefficients sont les conjugues complexes de v et onpose <(v) = (v + v)/2, =(v) = (v − v)/2i. Montrer que(

x(t)y(t)

)= eβt

(A((cos γt)<(v)− (sin γt)=(v)

)+ B

((cos γt)=(v) + (sin γt)<(v)

))

47

Page 48: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

est une solution (reelle), quelque soit les constantes A et B.(iv) On suppose λ1 = λ2 et que l’espace propre associe a λ1 est de dimension un. Montrer que si v

est un vecteur propre et si w est un vecteur tel que((a bc d

)− λ1

)w = v,

alors(

x(t)y(t)

)= (A + Bt)eλ1tv + Aeλ1tw est solution quelque soit les constantes A et B.

(v) Que se passe-t-il lorsque λ1 = λ2 et A est diagonalisable ?(vi) En admettant que l’espace vectoriel des solutions est toujours de dimension deux, montrer que

dans chacun des cas que le systeme (∗) n’a que les solutions indiquees.

(e7.5) Soit P (t) = t2 + at + b, a, b ∈ R un polynome unitaire de degre 2.(i) Montrer que les deux racines de P sont reelles et strictement negatives si et seulement si a2−4b > 0,

a > 0 et b > 0. (Si λ, µ sont les deux racines, penser aux formules λ + µ = −a, λµ = b.)(ii) Donner des conditions necessaires et suffisantes sur a et b pour que les deux racines de P soient

reelles et strictement positives ; reelles et de signes opposes ; non-reelles et a partie reelle strictementnegatives ; non-reelles et a partie reelle strictement positive ; imaginaires pures.

(e7.6) Resoudre le systeme(

x′(t)y′(t)

)=(

1 10 1

)(x(t)y(t)

)+(

11

). Chercher les equilibres. Etudier la

stabilite.

(e7.7) Etendre les considerations de l’exercice (e7.4) aux systemes inhomogenes X ′ = AX + B, ou

A =(

a bc d

), B est un vecteur constant.

(e7.8) Reprenons le systeme lineaire de (7.5). Comparer ce systeme avec l’equation y d yd x +x = 0 (voir

l’equation (1) de (7.6)). Dans le premier cas, les courbes integrales sont des cercles centres a l’origine.Que se passe-t-il dans le second cas ?

(e7.9) Etudier les systemes dynamiques

(i)(

x′

y′

)=(

12x2 − 1

2y12 −

12y

),

et

(ii)(

x′

y′

)=(

1− ey

5x− y

).

Dans chacun des deux cas, chercher les equilibres et determiner leur nature en utiliant le theoremede Hartman-Grobman.

(e7.10) On considere le systeme lineaire d’equations differentielles

x′(t) = x(t) + y(t)y′(t) = 2x(t).

(i) Trouver la solution generale de ce systeme.(ii) Trouver l’unique solution (x, y) verifiant x(0) = 1, y(0) = 0.(iii) Decrire l’ensemble des solutions (x, y) verifiant x(t) → 0 lorsque t → +∞.(iv) Calculer limt→+∞ y(t) lorsque (x, y) est l’une des solutions verifiant la condition de la question

(iii).(v) Determiner la nature du point d’equilibre (0, 0) du systeme autonome

x′(t) = x(t) + y(t) + x(t)2

y′(t) = 2x(t) + y(t)2.

48

Page 49: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

Theme 8. Solutions periodiques, cycles limites

(8.1) Dans ce theme, nous continuerons l’etude d’un systeme dynamique de 2 equations

(*) x′ = f(x, y), y′ = g(x, y),

ou x′, y′ designent les derivees de x et de y par rapport a t ∈ R. Le theoreme de Hartman-Grobmandonne des renseignements locaux au voisinage d’un equilibre. Le theoreme de Cauchy-Lipschitz(10.4) justifie l’existence de solutions. Ici, nous indiquons comment obtenir des renseignementsglobaux sur les solutions, sans que l’on puisse, en general, les decrire a l’aide de formules simples.

(8.2) Proposition. Deux courbes integrales distinctes ne se coupent pas.Demonstration. En effet, si deux courbes se coupaient en un point (a, b), l’une des courbes C1

representerait la solution (x1, y1) du systeme verifiant x1(t1) = a et y1(t1) = b, alors que l’autrecourbe C2 representerait la solution (x2, y2) du systeme verifiant x2(t2) = a et y2(t2) = b. Posonsu = t+ t1− t2, de sorte que dx

du= dx

dtet dy

du= dy

dt. Puisque f et g ne dependent pas explicitement de

t, la courbe u 7→ (x2(u), y2(u)) est egalement une courbe integrale verifiant x2(t1) = a, y2(t1) = b.L’unicite de la solution garantie par le theoreme de Cauchy-Lipschitz implique donc que x2 = x1

et y2 = y1.Le meme argument montre egalement que la meme courbe integrale ne peut pas se couper en

un point. S’il existe t1, t2, tels que t1 6= t2 et x(t1) = x(t2) et y(t1) = y(t2), la courbe effectue uneboucle.

Soit I un intervalle, soit E un ensemble et soit f : I → E une application. soit T ∈ R. Ondit que T est une periode de f si f(t + T ) = f(t) quelque soit t ∈ I tel que t + T ∈ I. f est diteperiodique lorsque elle possede une periode non-nulle. Il est clair que si T est une periode, alors ilen est de meme pour −T . Par consequent, une fonction periodique possede toujours une periodestrictement positive.

(8.2.1) Proposition. Une courbe integrale du systeme dynamique (∗) qui est fermee en bouclecorrespond a une solution periodique.

Demonstration. Si t 7→(x(t), y(t)

)est une solution de periode T > 0, alors

(x(t+T ), y(t+T )

)=(

x(t), y(t))

pour tout t et donc la courbe est en boucle.Supposons reciproquement que la courbe integrale soit une boucle. Si la boucle se reduit a un

seul point, la solution est constante, d’ou un pont critique. Dans le cas contraire, le theoreme deCauchy-Lipschitz montre qu’elle ne passe pas par un point critique. Alors il existe t0 et T > 0tels que

(x(t0), y(t0)

)=(x(t0 + T ), y(t0 + T )

). A priori, x et y ne sont definies que sur l’intervalle

[t0, T ] mais, d’apres le theoreme de Cauchy-Lipschitz applique a t = t0 puis a t = t0 + T , il existeun intervalle ouvert I contenant [t0, t0 + T ] et une unique solution de (∗) sur I qui coıncide avec(x, y) sur [t0, T ]. On suppose l’intervalle I maximal pour cette propriete. Designons alors doncencore cette solution par (x, y). En raison de l’unicite de la solution, il existe un intervalle ouvertJ ⊆ I contenant t0 et une fonction φ : J → I tels que φ(t0) = T et

(x(φ(t)), y(φ(t)

)=(x(t), y(t)

)pour tout t ∈ J . Mais

x′(t) = f(x(t), y(t) = f(x(φ(t)), y(φ(t))

)= x′(φ(t)) = x′(t)φ′(t)

49

Page 50: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

et, par un argument semblable, y′(t) = y′(t)φ′(t). Puisque(x(t), y(t)

)est regulier, on en tire que

φ′(t) = 1. Puisque φ(t0) = t0 + T , on voit que φ(t) = t + T et(x(t), y(t)

)=(x(t + T ), y(t + T )

)pour tout t ∈ J .

Remarque. La fonction t 7→(cos t3, sin t3

)parametre le cercle de centre (0, 0) et de rayon un

mais n’est pas periodique. On en tire qu’elle ne peut etre solution d’un systeme dynamique de laforme (∗). Cette remarque montre que ce n’est pas seulement l’allure de la courbe qui comptemais egalement le parametrage utilise.

(8.3) Soit (x0, y0) un point regulier du systeme (∗), c’est-a-dire(f(x0, y0), g(x0, y0)

)6= (0, 0).

S’il y a une solution (x, y) de (∗) passant par (x0, y0), alors il existe t0 tel que x0 = x(t0),y0 = y(t0) et

(f(x0, y0), g(x0, y0)

)=(x′(t0), y

′(t0))

est un vecteur tangent a la courbe integralea (x0, y0). Autrement dit, on connait la tangente a la courbe integrale au point (x0, y0) sansconnaıtre t0. Cela permet souvent de se donner une idee de l’allure des courbes integrales sans enconnaıtre une parametrisation precise. Par definition, le champ de vecteur associe au systemeest l’application qui associe a tout point (x, y) du domaine de definition de (f, g) le vecteur(x′, y′) =

(f(x, y), g(x, y)

).

Il est utile de savoir effectuer un croquis donnant l’allure du champ de vecteur. Pour cela,on determine les regions ou x′ > 0, x′ < 0, y′ > 0, y′ < 0 a l’aide des relations x′ = f(x, y),y′ = g(x, y). On note les points critiques (equilibres). En dehors de ceux-ci, la courbe monte versle haut si y′ > 0, descend vers le bas si y′ < 0, tend vers la droite si x′ > 0 et tend vers la gauchesi x′ < 0. La tangente est verticale si x′ = 0 mais y′ 6= 0 ; elle est horizontale si y′ = 0 mais x′ 6= 0.

La taille de x′(t) et de y′(t) permet souvent de se donner une idee de la rapidite du deplacementdu point

(x(t), y(t)

)en fonction de t. Supposons par exemple que x, y soient de classe C(2). Alors

x′′ et y′′ se calculent en fonction de f(x, y), g(x, y) et de ses derivees partielles d’ordre un, et sontdonc connues. Mais

x(t+ h) = x(t) + hx′(t) +h2

2x′′(t+ θ1h), y(t+ h) = y(t) + hy′(t) +

h2

2y′′(t+ θ2h)

avec 0 < θ1, θ2 < 1. Si donc x′′ et y′′ sont bornees par M > 0 dans une certaine region, alors

∣∣x(t+ h)− x(t)− x′(t)h∣∣ ≤M

h2

2,

∣∣y(t+ h)− y(t)− y′(t)h∣∣ ≤M

h2

2

dans cette region.

Exemple. Soit le systeme x′ = 1− xy, y′ = x. La figure represente le champ de vecteur et lesfleches indiquent le sens d’augmentation du parametre t. Il n’y a pas d’equilibre. La tangente estverticale sur les deux branches de l’hyperbole (x, y) ∈ R2 | xy = 1. Elle est horizontale sur l’axex = 0. Ces courbes decoupent egalement le plan en regions suivant le signe de x′ et de y′.

50

Page 51: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

-5 -2,5 0 2,5 5

-3

-2

-1

1

2

3

L’illustration montre les axes et la courbe y = 1/x ou le champ est vertical.

(8.4) L’utilisation de coordonnees polaires permet parfois de simplifier l’etude d’un sy-steme. Rappelons que etant donne (x, y) 6= (0, 0), il existe r > 0 et θ ∈ R tels que x = r cos θ,y = r sin θ. Ici, r est unique et θ est uniquement determine a un multiple entier de 2π pres. Si x,y sont des fonctions de t, on trouve

(†) x′(t) = r′(t) cos(θ(t)

)− r(t)θ′(t) sin

(θ(t)

), y′(t) = r′(t) sin

(θ(t)

)+ r(t)θ′(t) cos

(θ(t)

).

En derivant x(t)2 + y(t)2 = r(t)2, on trouve x(t)x′(t) + y(t)y′(t) = r(t)r′(t). En multipliant lepremier membre de (†) par y(t) = r(t) sin

(θ(t)

), le second par x(t) = cos

(θ(t)

)et en soustrayant,

on trouve

(† †) x′(t)y(t)− x(t)y′(t) = −r(t)2θ′(t).

(8.4.1) Exemples. (i) On peut utilser les coordonnees polaires pour affiner son idee de l’alluredu champ de vecteur. Le signe de la derivee r′ de r indique si une courbe integrale s’approche ous’eloigne de l’origine. Lorsque r 6= 0, r′ est du meme signe que rr′. Reprenons alors l’exemple de(8.3). On a rr′ = xx′ + yy′ = x− x2y+ xy = x(1− xy+ x). La courbe integrale passant par (x, y)s’eloigne de l’origine lorsque x et 1−xy+x ont le meme signe et l’approche lorsque les deux signessont opposes.

(ii) Soit le systeme

(1) x′ = x+ y − x(x2 + y2), y′ = −x+ y − y(x2 + y2)

avec t ∈ [0,+∞[. Le seul equilibre est (0, 0) ce qui est un foyer instable. Le solutions avec(x(0), y(0)

)proche de l’origine s’en eloignent en spiralant autour. Mais, nous allons voir que

les solutions avec(x(0), y(0)

)tres eloigne de l’origine s’en approchent en spiralant autour.

Si l’on multiplie le premier membre du systeme par x et le second par y on trouve, en prenantla somme

xx′ + yy′ = (1− x2 − y2)(x2 + y2).

Or, x2 + y2 = r2 et xx′ + yy′ = rr′ et donc rr′ = (1− r2)r2 puis

(2) r′ = (1− r2)r.

51

Page 52: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

On en tire que r′ > 0 si r ∈]0, 1[ et r′ < 0 si r > 1. Par consequent, les courbes integraless’approchent a l’origine si r > 1 et s’en eloignent si r < 1. Remarquons que r = 1 est l’uniquesolution constante de (2).

Afin de trouver une equation faisant intervenir θ, on voit, d’apres (1), que x′y−xy′ = x2+y2 =r2. En appliquant († †), on en deduit que

(3) θ′(t) = −1.

Cette equation a pour solution θ(t) = θ(0)− t ce qui montre que toute solution spirale autour del’origine. En prenant r = 1, on tire que le cercle de centre l’origine et de rayon un est une courbeintegrale du systeme (1). Mais on peut integrer l’equation (2), en distinguant les cas r ∈]0, 1[ etr > 1. D’abord dans les deux cas, on a 1

r(1−r2)= 1

r+ r

1−r2 et donc

r′

r+

rr′

1− r2= 1.

Si 0 < r < 1, on en tire que log r − 12log(1− r2) = t +D, D constante, puis r√

1−r2 = Ket ou

K = r(0)√1−r(0)2

> 0 est une constante. Il s’ensuit que r = 1√1+K−1e−2t .

Si r > 1, on a r′

r− rr′

r2−1= 1 puis log r − 1

2log(r2 − 1) = t +D ce qui conduit a r√

r2−1= Ket

ou K = r(0)√r(0)2−1

est un constante > 1. On trouve alors r = 1√1−K−1e−2t .

L’ensemble des solutions peuvent donc etre resume sous la forme r(t) = 1√1+Ce−2t avec C ≥ −1

une constante, On a C ∈] − 1, 0[ lorsque r(0) ∈]0, 1[, C = 0 lorsque r(0) = 1 et C > 0 lorsquer(0) > 1.

La solution r(t) = 1, θ(t) = θ(0) − t conduit a la solution periodique x(t) = cos (θ(0)− t),y(t) = sin (θ(0)− t) du systeme (1). On appelle une telle solution periodique (ou plutot la courbeintegrale correspondante) un cycle limite. Dans le present cas, il s’agit d’un cycle limite stable,car les autres solutions non-nulles du systeme convergent vers celle-ci lorsque t→ +∞.

(8.5) L’equation de van de Pol

x′′ − µ(1− x2)x′ + x = 0, µ > 0 constante,

est un autre exemple d’une equation differentielle possedant un cycle limite stable. Notons quel’equation linearisee x′′ − µx′ + x = 0 n’en possede pas, car µ > 0 par hypothese et a nouveaul’unique equilibre est x = 0. L’equation de van der Pol est equivalente au systeme

x′ = y, y′ = −x+ µ(1− x2)y.

D’apres le theoreme de Hartman-Grobman, l’equilibre (0, 0) est un foyer instable si µ < 2, unnœud instable si µ ≥ 2.

Cherchons l’allure du champ de vecteur. Si (x, y) est solution du systeme, alors (−x,−y) enest une aussi, et le champ de vecteur est donc symetrique par rapport a l’origine. Les tangentessont verticales sur l’axe y = 0 et horizontales sur la courbe y = x

µ(1−x2). Ces courbes decoupent

le plan en zones selon le signe de x′ et de y′. Il est egalement utile de savoir si les courbesintegrales s’approchent ou s’eloignent de l’origine. Pour cela, on utilise les coordonnees polaires.On a rr′ = xx′ + yy′ = µ(1 − x2)y2. Puisque µ > 0 et r > 0, le signe de r′ est celui de 1 − x2.Ainsi, les courbes integrales s’eloignent de l’origine si |x| < 1 et s’en approchent si |x| > 1.

Le croquis indique la situation lorsque µ = 1.Soit (x, y) une courbe integrale dont la position initiale

(x(0), y(0)

)est situee dans le disque

centre a l’origine et de rayon un. Dans un premier temps au moins, la courbe tourne autour de

52

Page 53: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

l’origine et s’eloignant, car |x(0)| < 1. Par contre, si (x, y) est une solution avec(x(0), y(0)

)dans

la zone x < −1 et y > xµ(1−x2)

en haut a gauche, alors y(0) > y0 := x(0)µ(1−x(0)2

, et

x(t)− x(0) =

∫ t

0

x′(u)du =

∫ t

0

y(u)du ≥ y0

∫ t

0

du = y0t

pourvu que y(u) ≥ y0 pour tout u ∈ [0, t]. Or, la courbe integrale descend d’abord vers la droite,mais coupe la branche de y = x

µ(1−x2)a gauche en haut en un point (x1, y1) avec y1 > y0 car la

fonction x 7→ xµ(1−x2)

est croissante. Ensuite, le flot remonte jusqu’ a l’intersection avec la branche

de y = xµ(1−x2)

passant par l’origine. La condition y(u) ≥ y0 est donc encore verifiee et la courbepasse donc forcement dans la region en haut a droite ou y′ < 0 et x > 1. Ici, elle s’approche al’origine en descendant vers le bas. Puis, elle tourne autour de l’origine dans le sens des aiguillesd’une montre.

Puisqu’une courbe integrale ne se coupe pas, elle tourne autour de l’origine en spirale enl’approchant. Puisque deux courbes integrales distinctes ne se coupent pas, les courbes integralesdont le point initial est situe dans le disque centre a l’origine et de rayon un sont bornees par lescourbes s’approchant de l’exterieur.

Cette situation suggere l’existence d’une solution periodique. On peut effectivement demontrerque toutes les solutions non-nulles convergent vers un unique cycle limite qui est lui meme unecourbe integrale de l’equation. Pour le faire, on note λ1, λ2,. . ., la suite des abcisses des pointssuccessives d’intersection avec la partie de l’axe Oy ou x > 0 d’une solution non-nulle du systeme.On montre que la suite (λn) est croissante ou decroissante, et convergente vers une limite λ qui nedepend pas de la solution choisie. Ensuite, on montre que la solution (x, y) avec x(0) = 0, y(0) = λrepond au probleme.

L’illustration montre la courbe y = x/(1 − x2) ou le champ est vertical ainsi que la courbeintegrale commencant au point (1, 0).

-2,5 0 2,5 5

-3

-2

-1

1

2

3

EXERCICES

(e8.1) Calculer les derivees secondes x′′, y′′, lorsque x, y verifient le systeme x′ = f(x, y), y′ = g(x, y).On suppose f et g de classe C(1).

53

Page 54: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

(e8.2) Chercher l’allure du champ de vecteur du systeme de l’exemple (8.4.1) (ii) (sans utiliser lessolutions indiquees dans le texte !).

(e8.3) Montrer que si x′ = f(x, y), y′ = g(x, y) est un systeme dynamique, et si x = r cos θ, y = r sin θsont les coordonnees polaires, alors

r′ = f(r cos θ, r sin θ) cos θ + g(r cos θ, r sin θ) sin θ, etrθ′ = −f(r cos θ, r sin θ) sin θ + g(r cos θ, r sin θ) cos θ.

(e8.4) Resoudre le systeme x′ = x(x2 + y2), y′ = y(x2 + y2) en utilisant les coordonnees polaires.Decrire les courbes integrales. On remarquera qu’il n’y a pas de solution parametree par R, ni memepar un intervalle de la forme [a,+∞[. Ceci justifie la remarque suivant l’enonce du theoreme de Cauchy-Lipschitz (10.4).

(e8.5) Soit a > 0 une constante. Montrer que le systeme

x′ = y +x√

x2 + y2(x2 + y2 − a2)

y′ = −x +y√

x2 + y2(x2 + y2 − a2)

a une unique solution periodique non-nulle, et que le cycle limite correspondant est instable.

(e8.6) Dans cet exercice, on etablit l’existence de solutions periodiques du systeme differentiel

x′(t) = x(t)2 − y(t),y′(t) = x(t)− y(t)2.

(S)

(i) Montrer que le systeme (S) possede deux solutions constantes que l’on precisera. (On ne demandepas d’etude de leur stabilite.)

On note r, θ les coordonnees polaires, de sorte que x(t) = r(t) cos θ(t) et y(t) = r(t) sin θ(t).(ii) Montrer que si t 7→

(x(t), y(t)

)est une solution de (S), alors

r′(t) = r(t)2(cos3 θ(t)− sin3 θ(t))

et queθ′(t) = 1− r(t)(cos θ(t) sin θ(t))(cos θ(t) + sin θ(t))

pourvu que r(t) 6= 0.(iii) En deduire que si Π designe le demi plan (x, y) ∈ R2 | y > x, alors r′(t) < 0 lorsque

(x(t), y(t)) ∈ Π.On note α un reel verifiant 0 < α < 1 et (xα, yα) l’unique solution de (S) verifiant x(0) = y(0) = α.

On note rα et θα les coordonnees polaires de (xα, yα) et Cα la courbe integrale correspondante. Lorsquet ∈ R, on note Cα(t) le point de Cα d’affixe (xα(t), yα(t)).

(iv) Calculer rα(0), θα(0), r′α(0) et θ′α(0). En deduire qu’il existe T > 0 tel que Cα(t) ∈ Π pour toutt ∈]0, T [.

(v) Montrer que θ′α(t) ≥ 1 − α puis que θα(t) ≥ t(1 − α) + π/4 quelque soit t ∈]0, T [. En deduirequ’il existe t0 ∈]0, π/(1 − α)] tel que θα(t0) = 5π/4. (On pourra utiliser sans demonstration l’inegalitecos θ sin θ(cos θ + sin θ) ≤ 1/

√2 qui est valable quelque soit θ ∈ R.)

(vi) Montrer que si t 7→(x(t), y(t)

)est solution de (S), alors t 7→

(y(−t), x(−t)

)est encore solution de

(S). En deduire que les courbes integrales de (S) sont symetriques par rapport a la premiere bissectrice.(vii) En conclure que Cα tourne en boucle autour de l’origine, puis que la solution t 7→

(xα(t), yα(t)

)est periodique.

(e8.7) On propose etudier le systeme x′ = y, y′ = −x + x3. L’equation d’ordre deux associee x′′ +x − x3 = 0 est un cas particuler de l’equation de Duffing x′′ + ω2x + εx3 = 0. On pose x = r cos θ,y = r cos θ comme d’habitude.

54

Page 55: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

(i) Verifier que le systeme possede trois points critiques (equilibres) et determiner leur nature a l’aidedu theoreme de Hartman-Grobman.

(ii) Verifier que si t 7→ (x(t), y(t)) est une solution du systeme alors t 7→ (−x(t),−y(t)) en estegalement une.

(iii) Dans le diagramme des phases, comparer lex vecteurs aux points (x, y), (−x, y), (x,−y) et(−x,−y).

(iv) En deduire que toute courbe integrale traversant l’axe y = 0 est symetrique par rapport a l’axeen question et que toute courbe integrale traversant l’axe x = 0 est symetrique par rapport a cet axe.

(v) Etudier les signes de x′ et de y′ selon la position de point (x, y). Verifier que rr′ = x3y puisdeterminer si la courbe integrale passant par (x, y) s’approche ou s’eloigne de l’origine. Faire un croquisde l’allure du champ de vecteur.

(vi) Soit α ∈]0, 1[. Verifier que la courbe integrale passant par (α, 0) descend puis tourne a gauchepuis coupe l’axe x = 0. En utilisant les symetries des questions precedentes, montrer que le courbeintegrale en question effectue une boucle autour de l’origine dans le sens des aiguilles d’une montre.

(vii) Verifier que le systeme possede egalement des courbes integrales non-bornees.

Theme 9. Calcul des variations

(9.1) L’objet du calcul des variations est la recherche des extremums d’integrales de cer-taines familles de fonctions assujetties, en general a des contraintes. Un probleme simple, auquelnous avons deja fait allusion dans l’Introduction (0.1.4) est le suivant. Soient a, b, α, β quatrereels avec a < b et soit Υ l’ensemble des fonctions f : [a, b] → R de classe C(2) telles que f(a) = αet f(b) = β. Pour tout f ∈ Υ, on pose

L(f) =

∫ b

a

√1 + f ′(t)2dt.

Il est clair que L(f) est un nombre reel strictement positif. Le probleme est de trouver f0 ∈ Υ telque L(f) ≥ L(f0) pour tout f ∈ Υ, si une telle fonction existe.

(9.1.1) La premiere etape dans l’etude du probleme est de chercher des conditions necessairessur la fonction f0. Soit H le R-espace vectoriel de fonctions h : [a, b] → R de classe C(2) de verifianth(a) = h(b) = 0, de sorte que toute fonction de Υ soit de la forme f0 + h avec h ∈ H. Si l’onsuivait a la lettre l’etude des extremums d’une fonction a valeurs reelles sur un domaine de Rp, onchercherait des « fonctions critiques » f0 ∈ Υ analogues aux points critiques. Mais, en l’absenced’une definition simple de fonction critique, nous adoptons une autre strategie.

Fixons donc h ∈ H et considerons la fonction Φh : R → R definie par

Φh(ε) = L(f + εh) =

∫ b

a

√1 + (f ′(t) + εh′(t))2dt.

On remarque que f0 + εh ∈ Υ quelque soit la valeur de ε. Si f0 est un minimum de L, alors 0 estun minimum de Φh et, par consequent, Φ′

h(0) = 0. Or,

Φ′h(ε) =

∫ b

a

(f ′0(t) + εh′(t)

)h′(t)√

1 + (f ′0(t) + εh′(t))2dt,

d’ou, en particulier,

Φ′h(0) =

∫ b

a

f ′0(t)h′(t)√

1 + f ′0(t)2dt.

55

Page 56: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

Puisque f0 et h sont supposees de classe C(2), on peut integrer par parties :

Φ′h(0) =

∫ b

a

f ′0(t)h′(t)√

1 + f ′0(t)2dt =

∫ b

a

f ′′0 (t)h(t)

(1 + f ′0(t)2)3/2

dt.

En faisant varier h ∈ H, on en tire que∫ b

a

f ′′0 (t)h(t)

(1 + f ′0(t)2)3/2

dt = 0

quelque soit la fonction h ∈ H. D’apres le lemme (9.2.1) qui nous allons demontrer, on en deduit

quef ′′0 (t)

(1+f ′0(t)2)3/2 = 0. Cette equation entraıne que f ′′0 (t) = 0 et donc qu’il existe des constantes C

et D telles que f0(t) = Ct+D. Les valeurs de C et de D sont alors determinees par les conditionsf0(a) = α et f0(b) = β et on trouve au final que f0(t) = β−α

b−a(t− a) + α.

La fonction f0 represente le segment droit passant de (a, α) a (b, β), comme l’intuition suggere.Si l’on suit la strategie d’etude des extremums des fonctions a valeurs reelles sur un domaine deRp, la prochaine etape serait de determiner s’il s’agit d’un minimum local. Il est facile de montrerque, quelque soit h ∈ H avec h 6= 0, la fonction ε 7→ Φh(ε) a un minimum en ε = 0. Pour cela, ilsuffit de constater que Φ′′

h(0) > 0, ce qui se fait en derivant la formule pour Φ′h(ε). On trouve

Φ′′h(0) =

∫ b

a

h′(t)2(1 + (f ′0(t)

2)3/2

dt,

ce qui est strictement positive lorsque h ∈ H et h 6= 0 (voir l’exercice (e9.1)).

(9.1.2) Mais l’argument que nous venons de donner ne suffit pas pour demontrer que f0 est unminimum local de L, dans le sens qu’il existe un voisinage V de f0 tel que L(f) > L(f0) pour toutf ∈ V . La difficulte provient, essentiellement, du fait que l’espace vectoriel H est de dimensioninfinie (car il contient, par exemple, la famille libre de fonctions t 7→ (t−a)r(b−t) | r ∈ N). Nousavons deja fait allusion (2.4) au fait que, dans un espace vectoriel norme de dimension infinie, lesboules fermees ne sont pas compactes. Ce resultat empeche la generalisation simple du theoreme(4.6.1) aux espaces de dimension infinie. Nous nous contenterons donc par la suite d’adapter lesarguments de (9.1.1) a un cadre plus general, sans chercher a approfondir cette difficulte.

(9.2) Rappelons d’abord pour memoire deux resultats bien connus utilises dans ce raisonne-ment.

(i) Si g, h : [a, b] → R sont deux fonctions de classe C(1), on a la formule d’integration parparties ∫ b

a

g(t)h′(t)dt = g(b)h(b)− g(a)h(a)−∫ b

a

g′(t)h(t)dt.

(ii) Si I est un intervalle ouvert et si F : [a, b]× I → R est une application de classe C(1), alors

la fonction Φ : I → R definie par Φ(ε) =∫ b

aF (t, ε)dt est derivable et sa derivee est

Φ′(ε) =

∫ b

a

F ′2(t, ε)dt.

Le lemme qui suit et ses variants sont d’une importance centrale dans le calcul des variations.

(9.2.1) Lemme. Soit f : [a, b] → R continue. On suppose que, pour toute fonction h : [a, b] →R de classe C(2) verifiant h(a) = h(b) = 0, on ait

∫ b

af(t)h(t)dt = 0. Alors f(t) = 0 pour tout

t ∈ [a, b].

56

Page 57: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

Demonstration. Puisque f est continue, il suffit de montrer f(t) = 0 lorsque t ∈]a, b[. Supposonspour une contradiction qu’il existe t0 ∈]a, b[ tel que f(t0) 6= 0. Supposons alors que f(t0) > 0,le cas ou f(t0) < 0 se traite de la meme facon. Soit δ > 0 tel que δ < max(b − t0, t0 − a) ettel que f(t) ≥ 1

2f(t0) quelque soit t ∈ [t0 − δ, t0 + δ]. Soit h0 : [a, b] → R la fonction definie par

h0(t) = (t− t0−δ)4(t− t0 +δ)4 lorsque t ∈ [t0−δ, t0 +δ] et h0(t) = 0 ailleurs. Alors h0 est de classeC(2) et h0(a) = h0(b) = 0. En outre h0(t) ≥ 0 pour tout t et h0(t) > 0 lorsque t ∈]t0 − δ, t0 + δ[.Par consequent, ∫ b

a

f(t)h0(t)dt =

∫ t0+δ

t0−δ

f(t)h0(t)dt ≥f(t0)

2

∫ t0+δ

t0−δ

h0(t)dt > 0,

une contradiction.Remarque. Afin d’effectuer l’integration par parties dans (9.1.1), nous avons suppose que f0

soit de classe C(2). Une variante du lemme (9.2.1), appele lemme de Du Bois-Reymond permet demontrer que tout extremum local f0 de classe C(1) est necessairement de classe C(2). Les autres casque nous allons etudier dans cette theme se generalisent de la meme maniere.

(9.3) Le raisonnement utilise dans (9.1.1) pour chercher une condition necessaire pour quef0 soit un extremum local se generalise facilement. Supposons par exemple que l’on cherche lesextremums de

L(f) :=

∫ b

a

F(t, f(t), f ′(t)

)dt,

ou F est une fonction connue de classe C(2) et f parcourt les fonctions [a, b] → R de classe C(2)

verifiant f(a) = α, f(b) = β. Si f0 est une fonction repondant au probleme, alors pour toutefonction h : [a, b] → R de classe C(2) telle que h(a) = h(b) = 0, la fonction Φh : R → R definie par

Φh(ε) =

∫ b

a

F(t, f0(t) + εh(t), f ′0(t) + εh′(t)

)dt

verifie Φ′h(0) = 0, soit∫ b

a

(F ′

2

(t, f0(t), f

′0(t))h(t) + F ′

3

(t, f0(t), f

′0(t))h′(t)

)dt = 0.

Si l’on suppose que F et f0 soient de classe C(2), on peut integrer par parties le terme∫ b

a

F ′3

(t, f0(t), f

′0(t))h′(t)dt

ce qui donne

(∗)∫ b

a

(F ′

2

(t, f0(t), f

′0(t))− d

dtF ′

3

(t, f0(t), f

′0(t)))h(t)dt = 0.

Puisque (∗) doit etre valable quelque soit la fonction h, on tire le resultat suivant en appliquantle lemme (9.2.1).

(9.3.1) Theoreme. Si f0 est un extremum de classe C(2) de f 7→ L(f), alors f0 satisfait al’ equation d’Euler

F ′2(t, f0, f

′0)−

d

dtF ′

3(t, f0, f′0) = 0.

57

Page 58: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

D’apres ce qui precede, il s’agit d’une equation differentielle d’ordre au plus deux et non-lineaireen general.

(9.3.2) On dit que L a un maximum local faible en f0 si, quelque soit h ∈ H, il existe unintervalle ouvert I contenant 0 tel que L(f0 +εh) ≤ L(f0) pour tout ε ∈ I. La notion de minimumlocal faible est definie de la meme facon. On peut chercher si f0 correspond a un maximum ou unminimum local faible en etudiant le signe de Φ′′

h(0). Si Φ′′h(0) > 0 quelque soit h 6= 0 il s’agit d’un

minimum et si Φ′′h(0) < 0 quelque soit h 6= 0 il s’agit d’un maximum. Pour en deduire un critere

explicite, on calcule

Φ′′h(0) =

=

∫ b

a

(F ′′

2,2

(t, f0(t), f

′0(t))h(t)2 + 2F ′′

2,3

(t, f0(t), f

′0(t))h(t)h′(t) + F ′′

3,3((t, f0(t), f

′0(t))h′(t)2

)dt,

D’ou un critere dependant de la forme quadratique associee a la matrice hessienne de F parrapport aux deuxieme et troisieme variables :

(9.3.3) Proposition. Soit qt la forme quadratique associee a la matrice(F ′′

2,2(t) F ′′2,3(t)

F ′′2,3(t) F ′′

3,3(t)

).

Si qt est definie positive quelque soit t ∈ [a, b], alors f0 represente un minimum local faible,alors que si qt est definie negative quelque soit t ∈ [a, b], alors f0 represente un maximum localfaible.

(9.4) Ces considerations se generalisent aux extremums d’integrales de la forme

(∗∗) L(f, g) =

∫ b

a

F (t, f, f ′, g, g′)dt,

ou les fonctions inconnues f et g verifient f(a) = α1, f(b) = β1, g(a) = α2, g(b) = β2.On se donne deux fonctions h, k verifiant h(a) = k(a) = h(b) = k(b) = 0 et on considere la

fonction Φ : R2 → R definie par

Φ(ε1, ε2) =

∫ b

a

F (t, f0 + ε1h, f′0 + ε1h

′, g0 + ε2k, g′0 + ε2k

′)dt.

Si (f0, g0) est un extremum de (∗∗), alors les deux derivees partielles Φ′1(0, 0) et Φ′

2(0, 0) s’annulentquelque soit les fonctions h, k de classe C(2). Or,

Φ′1(0, 0) =

∫ b

a

(F ′

2(t, f0, f′0, g0, g

′0)h+ F ′

3(t, f0, f′0, g0, g

′0)h

′)dt et

Φ′2(0, 0) =

∫ b

a

(F ′

4(t, f0, f′0, g0, g

′0)k + F ′

5(t, f0, f′0, g0, g

′0)k

′)dt.En integrant par parties puis en appliquant le lemme (9.2.1) comme auparavant, on deduit laproposition suivante :

(9.4.1) Proposition. Si (f0, g0) est un extremum de L avec f0 et g0 de classe C(2), alors f0 etg0 verifient les equations d’Euler

F ′2(t, f0, f

′0, g0, g

′0)−

d

dtF ′

3(t, f0, f′0, g0, g

′0) = 0,

F ′4(t, f0, f

′0, g0, g

′0)−

d

dtF ′

5(t, f0, f′0, g0, g

′0) = 0.

58

Page 59: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

Ici encore, ddtG designe la derivee par rapport a t de la fonction t 7→ G(t). On trouve donc

d

dtF ′

3(t, f0, f′0, g0, g

′0)(t) = F ′′

3,1(t) + F ′′3,2(t)f

′0(t) + F ′′

3,3(t)f′′0 (t) + F ′′

3,4(t)g′0(t) + F ′′

3,5(t)g′′0(t)

pour tout t ∈ [a, b], avec une formule semblable pour ddtF ′

5(t, f0, f′0, g0, g

′0)(t).

(9.4.2) Le critere pour que f0 soit un maximum ou un minimum faible se generalise aussi aucas de deux fonctions inconnues. On trouve que (f0, g0) est un minimum si la forme quadratiqueassociee a (

Φ′′1,1(0, 0) Φ′′

1,2(0, 0)Φ′′

2,1(0, 0) Φ′′2,2(0, 0)

)est definie positive pour tout (h, k). De meme, il s’agit d’un maximum lorsque la forme quadratiqueen question est definie negative.

(9.5) Terminons ce theme avec un cas d’extremum sous contrainte qui se rencontre souventen economie (voir l’exercice (e9.8) pour une application). Il s’agit de trouver les extremums de

L(f, g) =

∫ b

a

F (t, f, f ′, g, g′)dt,

ou f(a) = α1, f(b) = β1, g(a) = α2, g(b) = β2 et f et g sont liees par une contrainte de la forme

G(t, f, f ′, g, g′) = 0.

Pour cela, on se donne a nouveau deux fonctions h et k telles que h(a) = k(a) = h(b) = k(b) = 0et on considere la fonction

Φ(ε1, ε2) =

∫ b

a

F (t, f0 + ε1h, f0 + ε1h′, g0 + ε2k, g

′0 + ε2k

′)dt.

On trouve alors

Φ′1(0, 0) + Φ′

2(0, 0) =

∫ b

a

((F ′

2(t, f0, f′0, g0, g

′0)−

d

dtF ′

3(t, f0, f′0, g0, g

′0))h+

+(F ′

4(t, f0, f′0, g0, g

′0)−

d

dtF ′

5(t, f0, f′0, g0, g

′0))k)dt.(1)

On peut interpreter cette expression comme la derivee directionnelle de L(f, g) en (f0, g0), dansla direction (h, k). Lorsque (f0, g0) est un extremum sans contrainte, elle s’annule quelque soitle choix des fonctions h, k. En particulier, en considerant successivement les cas ou k = 0 et ouh = 0, on retrouve les considerations de (9.4). Dans le present cas, on s’attend a l’annulation de(1) uniquement lorsque (h, k) definit un « vecteur tangent » de G(t, f0, f

′0, g0, g

′0) = 0, c’est-a-

dire lorsque(1, h(t), h′(t), k(t), k′(t)

)est dans l’espace tangent de G

(t, f0(t), f

′0(t), g0(t), g

′0(t))

= 0quelque soit t ∈ [a, b]. Cette condition equivaut a

G′2

(t, f0(t), f

′0(t), g0(t), g

′0(t))h(t) +G′

3

(t, f0(t), f

′0(t), g0(t), g

′0(t))h′(t)+

+G′4

(t, f0(t), f

′0(t), g0(t), g

′0(t))k(t) +G′

5

(t, f0(t), f

′0(t), g0(t), g

′0(t))k′(t) = 0(2)

quelque soit t ∈ [a, b].Presente ainsi, l’argument n’est pas tout a fait rigoureux. Pour le justifier en detail, on aurait

besoin de developper le calcul differentiel dans les espaces de fonctions et, plus generalement, dans

59

Page 60: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

les espaces normes de dimension infinie. Mais un tel developpement irait au dela de ce qu’il seraitraisonnable de faire dans le cadre d’une troisieme annee de licence.

(9.5.1) Le cas ou F (t, f, f ′, g, g′) = M(t, f, g) et G(t, f, f ′, g, g′) = f ′ −N(t, f, g), ou les fonc-tions M et N ne dependent que de t, f et g et non de f ′ ni de g′, est particulierement importantdans les applications au controle optimal. Dans ce cas, (1) et (2) se simplifient respectivement en

(1’) Φ′1(0, 0) + Φ′

2(0, 0) =

∫ b

a

(M ′2(t, f0, g0)h(t) +M ′

3(t, f0, g0)k(t))dt

et en

(2′) −N ′2(t, f0(t), g0(t)h(t) + h′(t)−N ′

3(t, f0(t), g0(t))k(t) = 0.

(9.5.2) Theoreme. Soit (f0, g0) un couple de fonctions tel que N ′3(t, f0(t), g0(t)) 6= 0 pour tout

t ∈ [a, b] et on pose H(t, f, g, λ) = M(t, f, g) + λ(t)N(t, f, g), ou la fonction λ est a determiner.Si H, λ, f0 et g0 verifient

H ′3(t, f0, g0, λ) = 0, H ′

4(t, f0, g0, λ) = f ′0, H ′2(t, f0, g0, λ) = −λ′,

alors (f0, g0) est un extremum de M sous la contrainte f ′ = N .Demonstration. D’apres (2′), les hypotheses permettent d’ecrire

k(t) =h′(t)−N ′

2(t, f0, g0)h(t)

N ′3(t, f0, g0)

.

En substituant dans (1′), on tire que∫ b

a

((M ′

2(t, f0, g0)−N ′

2(t, f0, g0)

N ′3(t, f0, g0)

)h(t) +

M ′3(t, f0, g0)

N ′3(t, f0, g0)

h′(t))dt = 0

puis, en integrant par parties le terme∫ b

a

M ′3(t,f0,g0)

N ′3(t,f0,g0)

dt et en rappelant que h(a) = h(b) = 0, on

conclut que∫ b

a

(M ′

2(t, f0, g0)−N ′

2(t, f0, g0)

N ′3(t, f0, g0)

+

((M ′

3(ddtN ′

3)−N ′3(

ddtM ′

3))(t, f0, g0)

N ′3(t, f0, g0)2

)h(t)dt = 0

quelque soit la fonction h de classe C(2) telle que h(a) = h(b) = 0. D’apres le lemme (9.2.1), ontire que

(3) M ′2(t, f0, g0)−

N ′2(t, f0, g0)

N ′3(t, f0, g0)

+

((M ′

3(ddtN ′

3)−N ′3(

ddtM ′

3))(t, f0, g0)

N ′3(t, f0, g0)2

= 0.

Soient donc H, λ verifiant les equations de l’enonce. Puisque l’on a H ′3(t, f0, g0, λ) = 0 et

N ′3(t, f0, g0) 6= 0, on a

λ(t) = −M′3(t, f0, g0)

N ′3(t, f0, g0)

,

puis, en derivant par rapport a t,

λ′(t) =

((M ′

3(ddtN ′

3)−N ′3(

ddtM ′

3))(t, f0, g0)

N ′3(t, f0, g0)2

.

60

Page 61: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

Puisque H ′2(t, f0, g0, λ) = −λ′, on a M ′

2(t, f0, g0)+λ(t)N ′2(t, f0, g0)+λ

′(t) = 0. En substituant pourλ et λ′, on trouve bien l’equation (3). Enfin, l’hypothese H ′

4(t, f0, g0, λ) = 0 n’est qu’une autrefacon d’exprimer la contrainte f ′0 = N(t, f0, g0).

EXERCICES

(e9.1) Justifier l’affirmation faite a la fin de (9.1.1) que Φ′′h(0) > 0 quelque soit h ∈ H, h 6= 0.

(e9.2) Trouver les fonctions f0 : [0, 1] → R de classe C(2) et verifiant f(0) = 0, f(1) = 1 qui donnentles valeurs extremales de

∫ 10

(t2 + f ′(t)2)dt. (Ecrire d’abord l’equation d’Euler (9.3.1).)

(e9.3) Trouver la fonction f0 : [0, 2] → R de classe C(2) verifiant f0(0) = 0 et f0(2) = 8 qui donne lavaleur minimale de

∫ 20

(tf(t) + f ′(t)2

)dt.

(e9.4) Determiner la valeur minimale de l’integrale∫ 10 etf ′(t)2 dt ou f parcourt les fonctions de [0, 1]

dans R de classe C2 verifiant f(0) = 0 et f(1) = 1− e−1.

(e9.5) (i) On considere le cas de (9.3.1) ou la fonction F ne depend explicitement que de f et de f ′

et non de t. On a donc F ′1 = 0.

Montrer que la fonction t 7→ ddt

(F − f ′F ′

3

)(t) est identiquement nulle sur [a, b]. (Utiliser l’equation

d’Euler.) En deduire que t 7→ (F − f ′F ′3)(t) est constante sur [a, b].

(ii) Application. On suppose que F (x, y) =√

1 + x2y2. Trouver l’unique fonction f0 ∈ E qui puisseetre un extremum de L et qui verifie f0(−1) = 0 et f0(1) = 1.

(e9.6) Etudier les fonctions f0 : [0, 1] → R∗+ verifiant f0(0) = α > 0 et f0(1) = β > 0 donnant les

valeurs extremales de∫ 10

√1+f ′(t)2√

f(t)dt. (Utiliser l’exercice precedent pour montrer que f0(t)

(1+ f ′0(t)

2)

est

une constante strictement positive que l’on exprimera en fonction de α et de β. Ensuite chercher unesolution de f0(t)

(1 + f ′0(t)

2)

= C de la forme f0(t) = A + B cos t.)

(e9.7) Trouver le couple de fonctions (f0, g0) de classe C(2) sur [a, b] et verifiant f0(a) = α1, f0(b) = β1,g0(a) = α2, g0(b) = β2 qui fournit le minimum de

∫ ba

√f ′(t)2 + g′(t)2dt.

(e9.8) Soient T , r, α, β, a, b, ε des reels avec T , r, ε, β, et b > 0. On propose a chercher a maximiser∫ T

0e−rt

(αf(t)− βf(t)2 − ag(t)− bg(t)2

)dt

lorsque f et g sont liees par f ′(t) = g(t) − εf(t). En economie, c’est le modele d’Eisner-Strotz. Onutilise la methode de (9.5.2).

(i) Ecrire les fonctions M , N , puis H et λ de l’enonce du theoreme (9.5.2) dans le present cas.(ii) Ecrire les trois equations H ′

2 = −λ′, H ′3 = 0, H ′

4 = f ′0 qui sont verifiees lorsque (f0, g0) donneune valeur extremale de l’integrale et H = H(t, f0, g0, λ).

(iii) En deduire que f0 et g0 sont solutions du systeme

f ′0(t) = −εf0(t) + g0(t), g′0(t) =β

bf0(t) + (r + ε)g0(t) +

(r + ε)a− α

2b.

(iv) Montrer que (f0, g0) donne bien un maximum. (La matrice hessienne de M par rapport auxdeux dernieres variables est (

−2βe−rt 00 −2be−rt

)ce qui est definie negative quelque soit la valeur de t.)

61

Page 62: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

Theme 10. Applications aux equations differentielles

(10.1) Dans ce dernier theme, nous allons appliquer les notions du theme precedent a l’etudedes questions d’existence et d’unicite de solutions d’equations et de systemes differentielles.

(10.1.1) Considerons d’abord le cas d’une equation de premier ordre de la forme

(∗) x′(t) = F(t, x(t)

),

avec condition initiale x(t0) = a0. Ici, on se fixe un intervalle I, t0 ∈ I ainsi que a0 ∈ R et lasolution cherchee est une fonction x : I → R. On suppose que F : I ×R→ R est continue et quex est de classe C(1). Alors

(∗∗) x(t) = a0 +

∫ t

t0

F(u, x(u)

)du.

Reciproquement, si l’on derive (∗∗), on retrouve (∗) et toute fonction x verifiant (∗∗) verifieegalement x(t0) = a0. Ainsi, resoudre l’equation differentielle (∗) avec la condition initiale x(t0) =a0 equivaut a resoudre l’ equation integrale (∗∗). Remarquons qu’il suffit de chercher les solutionscontinues, car une telle solution sera en fait de classe C(1), car la fonction t 7→ a0+

∫ t

t0F(u, x(u)

)du

est derivable et sa derivee t 7→ F(t, x(t)

)est continue puisque F et x le sont.

Les equations integrales offrent plusieurs avantages par rapport aux equations differentielles.Ceci decoule du fait que l’integration est une operation beaucoup plus « reguliere » que la deri-vation. Par exemple, toute fonction continue possede une primitive, alors qu’il existe des fonctionscontinues sans derivee. Et il est plus facile de tirer des renseignements sur une primitive que surune derivee. Par exemple, si f est une fonction continue sur l’intervalle ferme et borne [a, b], on

sait que∣∣ ∫ b

af(t)dt

∣∣ ≤M(b− a), ou M = supt∈[a,b] f(t). Par contre, il n’existe aucune borne pourla derivee d’une fonction en termes d’une borne pour la fonction elle-meme (penser a la fonctiont 7→ sin at ou a > 0 est une constante).

(10.2) Plus generalement, soit

x(n) = F(t, x(t), x′(t), . . . , x(n−1)(t)

)une equation differentielle d’ordre n, dont on cherche la solution avec conditions initiales x(t0) = a0,x′(t0) = a1, . . ., x(n−1)(t0) = an−1. Si l’on pose x0 = x, x1 = x′, . . ., xn−1 = x(n−1), alors l’equationdevient equivalente au systeme

x′0(t) = x1(t),

x′1(t) = x2(t),

. . . . . . . . . . . .

x′n−2(t) = xn−1(t),

x′n−1(t) = F(t, x0(t), x1(t), . . . , xn−1(t)

),

avec les conditions initiales x0(t0) = a0, x1(t0) = a1, . . ., xn−1(t0) = an−1. Ainsi, pour traiter lesequations d’ordre quelconque, il suffit de traiter les systemes lineaires d’ordre un. Un tel systemes’ecrit (avec un decalage d’indice) en notation vectorielle

x′1(t)x′2(t)

...x′n(t)

=

F1

(t, x1(t), x2(t) . . . , xn(t)

)F2

(t, x1(t), x2(t) . . . , xn(t)

)...

Fn

(t, x1(t), x2(t) . . . , xn(t)

) ,

62

Page 63: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

ce que nous abregerons en X ′(t) = F(t, f1(t), . . . , fn(t)

), ou donc

X =

x1

x2...xn

et F =

F1

F2...Fn

.

On se fixe alors t0 ∈ I et A =

a1

a2...an

∈ M1,n(R). On veut montrer l’existence et l’unicite d’une

solution X verifiant X(t0) = A.

(10.2.1) Comme auparavant, le probleme equivaut a resoudre le systeme integrale

X(t) = A+

∫ t

t0

F(u,X(u)

)du.

En ce qui concerne l’existence d’une solution, l’idee de Poincare et de Lipschitz est de considererune suite de fonctions vectorielles (Xn), ou X0 est a choisir et

Xn(t) = A+

∫ t

t0

F(u,Xn−1(u)

)du

lorsque n ≥ 1. On espere que, avec un choix convenable de X0, la suite (Xn) convergerait versune fonction continue X : alors (Xn−1) convergerait egalement vers X et F

(u,Xn−1(u)

)vers

F(u,X(u)

), d’ou l’equation cherchee X(t) = A+

∫ t

t0F(u,X(u)

)du.

(10.3) La realisation de cette strategie necessite des hypotheses supplementaires sur F . Onnote || · || la norme sur Mn,1(R) definie par ||B|| =

√b21 + b22 + · · ·+ b2n, ou B = t(b1, b2, . . . , bn).

Soit E une partie de Mn,1(R). On dit que F est lipschitzienne sur I × E s’il existe L > 0 telque

||F (t,X)− F (t, Y )|| ≤ L||X − Y ||quelque soit t ∈ I et X, Y ∈ E.

(10.3.1) Lemme. Soit Ω un domaine convexe de Mn,1(R). On suppose F de classe C(1) surI × Ω et que les derivees partielles de F par rapport aux coordonnees de X soient bornees sur Ω.Alors F est lipschitzienne sur I × Ω.

Ce resultat decoule du theoreme des accroissements finis (3.5).Nous avons deja fait allusion au resultat suivant a plusieurs reprises.

(10.4) Theoreme (Cauchy-Lipschitz). Soient R > 0, δ > 0 deux constantes. On supposeF continue et lipschitzienne sur [t0 − δ, t0 + δ] × K(A;R), ou K(A;R) designe la boule fermeede Mn,1(R) de centre A et de rayon R. Posons M = sup|F (t,X)| | (t,X) ∈ [t0 − δ, t0 + δ] ×K(A;R) et µ = min(δ, R

M). Alors le systeme X ′(t) = F

(t,X(t)

)possede une unique solution X

sur l’intervalle [t0 − µ, t0 + µ].Demonstration de l’existence d’une solution. Afin de pouvoir contruire la suite (Xn) il faut

d’abord justifier le fait que si X est une fonction continue de [t0−µ, t0+µ] a valeurs dans B(A;R),alors la fonction t 7→ Y (t) = A +

∫ t

t0F(u,X(u)

)du sur [t0 − µ, t0 + µ] est encore a valeurs dans

K(A;R). Or, si |t− t0| ≤ µ, alors

||Y (t)− A|| = ||∫ t

t0

F(u,X(u)

)du|| ≤

∫ t

t0

||F(u,X(u)

)||du ≤ µM ≤ R

MM = R,

63

Page 64: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

d’ou l’assertion.La suite (Xn) est alors bien definie, pourvu que l’on choisit la fonction terme initial X0 :

[t0 − µ, t0 + µ] → K(A;R). Il suffit de prendre pour X0 la fonction constante egale a A, ce quenous ferons par la suite.

Fixons alors une constante L > 0 telle que ||F(t,X) − F (t, Y )|| ≤ L||X − Y || quelque soit

t ∈ [t0 − µ, t0 + µ].

(10.4.1) Lemme. Pour tout entier n ≥ 1 et pour tout t ∈ [t0 − µ, t0 + µ], on a

||Xn(t)−Xn−1(t)|| ≤M

Ln!(L[t− t0|)n.

La demonstration se fait par recurrence sur n. Supposons d’abord n = 1. Alors

||X1(t)−X0(t)|| = ||X1(t)− A|| =∣∣∣ ∫ t

t0

F (u,A)du∣∣∣ ≤ ∣∣∣ ∫ t

t0

||F (u,A)||du∣∣∣ ≤M |t− t0|,

est le resultat est vrai. Admettons-le au niveau n ≥ 1 et verifions-le au niveau n+ 1.

||Xn+1(t)−Xn(t)|| = ||∫ t

t0

(F(u,Xn(u)

)− F

(u,Xn−1(u)

))du||

ce qui est majore par∣∣∣ ∫ t

t0

||F(u,Xn(u)

)− F

(u,Xn−1(u)

)||du

∣∣∣ ≤ ∣∣∣ ∫ t

t0

L||Xn(u)−Xn−1(u)||du∣∣∣.

On peut alors appliquer l’hypothese de recurrence ||Xn(u)−Xn−1(u)|| ≤ MLn!

(L|u− t0|)n et utiliser

la formule |∫ t

t0|u− t0|ndu| = |t− t0|n+1/(n+ 1) pour conclure.

(10.4.2) On tire de ce qui precede que

||Xn(t)−Xn−1(t)|| ≤M

Ln!(Lµ)n

pour tout t ∈ [t0 − µ, t0 + µ]. Par consequent, si n > m ≥ 0, on a

(∗∗∗) ||Xn(t)−Xm(t)|| ≤n∑

k=m+1

||Xk(t)−Xk−1(t)|| ≤M

L

n∑k=m+1

(Lµ)k

k!

La serie de terme general (Lµ)k

k!etant convergent, on voit que la suite de fonctions (Xn) est uni-

formement de Cauchy sur [t0 − µ, t0 + µ] et donc uniformement convergente vers une fonctioncontinue X : [t0 − µ, t0 + µ] → K(A;R). Alors la suite des fonctions t 7→ F

(t,Xn(t)

)converge

uniformement vers la fonction t 7→ F(t,X(t)

). Par consequent, on peut interchenger l’integration

est le passage a la limite n→ +∞ pour conclure que X(t) = A+∫ t

t0F(u,X(u)

)du.

(10.5) On a ainsi demontre l’existence d’une solution de X(t) = A +∫ t

t0F(u,X(u)

)du, au

moins sur un voisinage de t0. Nous allons maintenant examiner la question de l’unicite. Pour celaon revient au systeme differentielle, en supposant que l’on a deux fonctions vectorielles X, Yverifiant X ′(t) = F

(t,X(t)

)et Y ′(t) = F

(t, Y (t)

)ainsi que X(t0) = Y (t0) = A. Posons

σ(t) = ||X(t)− Y (t)||2.

64

Page 65: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

Puisque X(t0) = Y (t0), on a σ(t0) = 0 et il suffit de montrer que σ(t) = 0 quelque soit t ∈[t0 − µ, t0 + µ]. Pour cela, derivons σ :

σ′(t) = 2〈X(t)− Y (t), X ′(t)− Y ′(t)〉 = 2〈X(t)− Y (t), F(t,X(t)

)− F (t, Y (t)

)〉.

En appliquant l’inegalite de Cauchy-Schwarz, on en tire que

|σ′(t)| ≤ 2||X(t)− Y (t)|| ||F(t,X(t)

)− F

(t, Y (t)

)|| ≤ 2L||X(t)− Y (t)||2 = 2Lσ(t).

Par consequent, puisque L > 0 et σ(t) ≥ 0 :

−2Lσ(t) ≤ σ′(t) ≤ 2Lσ(t)

pour tout t ∈ [t0 − µ, t0 + µ]. En multipliant l’inegalite a droite par e−2Lt, on trouve que(σ′(t)−

2Lσ(t))e−2Lt ≤ 0, c’est-a-dire que d

dt

(σ(t)e−2Lt

)≤ 0. On en tire que le fonction t 7→ σ(t)e−2Lt est

decroissante. Puisque σ(t) ≥ 0 et σ(t0) = 0, on en tire que σ(t) = 0 lorsque t ≥ t0. De la memefacon, en multipliant l’inegalite −2Lσ(t) ≤ σ′(t) par e2Lt, on voit que d

dt

(σ(t)e2Lt

)≥ 0 et donc que

la fonction t 7→ σ(t)e2Lt est croissante puis que σ(t) = 0 lorsque t ≤ 0. Au total, donc, σ(t) = 0quelque soit t et donc X(t) = Y (t) quelque soit t.

(10.6) L’interet de la demonstration de l’existence d’une solution que nous venons de donnern’est pas purmeent theorique. La suite (Xn) permet aussi de trouver des approximations explicitesaux solutions, au moins dans certains cas. En effet, si l’on reprend l’equation (∗∗∗), on trouve, enrappelant que X0(t) = A, que

||Xn(t)−Xm(t)|| ≤ M

L

n∑k=m+1

(Lµ)k

k!≤ M

L

∞∑k=m+1

(Lµ)k

k!.

En faisant tendre n vers +∞, il vient

(†) ||X(t)−Xm(t)|| ≤ M

L

∞∑k=m+1

(Lµ)k

k!.

Cette majoration nous permet d’estimer l’erreur commise en utilsant Xm comme approximationa la solution exacte X, si l’on connaıt les valeurs de L, M et de µ.

En effet, on rappelle que∑∞

k=0(Lµ)k

k!= eLµ quelque soit les valeurs de L, µ ∈ R, et la majoration∑∞

k=m+1(Lµ)k

k!n’est que le reste d’ordre m de cette serie.

(10.7) Exemple. Soit l’equation differentielle x′ = t2+x2. On cherche la solution avec conditioninitiale x(0) = 0. La demonstration de l’existence d’une solution nous amene a considerer la suitede fonctions definie par x0(t) = 0 et xn(t) =

∫ t

0

(u2 + xn−1(u)

2)

du. Par calcul, on trouve

x1(t) =

∫ t

0

(u2 + x0(u)

2)du =

∫ t

0

u2du =t3

3,

puis

x2(t) =

∫ t

0

(u2 + x1(u)

2)du =

∫ t

0

(u2 +

u6

9

)du =

t3

3+t7

63,

puis

x3(t) =

∫ t

0

(u2 + x2(u)

2)du =

∫ t

0

(u2 +

(u3

3+u7

63

)2)du =

∫ t

0

(u2 +

u6

9+

2u10

189+

u14

3969

)du,

65

Page 66: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

d’ou x3(t) = t3

3+ t7

63+ 2t11

2079+ t15

59535et ainsi de suite.

La fonction F (t, x) = t2 + x2 verifie |F (t, x)− F (t, y)| = |x2 − y2| ≤ (|x|+ |y|)|x− y| quelquesoit t, x, y ∈ R. Si donc on se donne δ > 0, alors |F (t, x) − F (t, y)| ≤ 2δ|x − y| lorsque |x| ≤ δ,|y| ≤ δ. Par consequent, F est lipschitzienne sur R × [−δ, δ]. Si x : [−1/3, 1/3] → [−1/3, 1/3] estune fonction continue et si l’on definit y : [−1/3, 1/3] → R par y(t) =

∫ t

0

(u2 + x(u)2

)du alors

y(t) =t3

3+

∫ t

0

x(u)2du ≤ |t|3

3+|t|3≤ 1

27+

1

9≤ 1

3

et donc y envoie l’intervalle [−1/3, 1/3] dans lui-meme.Puisque x0(t) = 0, chacune des fonctions xn envoie l’intervalle [−1/3, 1/3] dans lui-meme.

Prenons donc t0 = 0 et δ = 13

dans le theoreme (10.4), dont on reprend les notations. D’apres cequi precede, on peut prendre R = 1

3. On a donc M = supt2 + x2 | |t| ≤ 1

3, |x| ≤ 1

3 = 2

9. En

outre |F (t, x) − F (t, y)| ≤ 23|x − y| lorsque |t| ≤ 1

3, |x| ≤ 1

3et |y| ≤ 1

3, et donc L = 2

3. Enfin,

µ = min(δ, RM

) = 13. En appliquant (†), on conclut que l’equation x′(t) = t2 + x(t)2 possede une

unique solution sur [−1/3, 1/3] qui verifie x(0) = 0, et que pour toutm et pour tout t ∈ [−1/3, 1/3],on a

|x(t)− xm(t)| ≤ 1

3

∞∑k=m+1

(29

)k 1

k!.

Remarquons pour conclure cet exemple que, en fait, la solution x peut s’ecrire comme serieentiere de la forme

x(t) =t3

3+t7

63+

2t11

2079+

13t15

218295+

∞∑k=5

ckt4k−1,

convergente sur lorsque |t| ≤ 13. (Nous ne demontrons pas cette affirmation.) Notons que les

coefficients de t3, t7 et de t11 coıncident avec ceux de x3, mais que ce n’est pas le cas de celui det15. Pour obtenir le coefficient de t15, il faut effectuer une iteration supplementaire, et calculer x4.

EXERCICES

(e10.1) Verifier que la fonction F (t, x) = t2 + x2 n’est pas lipschitzienne sur R2.

(e10.2) Calculer une constante L > 0 telle que si F (t, x) = t√

x, alors |F (t, x) − F (t, y)| ≤ L|x − y|pour tout t ∈ [−1, 1], x ≥ 1, y ≥ 1.

(e10.3) Soit I = [a, b] un intervalle ferme et borne et soient p, q deux fonctions continues de I dansR. Montrer que la fonction F (t, x) = p(t)x+ q(t) est lipschitzienne sur I×R. En deduire que le theoremed’existence locale (10.4) s’applique a l’equation lineaire x′ = px + q quelque soit la condition initialex(t0) = a0, (t0 ∈ I, a0 ∈ R).

(e10.4) Generaliser l’exercice precedent aux systemes lineaires. Soit F (t, X) = PX + Q un systemede n fonctions I×Mn,1(R) → R, P etant une matrice d’ordre n dont les coefficients Pij sont des fonctionscontinues I → R et Q un vecteur de fonctions continues I → R. Montrer que si I est un intervalle compactalors F est lipschitzienne et en deduire que (10.4) s’applique au systeme X ′ = PX + Q quelque soit lacondition initiale X(t0) = A.

En deduire l’existence locale et l’unicite d’une solution d’une equation lineaire anx(n) +an−1x(n−1) +

· · ·+ a0x = b, ou les fonctions ak, 0 ≤ k ≤ n et b sont continues sur I et an(t0) 6= 0.

(e10.5) Appliquer la methode de demonstration du theoreme (10.4) a l’equation x′(t) = x(t) aveccondition initiale x(0) = 1. Calculer les solutions approchees xn (n ≥ 1). Les comparer avec les sommespartielles du developpement en serie entiere de la solution exacte x(t) = et. Les arguments de ce theme

66

Page 67: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

permettent-t-ils de montrer que si R > 0, on a xn(t) → x(t) uniformement sur [−R, R], ou faut-il unautre argument ?

(e10.6) Soit I un intervalle ferme et borne et soit F : I ×Mn,1(R) → R une fonction lipschitzienne(c’est-a-dire il existe L > 0 tel que ||F (t, X)−F (t, Y )|| ≤ L||X−Y || quelque soit t ∈ I, X, Y ∈Mn,1(R)).Montrer que si t0 ∈ I et si A ∈ Mn,1(R), alors le systeme X ′ = F (t, X) a une solution sur I verifiantX(t0) = A. (Verifier que la suite Xn comme dans la demonstration de (10.4) converge vers une solution.Ce resultat est toutefois moins utile en pratique que (10.4), car l’hypothese que F soit lipschitizienne surI ×Mn,1(R) est rarement satisfaite. Par exemple, F (t, x) = t2 + x2 n’est pas lipschitzienne sur I × R.L’hypothese est toutefois satisfaite lorsque F (t, X) = PX + Q et P , Q sont constants.)

Appendice A. Quelques rappels

(A.1) Quelques notations ensemblistes. Soit E un ensemble. Si x est un objet, la notationx ∈ E signifie que x appartient a E, alors que la notation x /∈ E a la signification contraire. SiF et G sont deux parties de E, on note F ∩ G leur intersection, F ∪ G leur reunion et F − Gle complementaire de G dans F , c’est-a-dire les elements de F n’appartenant pas a G. Si aucuneconfusion n’est a craindre, on pose F c = E − F . L’ensemble vide est designe par ∅.

(A.1.1) Soient E, F deux ensembles et soit f : E → F une fonction. Si A est une partie deE, on note f(A) la partie de F composee des elements de la forme f(x) avec x ∈ A. De meme,si B est une partie de F , on note f−1(B) la partie de E composee des elements x ∈ E tels quef(x) ∈ B.

(A.1.2) Une suite a valeurs dans l’ensemble E est une application de N dans E. Siu : N → E est une suite, on note le plus souvent un plutot que u(n) la valeur de u en n : un

s’appelle alors le terme d’ordre n de u. On tolere en general que un n’ait pas de sens pour quelquespetites valeurs de n (par exemple la suite un = 1

n−1n’est pas definie lorsque n = 1) : ce qui compte

est que un ait un sens pour tout n assez grand.

Soit u = (un) une suite a valeurs dans E. Une suite extraite (ou sous-suite) est une suiteobtenue en composant u avec une application strictement croissante N → N. Concretement, lestermes d’une suite extraite sont un0 , un1 , un2 , . . .unk

, . . ., ou l’application N → N est designee park 7→ nk. Si par exemple un = 1

n−1et nk = k2, alors unk

= 1k2−1

.

(A.1.3) Soient Λ, E deux ensembles. Une famille de parties de E indexee par Λ est ladonnee, pour tout λ ∈ Λ, d’une partie Eλ de Λ. Autrement dit, c’est une application de Λ dansl’ensemble des parties de E. On la note Eλ | λ ∈ Λ. La reunion

⋃λ∈ΛEλ est composee des

elements de E appartenant a Eλ pour au moins un indice Λ. De meme, l’intersection⋂

λ∈ΛEλ

est composee des elements de E appartenant a Eλ quelque soit l’indice λ.

Exemples. (i) Prenons E = R, Λ = N∗. Si n ∈ N∗, on pose En = [−n, n]. Alors⋃

n∈N∗ En = Ret⋂

n∈N∗ En = [−1, 1].

(ii) Prenons E = R, Λ = R∗+. Si λ ∈ R∗, on pose Eλ = [λ,+∞[. Alors

⋃λ∈ΛEλ =]0,+∞[ et⋂

λ∈ΛEλ = ∅.

67

Page 68: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

(A.1.4) Les egalites ⋃λ∈Λ

Ecλ =

( ⋂λ∈Λ

)c

,⋂λ∈Λ

Ecλ =

( ⋃λ∈Λ

)c

sont connues sous le nom des formules de de Morgan.

(A.2) Rappelons brievement quelques notions sur les sous-ensembles de R. Soit E unepartie non-vide de R. On dit que E est majoree s’il existe M ∈ R tel que x ≤ M quelque soitx ∈ E : tout reel M verifiant cette propriete s’appelle un majorant de E. De meme, E est diteminoree s’il existe m ∈ R tel que m ≤ x quelque soit x ∈ E et tout reel m ayant cette proprietsest appele minorant de E. On dit que E est bornee si elle est a la fois majoree et minoree.

(A.2.1) Soit E une partie non-vide de R. On suppose E majoree. Alors l’ensemble des majo-rants est un intervalle ferme de la forme [a,+∞[. Le nombre a est alors le plus petit des majorants,c’est-a-dire si M est un reel et si M < a, alors il existe x ∈ E verifiant M < x. Ce reel a s’appellela borne superieure ou supremum de E et est note supE. La notation supE = +∞ signifie queE n’est pas majoree.

De la meme facon, si E est minoree, l’ensemble des minorants de E est de la forme ]−∞, b]et b est le plus grand des minorants. Si m ∈ R et si m > b, il existe x ∈ E verifiant x > m. Onappelle b la borne inferieure (ou infimum) de E et l’on le note inf E. La notation inf E = −∞signifie que E n’est pas minoree.

(A.2.2) Si E est majoree et si supE ∈ E, alors supE est egalement le plus grand element(ou maximum) de E. Lorsque c’est le cas, on rencontre parfois la notation maxE pour supE, maisil est preferable de reserver maxE au cas ou E est un ensemble fini. De meme, si E est minoree etsi inf E ∈ E, alors inf E est le plus petit element (ou minimum) de E. A nouveau, on rencontreparfois la notation minE pour inf E, mais il est preferable de reserver minE aux ensembles finis.

Exemple. Prenons E = [0, 1[. Soit M ∈ R. Si M ≥ 1, alors x ≤ M quelque soit x ∈ E. Parcontre, si M < 1, E contient un element x (a savoir les nombres appartenant a l’intervalle ]M, 1[)tel que M < x. On en tire que l’ensemble des majorants de E est [1,+∞[. Donc supE = 1.Puisque supE /∈ E, c’est le plus grand element de E.

Soit encore m ∈ R. Si m ≤ 0, alors x ≥ m quelque soit x ∈ E. Par contre, si m > 0, alorsE contient un element x (a savoir les nombres appartenant a l’intervalle [0,m[) verifiant x < m.L’ensemble des minorants est donc ]−∞, 0] et donc inf E = 0. Puisque 0 ∈ E, 0 est le plus petitelement de E.

(A.3) Notons K l’un des corps R et C. Soit X un ensemble et soit F un K-espace vectoriel. Onnote F(X,F ) l’ensemble des applications de X vers F . Alors F(X,F ) est de facon naturelle unK espace vectoriel. Explicitement, si f , g ∈ F(X,F ) et si λ ∈ K, on definit f + g, λf ∈ F(X,F )par (f + g)(x) = f(x) + g(x) et (λf)(x) = λ

(f(x)

). Si X est lui-meme un R espace vectoriel,

l’ensemble des applications lineaires de X dans F constituent alors un sous-espace de F(X,F ),que l’on notera L(X,F ).

(A.3.1) Soit E un K-espace vectoriel. Une forme lineaire sur E est un element de L(E,K). SiE est de dimension finie, si (e1, e2, . . . , en) est une base de E et si i ∈ 1, 2, . . . , n, alors il existe uneunique forme lineaire e∗i sur E verifiant e∗i (ej) = 1 si j = i et e∗i (ej) = 0 si j 6= i pour tout 1 ≤ j ≤ n.Concretement, si x = λ1x1+λ2x2+· · ·+λnen, on a e∗i (x) = λ1e

∗i (e1)+λ2e

∗i (e2)+· · ·+λne

∗i (en) = λi.

(A.3.2) Si E et F sont deux K-espaces vectoriels de dimension finie m et n, alors L(E,F ) estde dimension mn. En particulier, L(E,K) est de dimension un et (e∗1, e

∗2, . . . , e

∗n) est une base de

L(E,K).

68

Page 69: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

(A.4) Soient E, F , G trois K-espace vectoriels. L’application β : E × F → G est dite bi-lineaire si elle verifie les proprietes suivantes

(i) Pour tout x ∈ E, l’application de F vers G definie par y 7→ β(x, y) est lineaire,(ii) Pour tout y ∈ F , l’application de E vers G definie par x 7→ β(x, y) est lineaire.On dit que β est non-degeneree a gauche lorsque, etant donne y ∈ F −0, il existe x ∈ E

tel que β(x, y) 6= 0. De meme, β est non-degeneree a droite lorsque, etant donne x ∈ E−0, ilexiste y ∈ F tel que β(x, y) 6= 0. On dit que β est symetrique lorsque F = E et β(x, y) = β(y, x)quelque soit x, y ∈ E. Pour une forme symetrique, les notions de non-degeneree a gauche et denon-degeneree a droite coıncident.

(A.4.1) Lorsque G = K, on parle d’une forme bilineaire. Dans ce cours, nous nous limiteronsaux formes bilineaires symetriques. Le corps K sera presque toujours R. Une forme quadratiqueest une application q : E → K de la forme q(x) = β(x, x) lorsque x ∈ E.

(A.4.2) Supposons que E soit de dimension finie n et que (e1, e2, . . . , en) soit une base de E.La matrice de β dans la base (e1, e2, . . . , en) est alors la matrice carree A d’ordre n definie parA = (Aij), ou Aij = β(ei, ej). Si x =

∑ni=1 λiei et y =

∑nj=1 µjej, alors β(x, y) =

∑ni,j=1 λiµjAij.

La matrice A est symetrique si et seulement si β est symetrique.Changer la base (e1, e2, . . . , en) revient a remplacer la matrice A par une matrice equivalente.

En particulier, le rang de A ne depend que de q et non de la base choisie. Rappelons que deuxmatrices equivalentes ont le meme rang. On appelle ce rang commun le rang de β.

(A.4.3) Considerons alors le cas particulier ou E = Rn et (e1, e2, . . . , en) est la base standard.Comme dans le (4.10), on identifie l’element x = (x1, x2, . . . , xn) de Rn avec la matrice a unecolonne dont les coefficients succesifs sont x1, x2, . . ., xn. Avec cette convention, on a β(x, y) = txAyquelque soit (x, y) ∈ (Rn)2. Si β (et donc A) est symetrique, la forme quadratique associee aβ est la forme quadratique q associee a A, c’est-a-dire q(x) = txAx = β(x, x). Etant donnee q,on peut retrouver β : si A est la matrice associee a q, alors β est la forme bilineaire symetriqueβ(x, y) = txAy. On a alors

q(x+ y) = t(x+ y)A(x+ y) = txAx+ txAy + tyAx+ tyAy = q(x) + 2txAy + q(y)

(puisque A est symetrique), d’ou q(x + y) = q(x) + 2β(x, y) + q(y). Il s’ensuit que β(x, y) =12

(q(x+ y)− q(x)− q(y)

)pour tout x, y ∈ E, ce qui permet de retrouver β en fonction de q sans

l’intervention de la matrice A.

(A.4.4) Ces dernieres considerations se generalisent aux formes sur les espaces vectoriels Equelconques. Si β : E × E est bilineaire symetrique, la forme quadratique associee est q(x) =β(x, x). En developpant β(x+y, x+y), on retrouve la formule β(x, y) = 1

2

(q(x+y)− q(x)− q(y)

).

(A.4.5) Proposition. Soit β une forme bilineaire symetrique sur Rn. Pour que β soit non-degeneree, il faut et il suffit que A soit inversible.

Demonstration. Supposons que A ne soit pas inversible. Il existe alors x ∈ Rn, x 6= 0 telque txA = 0. Alors β(x, y) = txAy = 0 pour tout y ∈ Rn et β n’est pas non-degeneree.Reciproquement, si β n’est pas non-degeneree, il existe x ∈ Rn, x 6= 0 tel que txAy = 0 quelquesoit y ∈ Rn. En prenant x = ej avec j parcourant 1, 2, . . . , n, on trouve que le systeme de nequations lineaires 0 = txAej =

∑ni=1 xiAij dans les n inconnus x1, x2, . . ., xn. Puisque x 6= 0, le

systeme a une solution non-nulle. Il s’ensuit que A n’est pas inversible.

(A.5) On dit que la forme quadratique q sur Rn est non-degeneree si la forme bilineaireassociee est non-degeneree. D’apres ce qui precede, q est non-degeneree si et seulement si la matrice

69

Page 70: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

associee A est inversible, ou encore si et seulement si toutes les valeurs propres de A sont non-nulles. En particulier, il decoule de (4.10.5) que toute forme definie (positive ou negative) estnon-degeneree.

(A.6) Soit q une forme quadratique sur Rn et soit A la matrice symetrique associee. Lasignature de q est le couple d’entiers positifs (r, s) ou r et s designent respectivement le nombrede valeurs propres strictement positives et le nombre de de valeurs propres strictement negativesde A (comptees avec leur multiplicite comme racines du polynome caracteristique de A). Le rangde q est le rang de A, ce qui est encore egal au rang de la forme bilineaire associee. Le resultatsuivant, que nous citons sans demonstration, generalise (4.13.3).

(A.6.1) Theoreme (loi d’inertie de Sylvester). Soit q une forme quadratique sur Rn. Onsuppose que l’on a une ecriture de q sous la forme

q(x) =n∑

i=1

λi`i(x)2

(trouvee par exemple a l’aide de la methode de Gauss (4.13)). Ici, (`k)1≤k≤n est une famille deformes lineaires lineairement independantes et (λ1, λ2, . . . λn) ∈ Rn.

Alors il y a r coefficients λi strictement positives et s coefficients strictement negatives. Laforme q est de rang r + s. En particulier, elle est non-degeneree si et seulement si r + s = n.

(A.7) Soit E un espace euclidien(1.1.2). Deux elements x, y ∈ E sont dits orthogonaux (ouperpendiculaires) si 〈x, y〉 = 0, orthonormes (ou orthonormaux) s’ils sont orthogonaux et, enoutre, ||x|| = ||y|| = 1. De meme, une famille F d’elements de E est dite orthogonale lorsque〈x, y〉 = 0 pour tout x, y ∈ F tels que y 6= x ; elle est dite orthonormee si elle est orthogonale etsi ||x|| = 1 pour tout x ∈ F . Une famille orthogonale est forcement libre. Par consequent, toutefamille orthogonale est finie, de cardinale au plus la dimension de E. Le procede de Gram-Schmidt montre que tout espace euclidien possede une base orthonormee.

(A.7.1) Soient E, F deux espaces euclidiens dont les produits scalaires sont notes respective-ment 〈., .〉E et 〈., .〉F . Une isometrie de E dans F est une application lineaire φ : E → F telleque 〈φ(x), φ(y)〉F = 〈x, y〉E pour tout x, y ∈ E. Une isometrie est forcement injective. Elle estdonc surjective lorsque E et F ont la meme dimension ; on dit alors que φ est une isometrie de Esur F . Une isometrie de E est une isometrie de E sur lui-meme. Notons que l’existence d’une baseorthonormale montre qu’un espace euclidien de dimension n est isometrique a Rn muni du produitscalaire usuel 〈x, y〉 = x1y1 + x2y2 + · · ·+ xnyn, ou x = (x1, x2, . . . , xn) et y = (y1, y2, . . . , yn).

(A.7.2) Proposition. Soit E un espace euclidien et soit φ ∈ L(E). Les deux conditions sui-vantes sont equivalentes.

(i) φ est une isometrie.(ii) La matrice de φ dans une base orthonormee est une matrice orthogonale (4.10.3).La demonstration est facile. On remarquera une certaine inconsistence dans la terminologie :

il aurait ete plus naturel d’appeler une matrice orthogonale une matrice orthonormee, et utiliserla terminologie matrice orthogonale dans le sens plus large de la matrice d’une isometrie dans unebase orthogonale. Mais l’usage a decide autrement.

(A.7.3) Soit φ ∈ L(E). Alors il existe un unique element φ∗ ∈ L(E), appele l’endomor-phisme adjoint de φ, et que est caracterise par la propriete 〈x, φ∗(y)〉 = 〈φ(x), y〉 pour tout(x, y) ∈ E2. Pour construire φ, on se donne une base orthonormee (e1, e2, . . . , en) de E. Soitj ∈ 1, 2, . . . , n. Puisqu’une application lineaire est determinee par ses valeurs sur une base,

70

Page 71: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

φ∗(ej) est determine par les valeurs 〈ei, φ∗(ej)〉 = 〈φ(ei), ej〉 lorsque i parcourt 1, 2, . . . , n. Si

donc A designe la matrice de φ dans la base orthonormee (e1, e2, . . . , en), on constate aussitot quela matrice de φ∗ dans cette meme base est la matrice transposee de A.

L’endomorphisme φ est dit autoadjoint si φ∗ = φ. D’apres ce qui precede, φ est autoadjointsi et seulement si la matrice de φ dans une base orthonormee est symetrique.

(A.7.4) Le fait que les valeurs propres d’une matrice symetrique soient reelles ainsi que letheoreme (4.10.4) se traduit donc dans le langage des endomorphismes autoadjoints en l’enoncesuivant.

(A.7.5) Theoreme. Soit E un espace euclidien de dimension n et soit φ un endomorphismeautoadjoint de E.

(i) Toutes les racines du polynome caracteristique χφ de φ sont reelles.(ii) Posons χφ(t) =

∏ni=1 (t− λi). Il existe une base orthonormee (e1, e2, . . . , en) de E telle

que φ(ei) = λiei pour tout i ∈ 1, 2, . . . , n.Demonstration. Le (i) decoule de la proposition (4.10.2). Demontrons donc le (ii) en raisonnant

par recurrence sur la dimension n de E. Le polynome caracteristique χφ(t) de φ s’ecrit doncsous la forme

∏ni=1 (t− λi), ou les λi sont reels. Lorsque n = 1 on a φ(x) = λ1x pour tout

x ∈ E. Si x 6= 0 et si e1 = x/||x||, alors (e1) est une base orthnormee de E et le resultat estdonc vrai. Supposons donc que n ≥ 2. On sait deja que φ a une valeur propre λ1. Soit e1 unvecteur propre associe tel que ||e1|| = 1 et soit E ′ = x ∈ E | 〈e1, x〉 = 0. Si x ∈ E ′, alors〈e1, φ(x)〉 = 〈φ(e1), x〉 = 〈λ1e1, x〉 = λ1〈e1, x〉 = 0, d’ou φ(x) ∈ E ′. Par consequent, φ(E ′) ⊆ E ′.Or, E ′ est de dimension n− 1 et on verifie aussitot que la restriction de φ a E ′ soit autoadjoint etque son polynome caracteristique est

∏ni=2 (t− λi). On applique alors l’hypothese de recurrence

en affirmant qu’il existe une base orthonormee (e2, e3, . . . , en) de E ′ telle que φ(ei) = λiei pourtout i ≥ 2. Puisque 〈e1, x〉 = 0 pour tout x ∈ E ′ et ||e1|| = 1, on conclut que (e1, e2, . . . , en) estune base orthonormee de E.

(A.8) Terminons l’appendice avec quelques rappels sur les determinants et, surtout, sur leurcalcul. Soit A = (Aij) une matrice carree d’ordre n. Par definition, le determinant de A est lescalaire

(∗) detA =∑π∈Sn

ε(π)A1,π(1)A2,π(2) · · ·An,π(n),

ou la somme parcourt les elements π du groupe des permutations Sn de 1, 2, . . . , n et ε(π)

designe le signe de la permutation π. Par exemple, si A =

(a bc d

), alors detA = ad − bc. De

meme, si A =

a b cd e fg h i

, alors detA = aei + bfg + cdh − afh − bdi − ceg. Les matrices non

carrees n’ont pas de determinant.

(A.8.1) Lorsque A est d’ordre n, la formule (∗) contient n! termes et devient lourde a utiliserdirectement lorsque n est grand. Les regles suivantes permettent parfois de simplifier le calcul d’undeterminant.

(i) Si A et B sont deux matrices carrees du meme ordre, alors detAB = detA detB ;(ii) Si A est inversible, alors detA−1 = 1/ detA.(iii) On a det tA = detA, tA etant la matrice transposee de A ;(iv) Lorsque A est triangulaire, detA est egal au produit des coefficients sur le diagonal

principal de A ;

71

Page 72: L3 MASS — Calcul diff´erentiel (cours et exercices) · termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet de construire une

(v) Pour que detA 6= 0, il faut et il suffit que A soit inversible ;(vi) Soit λ un scalaire et soit A′ la matrice formee en multipliant l’une des colonnes (ou l’une

des lignes) de A par λ. Alors detA′ = λ detA.(vii) Soit A′ une matrice obtenue de A en ajoutant a l’une des lignes de A un multiple scalaire

d’une autre ligne de A. Alors detA′ = detA.(viii) Soit A′ une matrice obtenue de A en ajoutant a l’une des colonnes de A un multiple

scalaire d’une autre colonne de A. Alors detA′ = detA.On suppose A carree d’ordre n. Si i, j ∈ 1, 2, . . . , n on note Bij la matrice obtenue de A en

supprimant la i-ieme ligne et la j-ieme colonne. (Bij est donc une matrice carree d’ordre n− 1.)(ix ) (developpement de A par rapport a sa i-ieme ligne). Si i ∈ 1, 2, . . . , n, alors detA =∑n

j=1 (−1)i+j−1Aij detBij ;(x ) (developpement de A par rapport a sa j-ieme colonne). Si j ∈ 1, 2, . . . , n, alors detA =∑n

i=1 (−1)i+j−1Aij detBij.Ces proprietes suffiront largement pour le calcul des determinants que nous renconctrons dans

ce cours. A l’exception des proprietes (i) et (v), elles se demontrent par des calculs (parfois unpeu penible) a partir de la definition (∗). Les proprietes (i) et (v) sont plus interessantes sur leplan conceptuel et on trouvera leur demonstration ainsi que d’autres proprietes des determinantsdans les manuels de premiere ou deuxieme annee de Licence de mathematiques.

(A.8.2) Rappelons que le polynome characteristique de la matrice carree A d’ordre n estle polynome det(tIn − A), In designant la matrice identite. Si P ∈ Mn est inversible, alorsles proprietes (i) et (ii) impliquent que det (P−1(tIn − A)P ) = detP−1 det(tIn − A) detP =detP−1 det(tIn −A) detP = det(tIn −A). Autrement dit, deux matrices semblables ont le memepolynome caracteristque. Par consequent, si φ est un endomorphisme d’un espace vectoriel dedimension finie E, on definit le polynome caracteristique de φ comme etant le polynomecaracteristique d’une matrice representant φ.

EXERCICES

(eA.1) Soit f : R → R∗ la fonction definie par f(t) = 1t2 . Calculer f(R∗), f−1([12 , 1]), f−1(0).

(eA.2) Soient f : E → F une application.(i) Montrer que si A, A′ sont deux parties de E, alors f(A ∪ A′) = f(A) ∪ f(A′) et f(A ∩ A′) =

f(A) ∩ f(A′).(ii) Montrer que si B, B′ sont deux parties de F , alors f−1(B ∪B′) = f−1(B)∪ f−1(B′) et f−1(B ∩

B′) ⊆ f−1(B) ∩ f−1(B′).(iii) Montrer que si B est une partie de F , alors E − f−1(B) = f−1(F −B).

(eA.3) Detailler les exemples de (A.1.3).

(eA.4) Pour chacun des sous-ensembles de R ci-dessous, determiner s’il est majore, minore, borne.Determiner, le cas echeant, supE, inf E et si oui ou non E possede un maximum ou un minimum.

(i) [0, 1[, (ii) N, (iii) 12n | n ∈ N = 1, 1

2 , 122 ,

123 , . . ., (iv) f(R), f : R → R etant la fonction

t 7→ t1+t2 , (v) x ∈ R | |x− 1| < x, (vi)

⋃n∈N [ 1

22n+1 ,1

22n ].

72